O avanço da inteligência artificial agêntica tem elevado a importância das CPUs nos data centers, segundo especialistas e dados de mercado. Enquanto o foco inicial residia na multiplicação de GPUs para gerar inferências, a demanda por processadores centrais robustos cresceu diante de arquiteturas que exigem coordenação contínua de tarefas e comunicação em múltiplas etapas.
Mudança na proporção CPU-GPU
No início da era generativa, cada servidor chegava a contar com quatro a oito GPUs para uma única CPU, uma estratégia adequada a cargas paralelas de inferência. Porém, sistemas “always-on” que realizam raciocínios sucessivos não toleram gargalos de orquestração. Jason Beckett, diretor de tecnologia da Hitachi Vantara para EMEA, afirma que esses ambientes demandam processadores com grande quantidade de núcleos trabalhando sem interrupção.
Estimativas da TrendForce apontam que as CPUs respondem por cerca de 91% da latência total em respostas de IA, evidenciando a limitação nos fluxos de chamadas a ferramentas, coordenação de tarefas e tomadas de decisão. A performance determinística em larga escala tornou-se requisito estrutural, e não mais apenas um diferencial.
AMD antecipa o crescimento
A AMD antecipou esse movimento ao revisar sua projeção de expansão para CPUs de data center de 18% para 35% ao ano. A companhia projeta que esse mercado atinja US$ 120 bilhões até 2030, impulsionado pelos hyperscalers que aumentam a razão de processadores por nó para otimizar orquestração, redes, memória e armazenamento em clusters de IA.
Roger Cummings, CEO da PEAK:AIO, destaca dois vetores principais: a evolução da IA agêntica e a necessidade de desempenho previsível em grande escala. Nesse cenário, os processadores EPYC ganham relevância pela alta contagem de núcleos e largura de banda de memória, fundamentais na sustentação de workloads complexos.
Alterações nos projetos de rack de IA
Especialistas como Hommer Zhao, fundador da OurPCB, observam que, embora a mídia continue exibindo “racks” lotados de GPUs, o hardware real combina múltiplas CPUs com numerosos canais de memória e, em alguns casos, refrigeração líquida unificada para CPUs e GPUs. Jeff Moore, da Aegis Cooling, reforça que esses processadores passaram a coordenar inferência, rede, armazenamento e orquestração de forma integrada.
Imagem: Imagem ilustrativa
Arm e silício próprio dos hyperscalers
A arquitetura Arm também se sobressai nesse movimento. Em 2025, a plataforma Neoverse embarcará mais de um bilhão de núcleos em hyperscalers, conforme Beckett. Exemplos concretos incluem AWS Graviton, Google Axion e Microsoft Cobalt, desenvolvidos para maximizar throughput, eficiência energética e integração com infraestruturas de rede e discos.
O próximo front da infraestrutura
Com o cenário de IA cada vez mais complexo, a disputa por CPUs de data center deixa de ser coadjuvante para se tornar um front estratégico. Embora a AMD EPYC ocupe posição de destaque, a diversificação entre silício de prateleira e chips personalizados pelos próprios provedores de nuvem ainda apresenta espaço para debate.
Com informações de Hardware
