Networking pode ser o próximo grande jogo da NVIDIA

Desde que o CEO da NVIDIA, Jensen Huang, levou a empresa do mercado de processamento gráfico relativamente obscuro para um player importante em infraestrutura de nuvem e inteligência artificial (IA), ele foi reconhecido como um gênio. E na conferência GTC da semana passada, Huang flexionou seu conhecimento de engenharia e revelou um plano para o domínio total da nuvem.

“A computação está se reinventando enquanto falamos”, disse Huang em uma sessão de perguntas e respostas com analistas do setor. “IA e ML estão mudando fundamentalmente a maneira como você escreve software [machine learning]. Os data centers estão se tornando fábricas de IA com exponencialmente mais dados e inteligência.”

Na GTC, a NVIDIA anunciou uma impressionante nova linha de chips, software e produtos de rede projetados para promover sua missão como provedora de infraestrutura em nuvem. Isso incluiu a apresentação da NVIDIA para investidores, que mapeou um mercado endereçável total de US$ 1 trilhão (TAM) com produtos de software e hardware em mercados como IA, automação de negócios e veículos autônomos (veja o gráfico abaixo).

Embora as ambições de US$ 300 bilhões em novos TAM para tecnologias automotivas, US$ 150 bilhões em TAM para seu software de IA e US$ 150 em TAM para sua linha de software Omniverse AI sejam impressionantes, uma coisa que fica fora do radar pode ser as novas ambições. da NVIDIA em redes. Se eu fosse a Arista Networks, Cisco Systems ou Juniper Networks, estaria prestando muita atenção nisso. Vamos mergulhar e explorar.

Por que a rede e a DPU são fundamentais

Huang e NVIDIA são únicos em sempre adotar uma abordagem de engenharia profunda e cuidadosa para novos mercados. Ao entrar no mercado de IA com seu chip GPU, que antes era usado para processamento gráfico, a NVIDIA aproveitou as mudanças nas necessidades da arquitetura do chip. Ele se concentrou em fornecer interconexões rápidas e uma arquitetura de software que permitia que muitas GPUs fossem unidas em um data center para processamento poderoso de IA e ML.

Agora está fazendo a mesma coisa em rede. Um dos principais novos produtos da NVIDIA é sua unidade de processamento de dados BlueField-2 (DPU), tecnologia adquirida quando comprou a Mellanox por US$ 7 bilhões em 2019.

Em sua aquisição e desenvolvimento do BlueField DPU, a NVIDIA observou mudanças nas necessidades dos data centers. Com um aumento maciço nas conexões de rede leste-oeste entre os servidores, bem como o aumento da demanda relacionada à segurança cibernética e cálculos de criptografia, os servidores podem ficar sobrecarregados com o processamento da rede. Uma resposta foi colocar um poderoso chip DPU nas placas de rede para descarregar esse processamento.

O mercado de DPU não é necessariamente novo, apenas as crescentes demandas de segurança e rede estão tornando-o mais visível agora. As DPUs são uma consequência das SmartNICs (placas de interface de rede inteligentes), que existem há anos. E a NVIDIA não é a única a notar a crescente popularidade dos DPUs: a Amazon desenvolveu seu próprio DPU para seus data centers, e startups como Thinking e Fungible estão atacando o problema. Outro fabricante de SmartNIC, Napatech, também possui tecnologia que pode ser usada para DPUs.

As DPUs são dedicadas a funções de rede e segurança. Embora as DPUs fossem inicialmente consideradas excêntricas e caras, elevando o custo das placas de rede, muitos arquitetos de data centers perceberam que elas também poderiam oferecer um retorno sobre o investimento (ROI). Ao tirar a pressão das CPUs dos servidores, era possível que um data center pudesse reduzir a necessidade de novos servidores transferindo mais carga para uma DPU.

Há outras economias potenciais em uma abordagem que usa DPU. Por exemplo, se você colocar um sistema de rede definido por software (SDN) na DPU, poderá construir um sistema de rede inteiro construído diretamente na NIC. Esta é uma abordagem que a NVIDIA está adotando em parceria com a Pluribus Networks. As duas empresas anunciaram uma integração de DPU com o sistema operacional de rede Pluribus NetVisor (NOS) há várias semanas.

Rede e segurança integradas

A Pluribus Networking está obviamente empolgada com a parceria com a NVIDIA, observando que seu software de rede pode ser usado para construir redes com ou sem DPU. Mas a empresa diz que há muitos benefícios operacionais e de capital para executar um NOS baseado em software ao lado de um DPU. Nesse modelo de arquitetura, os arquitetos de rede podem criar SDN com criptografia totalmente segura em qualquer data center. Usando o Pluribus NOS, as redes podem ser configuradas em servidores com DPUs ou com switches de rede tradicionais sem DPUs. No caso de usar uma DPU, economias adicionais podem ser obtidas com a implementação de recursos de segurança, incluindo criptografia IPsec e firewall.

A poderosa combinação de DPU e rede baseada em software pode dar à NVIDIA uma vantagem no mercado de rede. Agora você tem todos os componentes para fornecer rede, segurança e processamento em um pacote. Também vem aumentando seu próprio portfólio de hardware de rede, incluindo uma nova linha de switches de data center. Seu novo switch Ethernet Spectrum-4 fornece 51 terabytes de taxa de transferência e 12,8 terabits por segundo de criptografia de taxa de linha. A NVIDIA também reivindica 40% em economia de energia.

Em outras palavras, a NVIDIA agora tem um portfólio completo de soluções de rede de alto desempenho: switches de data center de alto desempenho, malha de rede definida por software (com Pluribus e outros parceiros) e seu próprio DPU.

A NVIDIA vem trabalhando em rede há algum tempo, principalmente por meio da aquisição da Mellanox e do provedor SDN Cumulus Networks. Sin embargo, los nuevos productos de red, la evolución de la DPU BlueField y la nueva asociación con Pluribus muestran que NVIDIA ha estado pensando estratégicamente en este mercado y ha puesto una gran cantidad de recursos de ingeniería en la construcción de redes y DPU de alto Desempenho.

Essa história de networking não passará muito tempo fora do radar. O próprio Huang reconheceu na ligação com analistas que eles minimizaram a história das redes no GTC da semana passada, mas se concentrariam mais nisso nos próximos meses. Cuidado com este espaço!

Leave a Comment