Cisco: UCS X-Series: O Futuro da Computação – Parte 2 de 3

À medida que avançamos para a implantação em grande escala, acreditamos que a mensagem arquitetônica do UCS X-Series está ressoando extremamente bem, pois o feedback sobre a implantação foi fantástico.

Na primeira parte da postagem da série de blogs, discutimos como a computação heterogênea está causando uma mudança de paradigma na computação que molda a arquitetura UCS X-Series. Neste blog, discutiremos os aspectos eletromecânicos da arquitetura UCS X-Series.

O fator de forma permanece constante durante todo o ciclo de vida do produto, portanto, os aspectos eletromecânicos que moldam o design do gabinete são altamente críticos no estágio de design.

âncoras eletromecânicas

Algumas das âncoras são:

  1. Densidade de soquete por ‘RU’.

  2. densidade de memória

  3. Backplane menos IO

  4. opções de mezanino

  5. Espaço volumétrico para lógica.

  6. Pegada e entrega de energia

  7. Fluxo de ar (medido como CFM) para resfriamento

A densidade de soquete e memória é muito importante ao comparar produtos de diferentes fornecedores e geralmente é uma indicação de quão eficientemente a mecânica da plataforma foi projetada em um determinado envelope “RU”. A proporção do espaço volumétrico necessário para a integridade mecânica e lógica é outro critério importante. Esses critérios nos ajudaram a zerar a altura do chassi para 7RU, fornecendo mais espaço volumétrico disponível para lógica em comparação com o design “RU” semelhante na indústria.

A geração anterior de plataformas de computação contava com o Backplane para conectividade. UCS X-Series, não usa backplane, mas interconexões de E/S de conexão direta. À medida que a tecnologia de E/S avança, os nós de E/S e a interconexão podem ser atualizados sem problemas, pois os itens a serem alterados são modulares e não fixos no backplane. À medida que a velocidade da interconexão IO aumenta, seu alcance diminui, dificultando cada vez mais a escalabilidade no domínio elétrico. O UCS X-Series foi projetado com uma abordagem de conector híbrido que suporta E/S elétrica por padrão e é à prova de futuro para E/S óptica. Esta opção de E/S óptica é otimizada para conectividade no chassi. E/S de conexão direta sem backplane ajuda a reduzir a resistência ao fluxo de ar e ajuda a remover o calor da entrada para a saída com eficiência.

distribuição de poder

A densidade de potência do rack por “RU” está se aproximando de 1KW e em breve irá além. A maioria dos projetos de servidor existentes usa uma distribuição de 12 V bem estabelecida para simplificar a conversão descendente das voltagens da CPU. No entanto, à medida que a densidade de corrente aumenta, o uso de distribuição de 12 V aumentaria os custos do conector, a contagem de camadas de PCB e os desafios de roteamento. A UCS X-Series, vendo a necessidade da próxima geração de requisitos de energia do servidor, optou por usar uma distribuição de tensão mais alta de 54 V em vez de 12 V. A distribuição de tensão mais alta reduz a densidade de corrente em 4,5 vezes e as perdas ôhmicas em 20 vezes menos comparado a 12V. Passar da saída de 12 V para 54 V CC ajuda a simplificar o projeto da fonte de alimentação principal e torna a distribuição de energia integrada mais eficiente.

Consumo de energia do servidor

Estamos vendo o TDP da CPU (Thermal Design Power) aumentar em 75-100W em um nível de cadência de 2 anos. Os nós de computação logo começarão a ver 350 W por soquete e devem estar prontos para 500 W ou mais até 2024. Um servidor de 2 soquetes com GPU e armazenamento requer cerca de 2,2 KW de energia sem levar em conta as perdas de distribuição . Para resfriar este servidor de 2 soquetes, os módulos de ventoinhas consumirão cerca de 240W, 11% da potência total. Levando em conta as eficiências de distribuição em cada estágio intermediário de conversão da entrada CA, estamos olhando para um consumo de energia de cerca de 2,4KW. Portanto, em um servidor RACK com 20 servidores x 2RU, a potência do ventilador consumirá 4800W! Plataforma de blade modular como UCS X-Series com seu resfriamento centralizado e ventiladores maiores oferece CFM muito mais alto com menor consumo de energia. No entanto, o consumo de energia dos ventiladores está se tornando uma parte substancial do orçamento total de energia.

[Link]

Resfriamento

Avanços em semicondutores e magnetismo nos permitem fornecer mais potência ao longo da vida útil do chassi. No entanto, é difícil perceber uma melhoria drástica no fluxo de ar (medido como CFM do ventilador), pois os avanços tecnológicos são lentos e incrementais. Além disso, a economia de custos determina o uso de técnicas passivas de transferência de calor para resfriar a CPU no servidor. Isso torna a definição dos requisitos de CFM do ventilador para resfriamento de nós de computação um problema multivariável.

Ao contrário do design de rack padrão que usa posicionamento de CPU de núcleo distribuído, a série UCS X usa o princípio de design de núcleo oculto que complica ainda mais o resfriamento.

[Link]

Bancos de unidades de armazenamento U2/E3 classificados em mais de 25W cada e aceleradores na parte frontal da lâmina restringirão o ar que vai para a CPU e pré-aquecem o ar.

O design da série UCS X abordou esses desafios de forma abrangente. O primeiro e mais importante é o desenvolvimento do módulo de ventilador de próxima geração que oferece CFM líder de classe. O outro é o gerenciamento dinâmico de energia acoplado a um algoritmo de controle do ventilador que se adaptará e evoluirá à medida que a demanda de resfriamento aumentar e diminuir. Os nós de computação são projetados com caminhos CFM altos e baixos que canalizam o fluxo de ar adequado para resfriamento. Além disso, as opções de gerenciamento de energia fornecem botões configuráveis ​​pelo cliente para otimizar a potência do ventilador ou o modo de alto desempenho.

Surgimento de tecnologias alternativas de resfriamento

O resfriamento pontual de CPU/GPU a 350 W se aproxima dos limites do resfriamento a ar. Dobrar o fluxo de ar resulta em 30% mais resfriamento, mas adicionaria 6-8x mais potência do ventilador com desempenho decrescente.

Os data centers ainda não estão prontos para refrigeração líquida por atacado. O resfriamento por imersão requer uma revisão completa do RACK. Os hiperescaladores liderarão o ciclo de adoção inicial e, eventualmente, os clientes corporativos chegarão lá, mas o ponto de inflexão do resfriamento a ar para líquido ainda é desconhecido. O resfriamento a ar não está desaparecendo, pois ainda precisamos resfriar a memória, o armazenamento e outros componentes que são operacionalmente difíceis para o resfriamento líquido. Precisamos coletar mais dados e responder às seguintes perguntas críticas antes que o resfriamento líquido se torne atraente.

  • Nós realmente precisamos de refrigeração líquida para todos os RACKs ou apenas alguns RACKs que hospedam servidores com TDP alto?

  • O resfriamento líquido é mais útil para implantações greenfield como meio de reduzir a potência/acústica do ventilador do que habilitar CPU/GPUs com TDP alto?

  • Alguma conformidade/mandato que aponte para redução de energia para determinadas datas no data center?

  • Análise de TCO da economia de energia do ventilador versus custo total da implementação de refrigeração líquida?

  • O cliente pode gastar mais em resfriamento de ventilador do que em atualizações de infraestrutura para resfriamento líquido?

  • O resfriamento líquido ajudará a implantar servidores TDP mais altos sem atualizar a energia do RACK?

    • Por exemplo: 100W por 1U de economia de energia do ventilador se traduz em 3,6KW (36x 1U de servidor) de energia adicional disponível

No entanto, a série UCS X suporta um modelo híbrido: uma combinação de refrigeração a ar/líquido quando apenas a refrigeração a ar não é suficiente. Fique de olho para obter mais detalhes nos próximos blogs sobre resfriamento líquido no UCS X-Series.

No próximo blog, detalharemos as tendências que impulsionaram a arquitetura interna da série UCS X.

Recursos

UCS X-Series – Future of Computing Blog Series – Parte 1 de 3

Participação:

Leave a Comment