FERRAMENTAS LINUX: O Linux se prepara para servidores AMD com nós da GPU Aldebaran Sporting HBM2

quinta-feira, 1 de julho de 2021

O Linux se prepara para servidores AMD com nós da GPU Aldebaran Sporting HBM2




 Confira !!

Os últimos patches de código público na lista de discussão de hoje estão se preparando para novos servidores heterogêneos AMD que terão nós de GPU Aldebaran conectados via links xGMI à (s) CPU (s) e a GPU morre por sua vez com memória HBM2.

Esses novos detalhes do sistema AMD heterogêneo foram revelados hoje como parte de um conjunto de patches que preparam o código do driver do kernel AMD64 EDAC (Detecção e Correção de Erros) para nós sem CPU. O driver AMD64 EDAC é para tradicionalmente lidar com e corrigir erros de sistema DRAM ECC enquanto agora está sendo estendido para a memória do nó da GPU acessível a partir das CPUs através da interconexão de alta velocidade xGMI.

Os patches públicos observam que haverá sistemas com nós de GPU conectados via links xGMI e as matrizes de GPU têm memória HBM2. Os patches continuam a confirmar esses nós como sendo Aldebaran, o codinome para uma GPU / acelerador AMD CDNA de próxima geração que viu o suporte inicial ao driver do kernel no Linux 5.13 e continua vendo mais soluções de driver de código aberto para ele. Aldebaran é o sucessor aparente do MI100 "Arcturus" e, portanto, provavelmente vai estrear como algo nos moldes do AMD Instinct MI200.

Esses patches publicados há pouco tempo observam que Aldebaran tem duas matrizes (confirmando ainda mais Aldebaran como um design MCM) com cada uma tendo quatro controladores de memória unificados (UMCs). Cada controlador de memória unificado gerencia oito canais de memória, cada um conectado a 2 GB de memória HBM2 (ou HBM2E).

Os sete patches postados preparam o driver de memória EDAC para a noção de nós não-CPU conectados, reconhecendo o tipo de memória HBM Gen2, tradução de endereço no Data Fabric versão 3.5 e conexões relacionadas. Conseguir este suporte Linux em tempo hábil está sendo impulsionado pelo domínio do Linux no espaço HPC e especialmente com as crescentes vitórias de design de supercomputador da AMD. Mais notavelmente Aldebaran e, por sua vez, este código Linux é provavelmente o que veremos no supercomputador Frontier exascale, onde já foi mencionado que existe uma interconexão coerente entre as CPUs EPYC e as GPUs Radeon Instinct.

Dado o tempo desses patches com a janela de mesclagem do Kernel Linux 5.14 já aberta, essas adições amd64_edac provavelmente chegarão ao Kernel Linux 5.15, a menos que sejam retiradas por um longo processo de revisão.






Fonte

Até  a próxima !!

Nenhum comentário:

Postar um comentário