FERRAMENTAS LINUX: A AMD publica o mais recente código Linux de mapeamento de memória de dispositivo coerente - projetado para fronteira

terça-feira, 17 de maio de 2022

A AMD publica o mais recente código Linux de mapeamento de memória de dispositivo coerente - projetado para fronteira

 

Confira !!

No ano passado, vimos vários patches postados por engenheiros da AMD com um esforço estadual em torno dos preparativos para o supercomputador Frontier. A maioria desses patches envolveu o manuseio de memória no Linux e o manuseio de memória de propósito especial entre a CPU/GPUs. Publicado na segunda-feira foi seu último trabalho sobre mapeamentos de memória de dispositivos coerentes para o kernel Linux.

Este "MEMORY_DEVICE_COHERENT" foi trabalhado pelos engenheiros da AMD para o esforço do supercomputador Frontier, mas pode ser relevante para outros supercomputadores futuros e o código também pode ser de interesse para outros fornecedores de hardware. Este último esforço é resumido como:

Esta série de patches apresenta MEMORY_DEVICE_COHERENT, um tipo de memória pertencente a um dispositivo que pode ser mapeado em tabelas de página de CPU como MEMORY_DEVICE_GENERIC e também pode ser migrado como MEMORY_DEVICE_PRIVATE.

...

A estabilidade e o desempenho do sistema não são afetados de acordo com nossos testes em andamento, incluindo xfstests.

Como funciona: O BIOS do sistema anuncia a memória do dispositivo GPU (também conhecido como VRAM) como SPM (memória de propósito especial) no mapa de endereços do sistema UEFI.

Nossos nós de teste no laboratório são semelhantes à configuração Frontier, com 0,5 TB de memória do sistema mais 256 GB de memória do dispositivo dividido em 4 GPUs, tudo em um único espaço de endereço coerente. Espera-se que a migração de página melhore significativamente a eficiência do aplicativo. Relataremos os resultados empíricos assim que estiverem disponíveis.

Consulte a série de patches MEMORY_DEVICE_COHERENT mais recente para obter mais detalhes técnicos, se estiver interessado.

Frontier é o supercomputador exascale que está sendo construído para o Oak Ridge National Laboatory e espera-se que atinja a capacidade total neste ano usando uma combinação de CPUs AMD EPYC 3rd Gen e GPUs AMD Instinct 250X. As interconexões coerentes entre as CPUs e GPUs com xGMI têm sido o que está vendo a maioria dos patches de suporte ao Linux que mencionam a Frontier para obter o suporte de software em ordem. A Frontier, uma vez totalmente operacional, deve fornecer desempenho computacional acima de 1,5 Exaflops.





Fonte

Até a próxima !!


Nenhum comentário:

Postar um comentário