Confira !!
No ano passado, vimos vários patches postados por engenheiros da AMD com um esforço estadual em torno dos preparativos para o supercomputador Frontier. A maioria desses patches envolveu o manuseio de memória no Linux e o manuseio de memória de propósito especial entre a CPU/GPUs. Publicado na segunda-feira foi seu último trabalho sobre mapeamentos de memória de dispositivos coerentes para o kernel Linux.
Este "MEMORY_DEVICE_COHERENT" foi trabalhado pelos engenheiros da AMD para o esforço do supercomputador Frontier, mas pode ser relevante para outros supercomputadores futuros e o código também pode ser de interesse para outros fornecedores de hardware. Este último esforço é resumido como:
Esta série de patches apresenta MEMORY_DEVICE_COHERENT, um tipo de memória pertencente a um dispositivo que pode ser mapeado em tabelas de página de CPU como MEMORY_DEVICE_GENERIC e também pode ser migrado como MEMORY_DEVICE_PRIVATE.
...
A estabilidade e o desempenho do sistema não são afetados de acordo com nossos testes em andamento, incluindo xfstests.
Como funciona: O BIOS do sistema anuncia a memória do dispositivo GPU (também conhecido como VRAM) como SPM (memória de propósito especial) no mapa de endereços do sistema UEFI.
Nossos nós de teste no laboratório são semelhantes à configuração Frontier, com 0,5 TB de memória do sistema mais 256 GB de memória do dispositivo dividido em 4 GPUs, tudo em um único espaço de endereço coerente. Espera-se que a migração de página melhore significativamente a eficiência do aplicativo. Relataremos os resultados empíricos assim que estiverem disponíveis.
Consulte a série de patches MEMORY_DEVICE_COHERENT mais recente para obter mais detalhes técnicos, se estiver interessado.
Frontier é o supercomputador exascale que está sendo construído para o Oak Ridge National Laboatory e espera-se que atinja a capacidade total neste ano usando uma combinação de CPUs AMD EPYC 3rd Gen e GPUs AMD Instinct 250X. As interconexões coerentes entre as CPUs e GPUs com xGMI têm sido o que está vendo a maioria dos patches de suporte ao Linux que mencionam a Frontier para obter o suporte de software em ordem. A Frontier, uma vez totalmente operacional, deve fornecer desempenho computacional acima de 1,5 Exaflops.
Até a próxima !!
Nenhum comentário:
Postar um comentário