Confira !!
Além dos engenheiros da AMD estarem ocupados trabalhando no suporte gráfico RDNA3 para sua pilha de drivers gráficos Linux de código aberto, ao mesmo tempo eles também estão trabalhando para habilitar o GFX940 como sua parte CDNA de última geração, presumivelmente para lançar como o AMD Instinct MI300 se as tradições se mantiverem .
Desde março, temos visto a AMD publicar vários patches do GFX940 no LLVM para o back-end do compilador de sombreador AMDGPU e, com sua abordagem bloco a bloco, fazer o upstream de vários elementos da parte CDNA de última geração no kernel Linux upstream para o AMDGPU driver do núcleo.
Já vimos alguns elementos interessantes para o acelerador de última geração, como o WMMA, para operações de multiplicação e acumulação de matrizes de precisão mista para os núcleos de matriz de GPU. Novas instruções atômicas de ponto flutuante também foram adicionadas.
Combinadas ontem para o LLVM Git estão as instruções nativas do FP8 sendo introduzidas com o GFX940. Este acelerador profissional de última geração está trazendo instruções nativas de FP8 e BF8 para a GPU para ajudar no desempenho de IA / rede neural.
A arquitetura GH100 Hopper da NVIDIA também possui suporte a ponto flutuante FP8 de oito bits e, da mesma forma, o novo Habana Labs Gaudi2 da Intel possui suporte ao formato FP8 nativo. O FP8 para o Instinct MI300 foi divulgado anteriormente, mas agora praticamente resumido ao ver as instruções do FP8 chegarem ao back-end AMDGPU LLVM. O FP8 se tornará mais importante para as cargas de trabalho de IA no futuro.
Até agora, esses três commits começaram a canalizar o suporte à instrução FP8 no back-end do compilador de sombreador AMDGPU e preparar o suporte à conversão de outros formatos.
Este trabalho do GFX940 está acontecendo no LLVM Git para o LLVM 15.0 que será lançado como estável em setembro, enquanto o congelamento/ramificação de recursos começa na próxima semana.
Até a próxima !!
Nenhum comentário:
Postar um comentário