O especialista em compiladores GCC, Jan Hubicka, da SUSE, começou a trabalhar nos patches de ajuste do compilador AMD Zen 4 que começaram a chegar em dezembro para o compilador GCC 13, que estreará como estável em alguns meses. Parece que o trabalho não acabou no ajuste do Znver4 com outro patch sendo enviado hoje para ajustar a microarquitetura de CPU AMD mais recente.
Nas últimas semanas, Hubicka tem mexido com o novo alvo " znver4 " no GCC 13. Hoje ele enviou mais znver4 x86-tune flags com a intenção de fazer mais algumas micro-otimizações para este -march=znver4 visando a série AMD Ryzen 7000 e processadores da série EPYC 9004.
Hubicka resume o trabalho mais recente como:
este patch adiciona mais músicas para zen4:
- novas músicas para instruções de scater avx512. Em micro benchmarks, isso parece uma perda consistente em comparação com coe de código aberto
- desabilitar o uso de coleta para zen4. Embora sejam ganhos para micro benchmarks (baseados em TSVC), habilitar a coleta é uma perda para parest. Então, por enquanto, parece seguro mantê-lo desligado.
- desabilite a passagem para evitar cadeias de FMA para znver4, pois o fmadd foi otimizado e não parece causar regressões.
Depois que esse trabalho de ajuste do compilador se estabelecer para o GCC, executarei alguns novos benchmarks - especialmente para ver como ele se compara ao compilador AOCC 4.0 da AMD . A versão estável do GCC 13.1 deve sair em março ~ abril, dependendo de como o restante do ciclo de lançamento se desenrola. O Fedora 38 está planejando estar entre as primeiras distribuições Linux a enviar este novo compilador, embora não chegue a usuários como o Ubuntu pronto para uso até outubro com o lançamento 23.10 da distribuição.
Nenhum comentário:
Postar um comentário