FERRAMENTAS LINUX: O OpenBLAS 0.3.25 está adicionando novas otimizações do AVX-512 para o Sapphire Rapids e muito mais

segunda-feira, 13 de novembro de 2023

O OpenBLAS 0.3.25 está adicionando novas otimizações do AVX-512 para o Sapphire Rapids e muito mais


Antes do evento Supercomputing SC23, a versão mais recente do OpenBLAS, uma biblioteca de subprogramas de álgebra linear básica (BLAS) de código aberto, foi lançada. 

A versão 0.3.25 do OpenBLAS apresenta melhorias para as CPUs Intel e AMD x86_64, além de uma série de aprimoramentos gerais e ajustes contínuos para outras arquiteturas como ARM64, POWER e LoongArch.

A versão 0.3.25 do OpenBLAS traz uma série de melhorias gerais para a biblioteca BLAS, corrige a construção com o compilador Cray CCE, faz o back-port de algumas alterações do próximo lançamento da biblioteca de referência LAPACK 3.12 e apresenta várias melhorias específicas da arquitetura para o Intel Sapphire Rapids e AMD EPYC Zen 4.

Para as CPUs Intel, otimizações AVX-512 foram adicionadas para o ?ASUM em processadores Sapphire Rapids e Cooper Lake. Para as CPUs AMD, há uma correção para a detecção automática em tempo de compilação dos processadores AMD Ryzen Zen 3 e Zen 4.

No lado ARM64, existem várias correções, bem como várias correções diferentes para IBM POWER. Além disso, o LoongArch de 64 bits adicionou kernels SGEMV e DTRSM otimizados.

Para mais detalhes sobre o lançamento do OpenBLAS 0.3.25 e downloads, visite o GitHub.






Fonte

Até a próxima !! 



Nenhum comentário:

Postar um comentário