Antes do evento Supercomputing SC23, a versão mais recente do OpenBLAS, uma biblioteca de subprogramas de álgebra linear básica (BLAS) de código aberto, foi lançada.
A versão 0.3.25 do OpenBLAS apresenta melhorias para as CPUs Intel e AMD x86_64, além de uma série de aprimoramentos gerais e ajustes contínuos para outras arquiteturas como ARM64, POWER e LoongArch.
A versão 0.3.25 do OpenBLAS traz uma série de melhorias gerais para a biblioteca BLAS, corrige a construção com o compilador Cray CCE, faz o back-port de algumas alterações do próximo lançamento da biblioteca de referência LAPACK 3.12 e apresenta várias melhorias específicas da arquitetura para o Intel Sapphire Rapids e AMD EPYC Zen 4.
Para as CPUs Intel, otimizações AVX-512 foram adicionadas para o ?ASUM em processadores Sapphire Rapids e Cooper Lake. Para as CPUs AMD, há uma correção para a detecção automática em tempo de compilação dos processadores AMD Ryzen Zen 3 e Zen 4.
No lado ARM64, existem várias correções, bem como várias correções diferentes para IBM POWER. Além disso, o LoongArch de 64 bits adicionou kernels SGEMV e DTRSM otimizados.
Para mais detalhes sobre o lançamento do OpenBLAS 0.3.25 e downloads, visite o GitHub.
Até a próxima !!
Nenhum comentário:
Postar um comentário