FERRAMENTAS LINUX: O OpenBLAS 0.3.8 traz os mais núcleos AVX2 / AVX512, e outras otimizações

segunda-feira, 10 de fevereiro de 2020

O OpenBLAS 0.3.8 traz os mais núcleos AVX2 / AVX512, e outras otimizações






Confira !!


Para aqueles que usam o OpenBLAS como sua implementação do BLAS (Subprogramas de Álgebra Linear Básica), o OpenBLAS 0.3.8 foi lançado neste fim de semana e vem com mais kernels AVX2 / AVX-512 e outras otimizações.

O OpenBLAS continua se esforçando para competir com o MKL da Intel e outras implementações otimizadas do BLAS, e com mais AVX2 e AVX-512 deve ajudar no desempenho dos mais recentes processadores Intel e AMD. Agora existe um kernel AVX-512 DGEMM, o kernel AVX-512 SGEMM foi "significativamente" aprimorado e os novos kernels otimizados para AVX-512 para CGEMM e ZGEMM. Na frente do AVX2, os kernels para STRMM, SGEMM e CGEMM foram significativamente acelerados, juntamente com os novos kernels para CGEMM3M e ZGEMM3M.

O OpenBLAS 0.3.8 também adiciona suporte à detecção de CPU virtual QEMU, detecção automática de CPU Intel Goldmont Plus, otimizações de desempenho do ARMv8, várias otimizações de POWER, o LAPACK 3.9.0 agora está integrado, melhorias no sistema de compilação do CMake e outras otimizações gerais. Também há suporte para o compilador GCC 10 e aprimora a compilação com as versões g95 e não GNU do vinculador LD. Completando o lançamento está o suporte oficial do NetBSD.

Mais detalhes sobre o lançamento do OpenBLAS 0.3.8 via GitHub


Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário