FERRAMENTAS LINUX: O OpenBLAS 0.3.16 traz várias correções de CPU, mais otimizações

segunda-feira, 12 de julho de 2021

O OpenBLAS 0.3.16 traz várias correções de CPU, mais otimizações

 


Confira !!

O OpenBLAS como a popular implementação BLAS / LAPACK de alto desempenho de código aberto teve um novo lançamento com mais trabalho específico de CPU / arquitetura, bem como algumas novas otimizações comuns.

O OpenBLAS 0.3.16 foi lançado no domingo e com este lançamento algumas das mudanças incluem:

- Foi adicionada detecção de tipo de CPU para Intel Ice Lake SP enquanto a detecção de Tiger Lake foi corrigida ..

- A detecção de tipo de CPU também está em vigor para Centaur / mais recente CPUs Zhaoxin.

- As CPUs AVX-512 devem ter melhor desempenho SGEMV_N e SGEMV_T para casos de tamanhos N pequenos.

- As melhorias de desempenho em torno de xGER, xSPR, xSPR2, xSYR, xSYR2, xTRSV, SGEMV_N e DGEMV_N para tamanhos de entrada pequenos e argumentos consecutivos.

- Melhorias de desempenho para xGETRF, xPORTF e xPOTRI para tamanhos de entrada pequenos.

-O suporte inicial para Arm Cortex-A55.

- Corrigida a construção de OpenBLAS para o Apple M1 ao usar GCC / GFortran.

Os downloads e mais detalhes sobre todas as alterações do OpenBLAS 0.3.16 via GitHub .






Fonte

Até a próxima !!


Nenhum comentário:

Postar um comentário