Confira !!
O OpenBLAS como a popular implementação BLAS / LAPACK de alto desempenho de código aberto teve um novo lançamento com mais trabalho específico de CPU / arquitetura, bem como algumas novas otimizações comuns.
O OpenBLAS 0.3.16 foi lançado no domingo e com este lançamento algumas das mudanças incluem:
- Foi adicionada detecção de tipo de CPU para Intel Ice Lake SP enquanto a detecção de Tiger Lake foi corrigida ..
- A detecção de tipo de CPU também está em vigor para Centaur / mais recente CPUs Zhaoxin.
- As CPUs AVX-512 devem ter melhor desempenho SGEMV_N e SGEMV_T para casos de tamanhos N pequenos.
- As melhorias de desempenho em torno de xGER, xSPR, xSPR2, xSYR, xSYR2, xTRSV, SGEMV_N e DGEMV_N para tamanhos de entrada pequenos e argumentos consecutivos.
- Melhorias de desempenho para xGETRF, xPORTF e xPOTRI para tamanhos de entrada pequenos.
-O suporte inicial para Arm Cortex-A55.
- Corrigida a construção de OpenBLAS para o Apple M1 ao usar GCC / GFortran.
Os downloads e mais detalhes sobre todas as alterações do OpenBLAS 0.3.16 via GitHub .
Até a próxima !!
Nenhum comentário:
Postar um comentário