Confira !!
O OpenBLAS 0.3.18foi lançado ontem como a atualização de recurso mais recente para esta implementação BLAS de código aberto amplamente usada.
OpenBLAS 0.3.18 traz uma grande variedade de melhorias e correções, alguns dos destaques incluem:
- O suporte para LoongArch (LoongArch64) como a nova arquitetura de CPU baseada em MIPS da Loongson.
- Os kernels Intel Skylake XS / DGEMM para pequenos tamanhos de problema.
- SBGEMM otimizado para processadores Intel Cooper Lake.
- O suporte para detecção de contagem de thread / núcleo de CPU em tempo de execução no Haiku OS.
- Melhor desempenho para DASUM no IBM POWER10.
- Correções de falhas para Apple M1 no macOS.
- Corrigida construção sob BSDs em MIPS / MIPS64.
- OpenBLAS em tempo de execução ao exceder o número definido de tempo de construção de threads pré-configurados, uma estrutura de controle auxiliar será alocada com até 512 threads adicionais. O comportamento atual / anterior do OpenBLAS estava abortando ao exceder a contagem de threads pré-configurada.
Os downloads e mais detalhes sobre OpenBLAS 0.3.18 no GitHub .
Até a próxima !!
Nenhum comentário:
Postar um comentário