FERRAMENTAS LINUX: O OpenBLAS 0.3.18 foi lançado com o suporte ao LoongArch64, mais otimizações

segunda-feira, 4 de outubro de 2021

O OpenBLAS 0.3.18 foi lançado com o suporte ao LoongArch64, mais otimizações

 


Confira !!

O OpenBLAS 0.3.18foi lançado ontem como a atualização de recurso mais recente para esta implementação BLAS de código aberto amplamente usada.

OpenBLAS 0.3.18 traz uma grande variedade de melhorias e correções, alguns dos destaques incluem:

- O suporte para LoongArch (LoongArch64) como a nova arquitetura de CPU baseada em MIPS da Loongson.

- Os kernels Intel Skylake XS / DGEMM para pequenos tamanhos de problema.

- SBGEMM otimizado para processadores Intel Cooper Lake.

- O suporte para detecção de contagem de thread / núcleo de CPU em tempo de execução no Haiku OS.

- Melhor desempenho para DASUM no IBM POWER10.

- Correções de falhas para Apple M1 no macOS.

- Corrigida construção sob BSDs em MIPS / MIPS64.

- OpenBLAS em tempo de execução ao exceder o número definido de tempo de construção de threads pré-configurados, uma estrutura de controle auxiliar será alocada com até 512 threads adicionais. O comportamento atual / anterior do OpenBLAS estava abortando ao exceder a contagem de threads pré-configurada.

Os downloads e mais detalhes sobre OpenBLAS 0.3.18 no GitHub .







Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário