Uma nova versão do OpenBLAS já está disponível, a implementação de código aberto BLAS e LAPACK conhecida por sua ampla variedade de otimizações de processador.
O OpenBLAS 0.3.22 foi lançado esta semana e fornece as mais recentes otimizações de CPU, correções de compilação e outros novos recursos. Os destaques do OpenBLAS 0.3.22 são:
- Suporte inicial para processamento com o conversor EmScripten JavaScript, embora apenas uma compilação de thread único por enquanto.
- Várias alterações de ajuste/limiar multi-threaded.
- Detecção automática para as CPUs Intel Raptor Lake.
- Compilação corrigida para processadores AMD Zen 4, como as séries Ryzen 7000 e EPYC 9004.
- Várias otimizações de kernel x86_64 e outras melhorias.
- Detecção automática de CPU Armv8 para processadores Cortex X3 e Cortex A715.
- Desempenho GEMM aprimorado para núcleos Arm Neoverse V1.
- Atualização do LAPACK incluído em relação à versão de referência v3.11, juntamente com várias correções e melhorias pós-lançamento.
Corrigir o suporte ao AMD Zen 4 e adicionar o suporte ao Intel Raptor Lake sozinho será do interesse de muitos usuários.
Os downloads e mais detalhes sobre esta versão do OpenBLAS 0.3.22 via GitHub .
Até a próxima !!
Nenhum comentário:
Postar um comentário