Apresentamos o OpenBLAS 0.3.27, a versão mais recente desta biblioteca de subprogramas de álgebra linear básica (BLAS) de código aberto que está revolucionando o campo.
Novidades na versão 0.3.27
Esta versão traz suporte inicial para a arquitetura C-SKY, limita o número máximo de threads para GEMM / GETRF / POTRF para evitar threads subutilizados/ociosos e oferece melhor desempenho de POTRF multithread para todas as plataformas. Além disso, apresenta vários outros aprimoramentos de threads multithread, gerenciamento mais rápido de threads OpenMP e muitos outros aprimoramentos comuns para esta excelente biblioteca BLAS.
Melhorias para CPUs Intel Xeon e AMD EPYC
O OpenBLAS 0.3.27 traz mudanças significativas tanto para AMD quanto para Intel. Inclui uma série de correções x86_64, incluindo a correção de opções do compilador LLVM para Intel Sapphire Rapids e melhorias de substitutos para Sapphire Rapids. Do lado da AMD, há desempenho GEMM aprimorado para alvos AMD Zen.
Suporte expandido
Além do trabalho x86_64 e C-SKY, a nova versão do OpenBLAS possui ajustes adicionais de ARM, incluindo suporte inicial para os núcleos do processador Cortex-A76 e suporte Neoverse-V2 nas compilações DYNAMIC_ARCH. IBM POWER também possui otimizações de desempenho DGEMM e SGEMM, suporte de CPU X280 no espaço RISC-V, várias otimizações LoongArch de 64 bits, algumas correções MIPS e muito mais.
Descubra mais
Este é um lançamento bastante grande para a biblioteca OpenBLAS.
Para downloads e a lista completa de alterações do OpenBLAS 0.3.27, visite nosso repositório no GitHub.
Até a próxima !!
Nenhum comentário:
Postar um comentário