segunda-feira, 15 de junho de 2020
O lançamento do OpenBLAS 0.3.10 chega com o suporte inicial ao BFloat16, otimizações x86_64
Confira !!
Uma nova versão do recurso está disponível para esta importante biblioteca de álgebra linear BLAS de código aberto.
Com o lançamento deste domingo do OpenBLAS 0.3.10, há suporte inicial ao BFloat16 (BF16) e implementação inicial no SHGEMM, importou várias correções de bugs do LAPACK, melhorias no bloqueio de encadeamentos, uma API para definir a afinidade do encadeamento no Linux via OpenBLAS, melhorias no sistema de compilação do CMake, suporte para processadores MIPS 24K / 24KE baseados em kernels P5600, kernel SGEMM otimizado para Cortex-A53, desempenho ThunderX2 aprimorado, várias melhorias de desempenho para CPUs x86_64 recentes, correções AVX-512 e outras correções, além de várias otimizações.
De nossa perspectiva, o mais empolgante é o suporte inicial ao BFloat16, dado que os processadores Intel e Arm estão chegando ao mercado com o suporte a esse formato de ponto flutuante de meia precisão, bem como às otimizações x86_64. O BFloat16 é importante para aprendizado de máquina / IA e estamos antecipando mais suporte ao OpenBLAS BF16 no futuro. Com as otimizações do x86_64, há melhor desempenho do DGEMM no Skylake-X, melhor desempenho do STRSM para o Haswell / Skylake X / Ryzen e outras correções / melhorias.
A lista completa do OpenBLAS 0.3.10 é alterada através do GitHub do projeto .
Fonte
Até a próxima !!
Marcadores: Linux, Android, Segurança
Notícia. Programação
Assinar:
Postar comentários (Atom)
Nenhum comentário:
Postar um comentário