FERRAMENTAS LINUX: A Intel contribui com as otimizações do AVX-512 para Numpy, produz acelerações massivas

quarta-feira, 13 de outubro de 2021

A Intel contribui com as otimizações do AVX-512 para Numpy, produz acelerações massivas


 Confira !!

A Intel contribuiu com otimizações AVX-512 para o Numpy upstream. Para aqueles que usam Numpy como a biblioteca Python líder para computação numérica, as CPUs Intel mais novas com os recursos do AVX-512 podem desfrutar de grandes acelerações na faixa de 14 a 32x mais rápido.

Neste verão, a Intel lançou seu código AVX-512 inicial para Numpy e, finalmente, esta semana o código foi mesclado upstream. Este código AVX-512 de código-fonte aberto se origina da Intel Short Vector Math Library (SVML), da qual eles abriram o código. A Intel também tem trabalhado para permitir que o Numpy seja construído com base no SVML como uma melhoria separada.

A implementação inicial do AVX-512 fornece versões otimizadas de 44 funções matemáticas - praticamente todas as principais funções matemáticas e nos modos de precisão simples e dupla ( atualização: parece que a versão mesclada do trabalho tem versões otimizadas do AVX-512 para 18 funções matemáticas, abaixo das 44 originais, examinando a diferença ou outras solicitações de mesclagem pendentes).

Os engenheiros da Intel descobriram que mesmo com processadores Intel Skylake X mais antigos, isso significava que o Numpy estava sendo executado até 55x mais rápido em funções selecionadas. A aceleração média foi de 14x para precisão dupla e 32x para desempenho de precisão simples.

Esta excitante adição ao Numpy pode ser encontrada através deste commit antes de seu próximo lançamento.






Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário