HJ Lu continuou seu recente impulso de otimização de FMA para a GNU C Library otimizando expm1, a função para retornar um valor exponencial menos 1.
Embora a função expm1 possa não ser tão comum, testar novamente no Intel Skylake mostrou algumas melhorias interessantes. A melhoria média foi 24% melhor do que o comportamento Glibc anterior antes de introduzir este código otimizado Fused Multiply Add (FMA) para beneficiar as modernas CPUs Intel e AMD.
Este commit aterra o código e não é uma melhoria ruim para CPUs x86_64 com o próximo lançamento do Glibc. Ótimo como sempre para a Intel e suas contribuições incansáveis de código aberto para ajustar ainda mais o potencial de desempenho dos sistemas Linux x86_64.
Até a próxima !!
Nenhum comentário:
Postar um comentário