A biblioteca de rede neural profunda oneAPI da Intel "oneDNN" está se preparando para embarcar em seu lançamento v3.0 que melhora o desempenho não apenas para o hardware Intel atual e futuro, mas também promove o suporte da NVIDIA e AMD.
Intel oneDNN é a biblioteca oneAPI para ajudar na criação de aplicativos de aprendizado profundo otimizados para CPUs/GPUs/XPUs. Na tarde de sexta-feira, os engenheiros da Intel emitiram o candidato a lançamento para o próximo oneDNN 3.0.
O Intel oneDNN 3.0 está trazendo mais otimizações de desempenho para processadores "Sapphire Rapids" escaláveis de 4ª geração Xeon, além de várias otimizações Sapphire Rapids introduzidas em versões anteriores da série 2.x. Há também suporte FP16 e otimizações iniciais sendo feitas com oneDNN 3.0 para Intel Xeon Scalable Granite Rapids.
Além das otimizações de CPU Intel, o oneDNN 3.0 traz melhorias de desempenho para Intel Data Center GPU Max Series "Ponte Vecchio" e melhor desempenho para Intel Arc Graphics e Intel Data Center GPU Flex Series.
A biblioteca oneDNN tem suportado Arm de 64 bits por algum tempo, enquanto com a versão oneDNN 3.0 há desempenho AArch64 aprimorado para CPUs com Scalable Vector Extensions (SVE), várias otimizações SVE 512 e desempenho FP16 aprimorado ao usar a Arm Compute Library.
Também vendo algum amor com oneDNN 3.0 é melhor desempenho INT8 GEMM em hardware IBM Power de 64 bits. A versão do oneDNN 3.0 também está trazendo melhorias sobre o suporte de GPU NVIDIA e AMD existente.
Além das otimizações de desempenho de GPU/GPU, a versão oneDNN 3.0 também apresenta um novo esquema de quantização, suporte experimental à Graph API, suporte para Intel DPC++/C++ Compiler 2023 e outras melhorias. Com o marco v3.0 também vem a remoção de APIs oneDNN obsoletas anteriormente.
Os downloads e mais detalhes sobre o novo candidato a lançamento do Intel oneDNN 3.0 podem ser encontrados no GitHub .
Até a próxima !!
Nenhum comentário:
Postar um comentário