A Intel lançou o oneDNN 3.4, a versão mais recente de sua biblioteca de redes neurais profundas, que faz parte da coleção de software oneAPI.
Essa biblioteca oferece primitivas de aprendizado profundo para diversos softwares, incluindo PyTorch, MXNet, ONNX Runtime, OpenVINO, MATLAB Deep Learning Toolbox e outros.
Aqui estão os destaques do oneDNN 3.4:
Desempenho Aprimorado:
Processadores Intel:
- Melhorias de desempenho para o Sapphire Rapids/Emerald Rapids.
- Melhorias de desempenho para os futuros processadores Xeon Scalable Sierra Forest e Granite Rapids.
Otimizações para o AVX2 e AVX-512.
- Aprimoramentos no Intel AMX para o MATMUL.
- Otimizações experimentais de CPU.
Processadores não Intel:
- Suporte para a construção com a macOS Accelerate Library para melhorar o desempenho no Apple Silicon.
Otimizações Gráficas:
- Gráficos Intel Xe2 (estreando com os processadores Lunar Lake):
- Melhor desempenho para a série de Data Center GPU Max.
- Melhor desempenho para o Arc Graphics (DG2/Alchemist).
Melhor desempenho MATMUL em GPUs Intel para LLMs e modelos semelhantes a transformadores.
- Melhor desempenho de convolução relevante para o Stable Diffusion.
- Aprimoramento do desempenho primitivo RNN (RNN primitive performance).
Outras Adições:
- Suporte para Intel Data Center GPU Max 1550VG.
- Opção de suporte para o modo determinístico (deterministic mode support).
- Controle de modo de acumulação (accumulation mode control).
Para obter mais detalhes e fazer o download do oneDNN 3.4, visite o repositório no GitHub.
Até a próxima !!
Nenhum comentário:
Postar um comentário