FERRAMENTAS LINUX: A Intel torna a sua biblioteca de aceleração Python NPU Open Source

domingo, 3 de março de 2024

A Intel torna a sua biblioteca de aceleração Python NPU Open Source

 


A Intel disponibilizou a sua Biblioteca de Aceleração NPU como código aberto, tornando-a acessível para desenvolvedores interessados em otimizar suas aplicações de Inteligência Artificial (IA). 

Essa biblioteca, conhecida como “intel-npu-acceleration-library”, é projetada para aproveitar o poder da Unidade de Processamento Neural (NPU) da Intel. Ela permite realizar cálculos de alta velocidade em hardware compatível com NPUs.

Aqui estão alguns detalhes importantes sobre a Biblioteca de Aceleração NPU:

Recursos Suportados:

  • Quantização de 8 bits: A biblioteca suporta quantização de 8 bits, o que é útil para otimizar o desempenho em tarefas de inferência.
  • Suporte Float16: O uso de ponto flutuante de 16 bits (Float16) é essencial para acelerar operações matemáticas.
  • Suporte torch.compile: Isso permite compilar modelos do PyTorch para o NPU.
  • Inferência de forma estática: A biblioteca oferece suporte à inferência de modelos com formas de entrada e saída estáticas.
  • Outros recursos: Além disso, há outros recursos disponíveis para facilitar o desenvolvimento e a otimização de modelos de IA.

Obtenção da Biblioteca:

  • A Biblioteca de Aceleração NPU pode ser baixada diretamente do GitHub ou instalada via PIP.

No GitHub, você encontrará exemplos de código Python que demonstram como realizar uma multiplicação de matriz no NPU, compilar modelos específicos para o NPU e executar um modelo chamado Tiny-Llama no NPU.

Essa biblioteca é uma ferramenta valiosa para desenvolvedores que trabalham com IA e desejam aproveitar ao máximo os NPUs da Intel. À medida que os NPUs continuam a evoluir, essa biblioteca se tornará ainda mais relevante na era da inteligência artificial





Fonte 

Até a próxima !!

Nenhum comentário:

Postar um comentário