FERRAMENTAS LINUX: O Suporte para o Gaudi NIC do Habana Labs está em desenvolvimento para kernel Linux

segunda-feira, 14 de setembro de 2020

O Suporte para o Gaudi NIC do Habana Labs está em desenvolvimento para kernel Linux



Confira !!



A startup de IA de propriedade da Intel, Habana Labs, está trabalhando na expansão de seu suporte a "Gaudi" para incluir agora a interface de rede NIC encontrada neste hardware acelerador de treinamento de IA.

De volta ao Kernel Linux 5.8, havia o  suporte ao Gaudi que foi adicionado ao driver do acelerador do Habana Labs. Anteriormente, o driver Linux de código aberto do Hababa Labs suportava apenas seu acelerador de inferência Goya AI, mas agora com a versão mais recente do kernel Linux estável, há suporte para o acelerador de treinamento Gaudi AI.

No entanto, uma peça importante que faltava com o suporte de driver atual era a falta de suporte de NIC para expansão na conexão de vários aceleradores. Mas agora em forma de patch há suporte para Gaudi NIC e pode ser utilizado para Linux 5.10.

Os 15 patches permitem que o suporte NIC lide com a interconexão de scale-out para treinamento de aprendizado profundo distribuído. Até "dezenas de milhares" de aceleradores de Gaudi podem ser conectados usando RDMA sobre Ethernet convergente para este treinamento de aprendizado profundo distribuído.

O mantenedor do driver upstream Oded Gabbay, da Habana Labs, explicou: "Cada GAUDI expõe portas 10x100GbE que são projetadas para expandir a comunicação entre GAUDI integrando um mecanismo de comunicação completo no chip. Essa integração nativa permite que os usuários usem a mesma tecnologia de dimensionamento, tanto dentro do servidor quanto no rack (denominado scale-up), bem como para o dimensionamento entre racks (scale-out). Os racks podem ser conectados diretamente entre os processadores GAUDI ou por meio de qualquer número de switches Ethernet padrão. O driver expõe as portas NIC ao usuário como portas Ethernet padrão, registrando cada porta no subsistema de rede. Isso permite que o usuário gerencie as portas com ferramentas padrão, como ifconfig, ethtool, etc. Também nos permite conectar à pilha de rede do Linux e, assim, suportar protocolos de rede padrão, como IPv4, IPv6, TCP, etc. Além disso,"

É ótimo ver todo o trabalho de suporte de código aberto do Habana Labs continuar.

Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário