FERRAMENTAS LINUX: O Facebook ainda está perseguindo o "NetGPU" - trabalhando no suporte de GPU da AMD além da NVIDIA

domingo, 30 de agosto de 2020

O Facebook ainda está perseguindo o "NetGPU" - trabalhando no suporte de GPU da AMD além da NVIDIA



Confira !!

Foram os patches recentes do Facebook para a implementação do NetGPU que, com um dos patches focados na NVIDIA, levaram à recente controvérsia em torno dos "preservativos GPL" no kernel e, por fim, levando a novas proteções com o Kernel Linux 5.9 . Esse código NetGPU ainda está sendo trabalhado pelo Facebook com esperanças de upstream, mas agora, além do suporte ao driver NVIDIA, eles também estão trabalhando no suporte à GPU AMD com o driver de código aberto.

O NetGPU como um lembrete é o código de trabalho em andamento do Facebook para oferecer suporte a transferências DMA de cópia zero entre o adaptador de rede e o processador gráfico. Esta alternativa RDMA ainda leva ao processamento de protocolo na CPU host, mas permitiria um processamento de dados muito mais rápido na GPU, graças ao acesso direto à memória de cópia zero entre a NIC e a GPU. O Facebook está procurando usar o NetGPU para seus clusters de aprendizado de máquina com planos de usar NICs e GPUs de 200 Gbps anexados a um switch PCI Express. A CPU sozinha não consegue lidar com o tráfego do conjunto de dados para suas intensas cargas de trabalho de aprendizado de máquina, mas o NetGPU deve tornar seu projeto viável.

O próprio NetGPU é bastante interessante e, com sorte, chegará ao kernel Linux principal. É que a dependência do driver proprietário da NVIDIA para uso da GPU com os patches propostos anteriormente e o shim do driver é o que causou polêmica.

A boa notícia é que o suporte de GPU da AMD para NetGPU é um trabalho em andamento. Infelizmente, a pilha Radeon Open Compute (ROCm) em sua forma atual não é suficiente. Algumas mudanças no código ROCm estão sendo analisadas devido ao suporte DMA-BUF não estar sendo exposto por seu driver thunk.

Ter o suporte de GPU AMD trabalhando em uma pilha de computação de código aberto também eliminará um obstáculo para o NetGPU obter revisão e aprovação de outros desenvolvedores de kernel upstream, em vez de depender do driver proprietário da NVIDIA.


Mais detalhes sobre o NetGPU por meio deste conjunto de slides do engenheiro do Facebook Jonathan Lemon.

Fonte

Até a próxima !!

Nenhum comentário:

Postar um comentário