Confira !!
Os engenheiros da NVIDIA têm trabalhado em métricas de distância NUMA dentro do kernel Linux para substituir a interface de preferência NUMA local/remoto simples atualmente usada por alguns drivers para alocações de memória com reconhecimento de NUMA. Em seus testes, essa manipulação de distância NUMA aprimorada está levando a "implicações significativas de desempenho" para a taxa de transferência e a utilização da CPU.
Este trabalho da NVIDIA não faz parte do esforço do driver gráfico, mas sim do lado da rede Mellanox da casa. Tariq Toukan resumiu na última rodada desses patches do kernel:
Implemente e exponha a API de propagação de CPU com base no sched_numa_find_closest() do agendador. Use-o em drivers de dispositivo mlx5 e enic. Isso substitui a preferência NUMA binária (local/remoto) por uma aprimorada que considera as distâncias reais, de modo que NUMAs remotos com curta distância são preferidos em relação aos mais distantes.
Isso tem implicações de desempenho significativas ao usar alocações de memória com reconhecimento de NUMA, melhorando a taxa de transferência e a utilização da CPU.
Até agora, os resultados com os drivers de rede Mellanox e ENIC parecem muito bons nos testes da NVIDIA em servidores AMD EPYC 7763:
Veja esta série de patches para mais detalhes.
Nenhum comentário:
Postar um comentário