FERRAMENTAS LINUX: O Google tem um problema com as reinicializações do servidor Linux muito lentas devido a muitas unidades NVMe

quarta-feira, 30 de março de 2022

O Google tem um problema com as reinicializações do servidor Linux muito lentas devido a muitas unidades NVMe



Confira !!


Problemas de hiperescalador nos dias de hoje? Servidores Linux demorando muito para reinicializar devido a muitas unidades NVMe. Felizmente, o Google está trabalhando em uma melhoria para resolver isso, onde alguns de seus servidores de muitas unidades podem levar mais de um minuto para o kernel Linux realizar suas tarefas de desligamento, enquanto esse trabalho também pode beneficiar outros usuários, embora de forma menos notável.

Os engenheiros do Google estão propondo uma interface de desligamento assíncrona para o kernel do Linux. Atualmente, as APIs de desligamento do kernel Linux no nível do barramento são síncronas, o que pode causar problemas, como relatórios do Google, com muitas unidades de armazenamento NVMe em um único servidor. Devido à natureza síncrona durante o manuseio do desligamento, cada unidade NVMe pode levar cerca de 4,5 segundos para desligar. Com os servidores do Google agora com mais de 16 dispositivos NVMe, isso pode significar um minuto extra para desligar e passar pela fase de reinicialização... Com a interface de desligamento assíncrono e a adaptação do driver NVMe para usá-lo, suas reinicializações e, finalmente, a quantidade tempo de inatividade do servidor -- pode ser facilmente reduzido em um minuto.

Os patches propostos pelo Google permitem uma interface de desligamento assíncrona opcional no nível do barramento. A nova interface mantém a compatibilidade com a implementação síncrona. Como parte dos patches, todos os dispositivos baseados em PCI Express são movidos para usar a interface assíncrona, implementam as alterações no nível PCIe e, em seguida, as alterações no driver NVMe para explorar a interface de desligamento assíncrono.

Essa interface de desligamento assíncrona proposta na forma atual tem apenas cerca de cem linhas de novo código, concedidas, apenas um driver fazendo uso dele no momento. Mas com servidores Linux modernos de alto desempenho continuando a adicionar mais unidades NVMe e outros dispositivos PCIe, onde a interface de desligamento síncrono do kernel Linux pode significar tempo de inatividade extra, espero que esses patchesconseguirá avançar e manter a linha principal em pouco tempo, além de adaptar mais motoristas para usá-la.






Fonte

Até a próxima !!



Nenhum comentário:

Postar um comentário