A VMware descobriu que o kernel Linux 5.13, lançado como estável há um mês, levou a uma séria regressão de desempenho para seu hipervisor empresarial ESXi.
A VMware descobriu que há uma grande regressão de desempenho com o Linux 5.13 em seu software ESXi. Eles descobriram que as cargas de trabalho de computação do ESXi poderiam ser afetadas em até 3x, enquanto as cargas de trabalho de rede estavam em uma regressão de apenas 40% . Suas tarefas de computação eram tão simples quanto os tempos de compilação do kernel do Linux, que foram severamente afetados.
Os engenheiros da VMware descobriram que essa regressão de desempenho muito significativa veio de uma alteração do agendador ... Embora o patch em questão "sched: Move SCHED_DEBUG sysctl to debugfs" pareça bastante comum, descobriu-se que acabou impactando o valor padrão desched_wakeup_granularity_ns .
Alterar a granularidade de ativação do agendador padrão de 15 ms para 4 ms (e a granularidade mínima de 10 ms para 3 ms) está fazendo com que as cargas de trabalho de computação e rede sejam prejudicadas significativamente, pelo menos no ESXi. A crença é que esses novos valores mais baixos por padrão estão causando mais preempção e interrupções involuntárias.
Os detalhes podem ser encontrados nesta postagem da lista de discussão . A VMware agora está buscando informações sobre por que essa alteração padrão ocorreu, se foi mesmo intencional e se pode ser alterado de volta para o padrão anterior, devido ao severo impacto no desempenho que estão vendo nesta última compilação de kernel estável.
Fora de seu hipervisor ESXi, não ouvi falar do Linux 5.13 causando qualquer impacto severo no desempenho, nem vi tal em meus testes em muitos sistemas diferentes, embora não focado em ambientes virtualizados.
Até a próxima !!
Nenhum comentário:
Postar um comentário