Confira !!
Este ano, os engenheiros da AMD que trabalham na habilitação de hardware para Linux estiveram ocupados com melhorias de driver EDAC, como manipulação de RDDR5 e LRDDR5, adições da AMD Scalable Machine Check Architecture (SMCA) para as CPUs "futuras" e várias outras áreas fora da detecção e correção de erros campo. Hoje, porém, há uma nova série de patches de volta nesse espaço de manipulação de erros de hardware com o novo código SMCA.
Uma nova série de patches publicada na segunda-feira para o driver AMD MCE (Machine Check Exception) adiciona suporte para dois novos registros de "síndrome" usados em "futuros sistemas AMD Scalable MCA" e como parte da implementação de um novo recurso FRU Text. Dado o tempo deste trabalho e a cadência da AMD em torno do tempo de ativação do hardware Linux, isso é quase certo para os processadores de servidor EPYC 7004 "Genoa" e "Bergamo".
A intenção com os novos registros de síndrome a serem encontrados como parte do IP SMCA com futuras CPUs AMD é fornecer informações de erro suplementares. O recurso de texto FRU é para uma string de Unidade Substituível em Campo (FRU) que é representada nos novos registros de síndrome. A cadeia de texto da FRU pode variar com base no banco MCA e é preenchida dinamicamente para cada estado de erro. Essa sequência de FRU será incluída como parte de todos os relatórios do AMD MCE para erros de hardware.
Os novos patches de driver AMD MCE estão agora disponíveis para revisão na lista de discussão do kernel e, dado o tempo, pode ser mesclado para o ciclo v5.19 se não houver problemas. Para encurtar a história, esta é outra série de patches que aponta para as alterações de detecção / relatório de erros de hardware aparentemente mais do que o normal para os processadores de servidor EPYC de próxima geração e todas devem ser bem-vindas pelos administradores de servidor para ajudar a lidar com quaisquer problemas de hardware / sistema.
Até a próxima !!
Nenhum comentário:
Postar um comentário