Verificação de integridade do NCC: ahv_crash_file_check

Verificação de integridade do NCC: ahv_crash_file_check

Verificação de integridade do NCC: ahv_crash_file_check

Este é um artigo traduzido automaticamente, por favor clique aqui para ver a versão original em inglês.

Descrição

A verificação de integridade do NCC ahv_crash_file_check relata se algum despejo de memória do host AHV foi detectado em qualquer host do cluster.

Esta verificação foi introduzida no NCC 3.5.1.

Executando a verificação NCC

Execute esta verificação como parte das verificações de integridade completas do NCC.

 nutanix@cvm$ ncc health_checks run_all

Ou execute esta verificação separadamente.

 nutanix@cvm$ ncc health_checks hypervisor_checks ahv_crash_file_check

A partir do NCC 3.0, você também pode executar as verificações na página Health do console web Prism: selecione Actions > Run Checks . Selecione Todas as verificações e clique em Executar .

Nas versões NCC anteriores a 4.0.1, esta verificação procurava a presença de qualquer arquivo de despejo de memória no diretório /var/crash do host AHV. A partir do NCC 4.0.1, apenas os arquivos de despejo de memória criados nos últimos 7 dias serão verificados.
Se forem encontrados crash dumps, o NCC mostra uma saída WARN com referência aos arquivos específicos encontrados.

Esta verificação se aplica apenas ao hipervisor AHV.

Essa verificação está programada para ser executada todos os dias.

Esta verificação gera um alerta a partir do NCC 4.6.2.

Exemplo de saída

Para status: AVISO

A seguir está um exemplo da saída de verificação quando um Crash Dump do Kernel AHV é detectado.

 Em execução: health_checks hypervisor_checks ahv_crash_file_check [============================================ ======] 100% /health_checks/hypervisor_checks/ahv_crash_file_check [AVISO] -------------------------------- ----------------------------------------+ Informações detalhadas para ahv_crash_file_check: Node xxxx: WARN : Foram encontrados os seguintes arquivos de falha em xxxx: {name_of_dump_file}. Consulte KB 4866 (http://portal.nutanix.com/kb/4866) para obter detalhes sobre ahv_crash_file_check ou Verifique novamente com: ncc health_checks hypervisor_checks ahv_crash_file_check --cvm_list=xxxx

Você também pode ver a seguinte mensagem em Prism/Health.

 "Encontrados arquivos de travamento do kernel no(s) host(s) AHV."
"Notifique o suporte da Nutanix para investigar os problemas do kernel."
"O problema do kernel pode afetar as funcionalidades do hipervisor."
"Encontrado o seguinte arquivo de falha"
"Arquivo de falha recente do AHV detectado no nó"

Mensagens de saída

Verifique a identificação 11053
Descrição Verifique se /var/crash está vazio.
Causas de falha Arquivo(s) de travamento do kernel encontrados no(s) host(s) AHV.
Resoluções Notifique o suporte da Nutanix para investigar os problemas do kernel.
Impacto Problemas de kernel podem afetar as funcionalidades do hipervisor.

Solução

Se forem detectados despejos de falha do kernel AHV, entre em contato com o suporte para uma investigação mais aprofundada sobre o motivo e o que ocorreu para produzir o arquivo de despejo e fornecer orientação para evitar qualquer recorrência.

Ao levantar um caso com o Suporte, inclua o seguinte:

  • Saída de verificação NCC.
  • Lista de arquivos com carimbos de data/hora:
     [root@ahvhost ~]# ls -lahtr /var/crash/
  • Uma cópia do arquivo de despejo de memória específico.

Observação: em alguns casos raros, um alerta de aviso pode ser gerado sem os nomes dos arquivos de falha listados:

 "Falha ao executar a verificação do arquivo de falha em xxxx:"

Execute o comando " ls -lahtr /var/crash/ " no host AHV afetado. Se nenhum arquivo de falha for encontrado, resolva o alerta.

Coletando informações adicionais

  • Antes de coletar informações adicionais, atualize o NCC. Para obter informações sobre a atualização do NCC, consulte Nutanix KB 2871 .
  • Carregue o arquivo de saída NCC ncc-output-latest.log , criado na execução da verificação NCC. Consulte Nutanix KB 2871 para obter detalhes sobre como executar o NCC e coletar este arquivo.
  • Colete o pacote Logbay usando o seguinte comando. Para obter mais informações sobre o Logbay, consulte Nutanix KB 6691 .
 nutanix@cvm$ logbay coletar --agregado=true

Informações adicionais

ID do documento:HT516510
Data de publicação original:05/21/2024
Data da última modificação:05/30/2024