Verificação de integridade do NCC: pcvm_disk_usage_check

Verificação de integridade do NCC: pcvm_disk_usage_check

Verificação de integridade do NCC: pcvm_disk_usage_check

Este é um artigo traduzido automaticamente, por favor clique aqui para ver a versão original em inglês.

Descrição

A verificação de integridade do NCC pcvm_disk_usage_check verifica se a quantidade de uso de disco ou partição do sistema na VM do Prism Central (PC) está dentro dos limites.

Esta verificação tem as seguintes partes:

  1. Verificando o uso individual do disco de dados (adicionado no NCC 3.5.1):
    • Se o uso for superior a 75% por várias horas, um AVISO será retornado para identificar o disco.
    • Se o uso for superior a 90% por várias horas, uma FAIL será retornada para identificar o disco.
  2. Verificando o uso geral do disco de dados (adicionado no NCC 3.10.1):
    • Se o uso geral for superior a 90% durante várias horas, um AVISO será retornado.
  3. Verificando o uso da partição raiz do sistema Prism Central VM (adicionado no NCC 3.9.4). Retorna apenas a mensagem FAIL se o uso da partição exceder 95%.
  4. Verificando o uso da partição inicial do Prism Central VM (adicionado no NCC 3.9.4):
    • Se o uso for superior a 75%, um AVISO será retornado.
    • Se o uso for superior a 90%, será retornado um FAIL.
  5. Verificando o uso da partição Prism Central VM CMSP (adicionado no NCC 3.10.1):
    • Se o uso for superior a 75%, um AVISO será retornado.
    • Se o uso for superior a 90%, será retornado um FAIL.
  6. Verificando o uso da partição de disco do Prism Central VM Upgrade (adicionado no NCC 4.6.0):
    • Se o uso for superior a 70%, uma FALHA será retornada.
    • Esta verificação é executada a cada 5 minutos.
    • Se houver mais de 5 falhas (30 minutos), um alerta crítico será gerado.

Nota : Se você estiver executando o LCM-2.6 ou LCM-2.6.0.1, a coleção de logs do LCM preenche o diretório /home, consulte KB-14671 para obter uma solução alternativa.

Executando a verificação NCC
Execute a verificação do NCC como parte das verificações completas de integridade do NCC.

Clique aqui   para exibir informações detalhadas abaixo:

Verificando o uso do disco na VM do PC
A seguir está um exemplo de como verificar o uso do disco em uma VM de PC.

Clique aqui   para exibir o exemplo abaixo:

Cenários que acionam a verificação pcvm_disk_usage Avisar/Falha na partição /home

Clique aqui   para exibir informações detalhadas nesta etapa:

Solução

Se a verificação reportar um status WARN ou FAIL, o uso do disco está acima do limite e precisa de investigação. Geralmente, a utilização do espaço pode ser consultada usando df -h . A saída abaixo mostra os pontos de montagem da seguinte forma:

  • /dev/sdb1 é partição raiz
  • /dev/sdb3 é a partição inicial
  • /dev/sdc1 é partição do disco de dados
 nutanix@pcvm$ df -h Filesystem Size Used Avail Use% Mounted on devtmpfs 7.9G 0 7.9G 0% /dev tmpfs 7.9G 44K 7.9G 1% /dev/shm tmpfs 7.9G 6.1M 7.9G 1% /run tmpfs 7.9G 0 7.9G 0% /sys/fs/cgroup /dev/sdb1 9.8G 7.4G 2.3G 77% / /dev/sdb3 50G 8.5G 41G 18% /home /dev/sdc1 492G 150M 486G 1% /home/nutanix/data/stargate-storage/disks/NFS_2_0_267_5a298323_3c9f_4a6f_a265_10c4c1e6593e tmpfs 1.6G 0 1.6G 0% /run/user/1000 /dev/sde 98G 401M 93G 1% /home/nutanix/data/sys-storage/NFS_1_0_264_1f5cda9a_2b3f_4f49_b348_baeb0ae338b8 tmpfs 1.6G 0 1.6G 0% /run/user/0

Uso do disco de dados ( /dev/sdXX ) ou uso geral do multivdisk :

Verifique se o número de VMs suportadas para o tamanho específico do Prism Central está dentro do limite (consulte o Guia do Prism Central para sua versão no Portal de suporte para obter os limites). Entre em contato com o suporte da Nutanix . Ao abrir um caso de suporte, anexe a saída dos comandos a seguir ao caso.

 nutanix@pcvm$ allssh df -h nutanix@pcvm$ ncc health_checks system_checks pcvm_disk_usage_check

Partição inicial do Prism Central VM ( /home ):

Inspecione a saída do NCC para determinar qual VM do Prism Central tem alto uso e execute o seguinte:

  1. Faça login na VM do Prism Central.
  2. Use o comando cd para alterar o local da partição /home.
  3. Liste o conteúdo do diretório por tamanho usando o comando abaixo:
     nutanix@pcvm$ ls -al | sort -k5,5nr

    Examine a saída em busca de arquivos grandes não utilizados que possam ser excluídos.

  4. Execute o comando du abaixo para listar o uso de cada arquivo e subdiretório:
     nutanix@pcvm$ sudo du -skxh * | sort -h

    Examine a saída de grandes subdiretórios. Você pode executar o comando du para cada subdiretório em questão para identificar ainda mais arquivos grandes não utilizados que podem ser excluídos.

  5. Abaixo estão alguns subdiretórios comuns de /home onde é provável que existam arquivos grandes não utilizados:
    • /home/nutanix/software_downloads/ - exclua quaisquer versões antigas que não sejam as versões que você está atualizando atualmente.
    • /home/nutanix/software_uncompressed/ - exclua quaisquer versões antigas que não sejam as versões que você está atualizando atualmente.
    • /home/nutanix/data/cores - exclui rastreamentos de pilha antigos que não são mais necessários.
    • /home/nutanix/data/log_collector/ - exclua logs NCC antigos com formato NCC-logs-2018-07-20-11111111111111-1032057545.tar.
    • /home/nutanix/foundation/isos/ - ISOs antigos.
    • /home/nutanix/foundation/tmp/ - arquivos temporários que podem ser excluídos.

Se as etapas acima não resolverem o problema ou se o problema corresponder a um dos cenários apresentados anteriormente neste artigo, siga as etapas de solução descritas abaixo.

Partição do sistema raiz do Prism Central VM ( / ) ou partição CMSP ( /dev/sdXX ):
Considere contratar o suporte da Nutanix . Reúna a saída dos comandos abaixo e anexe-a ao caso de suporte:

 nutanix@pcvm$ allssh df -h nutanix@pcvm$ sudo du -h --max-depth=1 / 2>/dev/null nutanix@pcvm$ ncc health_checks system_checks pcvm_disk_usage_check

Cenário 1

Clique aqui   para exibir informações detalhadas neste cenário:

Cenário 2
Se a sua instância do Prism Central corresponder a este cenário, consulte o Cenário KB-12707 nº 2 e abra um caso com o suporte da Nutanix para obter assistência na recuperação do problema.

Cenário 3

Clique aqui   para exibir informações detalhadas neste cenário:

Cenário 4
A Nutanix está ciente do problema. A correção para esse problema estará disponível em uma versão futura para PC. Para uma solução alternativa, entre em contato com o suporte da Nutanix .

Cenário 5
Se você perceber que o arquivo de log catalina.out está consumindo muito espaço, use o seguinte comando para reiniciar o serviço prisma no PCVM.

Clique aqui   para exibir informações detalhadas neste cenário:

Cenário 6

Siga KB-6082 para limpar o uso do inode.

Artigos relacionados

ID do documento:HT516503
Data de publicação original:05/16/2024
Data da última modificação:05/30/2024