NCC 健康检查:inode_usage_check

NCC 健康检查:inode_usage_check

NCC 健康检查:inode_usage_check

这是机器翻译的文章,请单击此处查看原始英文版本。

描述

NCC 检查inode_usage_check验证 CVM 上的可用 inode 数量是否正在变低。

一个 inode 包含文件系统中文件的信息(元数据),包括数据存储位置、文件名、文件权限等。每个目录和文件都有对应的 inode,如果文件很大,则需要多个 inode。每个文件系统的最大 inode 数量是在 FS 创建时定义的,并且无法增加。

inode_usage_check返回以下状态:

  • PASS - 如果 inode 使用率等于或低于 75%
  • 警告- 如果 inode 使用率介于 75% 到 90% 之间
  • 失败- 如果 inode 使用率超过 90%

运行 NCC 检查

它可以作为完整 NCC 检查的一部分运行,方法是运行:

 nutanix@cvm$ ncc health_checks run_all

或单独为:

 nutanix@cvm$ ncc 健康检查 硬件检查 磁盘检查 inode_usage_check

您还可以从 Prism Web 控制台健康页面运行检查:选择操作>运行检查。选择所有检查并单击运行

默认情况下,此检查每 5 分钟运行一次。
此检查将在预定间隔内发生 1 次故障后生成警报 A1027。

示例输出

状态:通过

正在运行:health_checks hardware_checks disk_checks inode_usage_check [=====================================================] 节点上的 100% /health_checks/hardware_checks/disk_checks/inode_usage_check [通过] ----------------------------------------------------------------------------+ +---------------+ | 状态 | 计数 | +---------------+ | 通过 | 1 | | 总计 | 1 | +---------------+ 插件输出写入 /home/nutanix/data/logs/ncc-output-latest.log

状态:警告

节点上的 /health_checks/hardware_checks/disk_checks/inode_usage_check [警告] ----------------------------------------------------------------------------------------+ inode_usage_check 的详细信息:节点 xyz10:失败:'/dev/md2'(安装在'/home')inode 使用率为 %76(大于阈值 %75)有关 inode_usage_check 的详细信息,请参阅 KB 1532

状态:失败

节点上的 /health_checks/hardware_checks/disk_checks/inode_usage_check [失败] ----------------------------------------------------------------------------------------+ inode_usage_check 的详细信息:节点 xyz10:失败:“/dev/md2”(安装在“/home”)inode 使用率为 %91(大于阈值 %90)有关 inode_usage_check 的详细信息,请参阅 KB 1532

输出消息

检查身份证 1004
描述 检查当前 inode 使用率是否很高。
失败的原因 Inode 使用率很高。
决议 减少磁盘使用量或更换磁盘
影响 集群性能可能会显著下降。如果多个节点出现相同情况,集群可能无法满足 I/O 请求。
警报编号 A1027
警报智能标题 控制器虚拟机svm_ip_address上的磁盘 Inode 使用率高
警报标题 磁盘 Inode 使用率高
警报消息 控制器 VM svm_ip_address上一个或多个磁盘的 Inode 使用率已超过inode_usage_threshold%

解决方案

注意: AOS 6.5.3 之前的版本容易受到 / 分区的所有 inode 自然消耗的问题的影响,从而导致集群停机和潜在的 VM 工作负载中断
如果您的 AOS 版本低于 6.5.3,请在解决 inode 警报后立即将集群升级到 6.5.3 或更高版本。

当磁盘上的一个或多个文件系统耗尽可用 inode 时,或者整个集群存储耗尽可用 inode 时,NCC 健康检查inode_usage_check会失败。

确保 NCC 检查的故障部分所报告的 CVM(控制器虚拟机)上的 inode 是空闲的:

 nutanix@cvm:~$ df -i

示例输出(注意 IUSe% 列):

 nutanix@cvm:~$ df -i -t ext4
文件系统 Inodes IUsed IFree IUse%挂载于
/dev/md1 655360 58570 596790 9% /
/dev/loop0 65536 60 65476 1% /tmp
/dev/md2 2621440 25753 2595687 1% /主页
/dev/sdc1 61054976 81234 60973742 1% /home/nutanix/data/stargate-storage/disks/9XGxxxS2
  • 如果/分区的 inode 使用率很高,并且目录“ /var/spool/postfix/maildrop ”消耗了数千个 inode,则请参阅Nutanix KB-6082 。以下命令可用于检查“ /var/spool/postfix/maildrop ”目录消耗的 inode 数量。
     nutanix@NTNX-CVM:~$ sudo du --inode /var/spool/postfix/maildrop 
        
        /var/spool/postfix/邮件投递
        
       
  • 如果您发现/home指示较高的 inode 使用率百分比,则使用以下命令确定哪个或哪些目录的 inode 使用率较高:
     nutanix@cvm$ sudo find /home -xdev -type d -size +100k
    

注意:如果您看到任何其他目录(例如/home/nutanix/data/stargate-storage/disks/ ) 的 inode 使用率较高,请使用以下命令:

 nutanix@cvm$ sudo find /home/nutanix/data/stargate-storage/disks/
  
  -xdev -类型 d -大小 +100k
  
 

收集到上述输出后,请联系支持人员

附加信息

文件ID:HT516508
初始发布日期:05/21/2024
最近修改日期:05/30/2024