NCC 健康檢查:inode_usage_check
NCC 健康檢查:inode_usage_check
NCC 健康檢查:inode_usage_check
描述
NCC 檢查inode_usage_check驗證 CVM 上的空閒 inode 數量是否變少。
索引節點包含檔案系統中檔案的資訊(元資料),包括資料儲存位置、檔案名稱、檔案權限等。每個目錄和檔案都有一個對應的 inode,如果檔案大小很大,則可能會出現多個 inode。每個檔案系統的最大 inode 數量是在 FS 建立時定義的,並且不能增加。
inode_usage_check傳回以下狀態:
- 通過- 如果 inode 使用率為 75% 或更低
- 警告- 如果 inode 使用率在 75% 到 90% 之間
- 失敗- 如果 inode 使用率高於 90%
運行 NCC 檢查
它可以作為完整 NCC 檢查的一部分運行:
nutanix@cvm$ ncc health_checks run_all
或單獨為:
nutanix@cvm$ ncc health_checks hardware_checks disk_checks inode_usage_check
您也可以從 Prism Web 控制台執行狀況頁面執行檢查:選擇操作>執行檢查。選擇所有檢查並點擊運行。
預設情況下,此檢查計劃每 5 分鐘運行一次。
在預定時間間隔內發生 1 次故障後,此檢查將產生警報 A1027。
輸出範例
狀態:透過
運行: health_checks hardware_checks disk_checks inode_usage_check [========================================= ===== =======] 節點上100% /health_checks/hardware_checks/disk_checks/inode_usage_check [ PASS ] ---------------------- ---- ---------------------------------------------- ---- ------------+ +----------------+ |狀態|計數| +----------------+ |通行證 | 1 | |總計 | 1 | +-------------+ 插件輸出寫入 /home/nutanix/data/logs/ncc-output-latest.log
對於狀態:警告
節點上的 /health_checks/hardware_checks/disk_checks/inode_usage_check [ 警告 ] ------------------------------------ -------------------------------------------------- --+ inode_usage_check 的詳細資訊:節點xyz10:FAIL:'/dev/md2'(安裝在'/home')inode 使用率為%76(大於閾值,%75)有關inode_usage_check 的詳細信息,請參閱KB 1532
對於狀態:失敗
節點上的 /health_checks/hardware_checks/disk_checks/inode_usage_check [ 失敗 ] ------------------------------------ -------------------------------------------------- --+ inode_usage_check 的詳細資訊:節點xyz10:FAIL:'/dev/md2'(安裝在'/home')inode 使用率為%91(大於閾值,%90) 有關inode_usage_check 的詳細信息,請參閱KB 1532
輸出訊息
檢查身份證件 | 1004 |
描述 | 檢查目前inode使用率是否很高。 |
失敗原因 | 索引節點使用率很高。 |
決議 | 減少磁碟使用或更換磁碟 |
影響 | 集群性能可能會顯著下降。在多個節點具有相同條件的情況下,叢集可能無法服務 I/O 請求。 |
警報ID | A1027 |
警報智慧標題 | 控制器虛擬機器svm_ip_address上的磁碟 Inode 使用率較高 |
警報標題 | 磁碟 Inode 使用率高 |
警報訊息 | 控制器虛擬機器svm_ip_address上一個或多個磁碟的索引節點使用率已超過inode_usage_threshold% 。 |
解決方案
注意:早於 6.5.3 的 AOS 版本容易出現 / 分區的所有 inode 被自然消耗的問題,從而導致叢集停機和潛在的 VM 工作負載中斷。
如果您的AOS版本低於6.5.3,請在解決inode警報後立即將叢集升級至6.5.3或更高版本。
當磁碟上的一個或多個檔案系統耗盡可用 inode 或整個叢集儲存耗盡可用 inode 時,NCC 運行狀況檢查inode_usage_check會失敗。
確保 CVM(控制器虛擬機器)上的 inode 是空閒的,這在 NCC 檢查的失敗部分中報告:
nutanix@cvm:~$ df -i
範例輸出(注意 IUSe% 欄位):
nutanix@cvm:~$ df -i -t ext4
檔案系統索引節點 IUsed IFree IUse%安裝於
/dev/md1 655360 58570 596790 9% /
/dev/loop0 65536 60 65476 1% /tmp
/dev/md2 2621440 25753 2595687 1% /home
/dev/sdc1 61054976 81234 60973742 1% /home/nutanix/data/stargate-storage/disks/9XGxxxS2
- 如果/分區的 inode 使用率很高,且目錄「 /var/spool/postfix/maildrop 」正在消耗數千個 inode,請參閱Nutanix KB-6082 。 以下命令可用於檢查「 /var/spool/postfix/maildrop 」目錄消耗的 inode 數量。
nutanix@NTNX-CVM:~$ sudo du --inode /var/spool/postfix/maildrop
/var/spool/postfix/maildrop
- 如果您觀察到/home指示較高的 inode 使用率,則使用下列命令確定哪個或哪些目錄具有較高的 inode 使用率:
nutanix@cvm$ sudo find /home -xdev -type d -size +100k
注意:如果您看到任何其他目錄(例如/home/nutanix/data/stargate-storage/disks/
nutanix@cvm$ sudo find /home/nutanix/data/stargate-storage/disks/-xdev -type d -大小 +100k
收集上述輸出後,請聯絡支援人員。
附加資訊
- Nutanix KB 1532 - Nutanix 入口網站中的原始文檔
- Nutanix 登陸頁面
- Lenovo ISG 支援計畫 - ThinkAgile HX Appliance 和Lenovo Converged HX 系列