Nutanix 警報 - A1068 - 指紋辨識已停用
Nutanix 警報 - A1068 - 指紋辨識已停用
Nutanix 警報 - A1068 - 指紋辨識已停用
描述
這篇 Nutanix 文章提供了對 Nutanix 叢集的FingerprintingDisabled警報進行故障排除所需的資訊。有關警報的概述,包括提出警報情況時聯繫的人員,請參閱知識庫文章 1959 。
注意:您可以透過 Nutanix Insights 支援的支援入口網站上的發現來查看受此警報影響的特定叢集。
警報概述
當叢集中任一控制器虛擬機器上的元資料超過 250 GB 或元資料使用預設閾值的 50% 時,如果自動停用重複資料刪除,則會產生FingerprintingDisabled警報。
有關指紋識別(重複資料刪除)的更多信息,請參閱Prism Web 指南
警報範例:
Block Serial Number: 14SMXXXX0000 alert_time: Sat Oct 22 2016 15:31:23 GMT-0700 (PDT) alert_type: FingerprintingDisabled alert_msg: A1068:Disabling fingerprinting (deduplication) for future writes. Calculated metadata usage of 128928090328 bytes exceeds safety limit of 128849018880 bytes on Controller VM 27886XXXX. The metadata disk size is 638580662272. cluster_uuid: 000xxxxx-xxxx-xxxx-0000-00000000xxx cluster_id: xxxx alert_body: No Alert Body Available
輸出訊息
|
130021 |
---|---|
|
指紋辨識已停用 |
|
元資料磁碟用於儲存元資料和資料。一旦磁碟上的元資料部分超過安全閾值,AOS 就會停用未來寫入的指紋識別(重複資料刪除)。元資料大小可能會因為多種原因而增加,例如快照太多,或者只是因為太多資料被指紋識別。 |
|
一旦元資料大小低於安全限制(例如,透過刪除不需要的快照或擴展叢集大小),指紋辨識將自動啟用。 |
|
重複資料刪除的優點是不具備的。 |
|
A1068 |
|
指紋辨識已停用 |
|
停用未來寫入的指紋辨識(重複資料刪除)。計算出的metadata_usage位元組的元資料使用量超出了控制器VM service_vm_id上metadata_limit位元組的安全限制。元資料磁碟大小為metadata_disk_size 。 |
解決方案
注意:由於 Azure 叢集上 NC2 的 SSH 限制,請依照本指南啟用遠端支援隧道並聯絡Nutanix 支援以解決此問題。
注意:存在一個已知的缺陷,即使沒有儲存容器使用重複資料刪除,也會導致產生錯誤警報。這特別影響 AOS 版本 5.20.2 至 5.20.4 和 6.0.2 至 6.1.2。當叢集上的元資料使用量足夠高以至於需要暫時停用指紋識別直到到位的垃圾收集系統趕上時,就會發生這種誤報。之後重新啟用它。在這種情況下,不會發生指紋識別,也無需解決。
故障排除
1. 驗證叢集中的任何儲存容器是否啟用了重複資料刪除。如果沒有容器啟用了重複資料刪除,您可以安全地忽略此誤報警報。
nutanix@cvm:~$ ncli ctr ls | grep -E " Id| Name | Finger| On-Disk" Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::10 Name : NutanixManagementShare Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::492 Name : SelfServiceContainer Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::9 Name : default-container-91507931805487 Fingerprint On Write : off On-Disk Dedup : off
2. 透過在任意 CVM 上執行以下命令來驗證叢集上是否停用了重複資料刪除:
nutanix@cvm$ ncc health_checks stargate_checks dedup_auto_disabled_check
Running /health_checks/stargate_checks/dedup_auto_disabled_check [ PASS ] -----------------------------------------------------------------------------------+ +---------------+ | State | Count | +---------------+ | Pass | 1 | | Total | 1 | +---------------+
如果傳回的值為 PASS,請通知 Nutanix 支援指紋辨識已重新啟用。否則,如果出現警告或訊息,請繼續解決問題部分。
INFO: Fingerprinting/Dedup is disabled by stargate.
WARN: Fingerprinting is disabled by stargate, but configured on Storage Container(s): [u'xxx']
解決問題
如果 NCC 確認叢集上停用了指紋識別,請考慮聯絡Nutanix 支援。收集其他資訊並附加到支援案例中。
預防該問題
您可以採取以下建議措施來避免此問題:
- 確保 Cassandra 元資料環平衡。有關詳細信息,請參閱知識庫文章 1342 。
- 將 SSD 升級為更高容量的硬碟。
- 避免擁有具有不同容量的節點叢集。此問題可能是由於節點之間的 SSD 層大小不同所造成的。
- 擴展現有集群。
- 確保叢集工作負載適合從重複資料刪除中受益。請參閱Prism Web 控制台指南中的重複資料刪除最佳實務部分。
注意:對於每個儲存容器,這可能有所不同。僅在適當的情況下啟用重複資料刪除。
收集附加資訊
- 在收集其他資訊之前,請升級 NCC。有關升級 NCC 的信息,請參閱知識庫文章 2871 。
- 收集 NCC 輸出檔 ncc-output-latest.log。有關收集輸出文件的信息,請參閱知識庫文章 2871 。
- 使用以下命令收集 Logbay 套件。有關 Logbay 的更多信息,請參閱知識庫文章 6691 。
nutanix@cvm$ logbay collect --aggregate=true
將文件附加到案例
在支援入口網站上查看支援案例時,請使用「回應」選項並從那裡上傳檔案。
如果上傳的 NCC 日誌包的大小大於 5 GB,由於支援的大小限制,Nutanix 建議使用 Nutanix FTP 伺服器。請參閱知識庫文章 1294 。
請求協助
如果您需要 Nutanix 支援的進一步協助,請在支援入口網站上的案例中新增評論,要求 Nutanix 支援與您聯絡。如果您需要緊急協助,請撥打我們的全球支援電話號碼之一聯絡支援團隊。您也可以點擊案例中的「升級」按鈕,並在評論中解釋緊急情況,Nutanix 支援人員將與您聯絡。
結案
如果此知識庫解決了您的問題,並且您想要關閉案例,請按一下初始案例電子郵件中知識庫編號旁邊的「豎起大拇指」圖示。這會通知 Nutanix 支援人員繼續結案。您也可以更新支援案例,說明可以關閉案例,Nutanix 支援將關閉案例。
相關文章
- Nutanix 入口網站中的原始文章: Nutanix 知識庫文章:3788
- Nutanix 登陸頁面