Nutanix 警报 - A1068 - 指纹识别已禁用
Nutanix 警报 - A1068 - 指纹识别已禁用
Nutanix 警报 - A1068 - 指纹识别已禁用
描述
这篇 Nutanix 文章提供了对 Nutanix 集群的FingerprintingDisabled警报进行故障排除所需的信息。有关警报的概述(包括发出警报时联系的人员),请参阅KB 1959 。
注意:您可以通过 Nutanix Insights 提供支持的支持门户上的发现查看受此警报影响的特定集群。
警报概述
如果在集群中任何一个控制器虚拟机上的元数据超过 250 GB 或元数据使用量默认阈值的 50% 时自动禁用重复数据删除,则会生成FingerprintingDisabled警报。
有关指纹识别(重复数据删除)的更多信息,请参阅Prism Web Guide
警报示例:
Block Serial Number: 14SMXXXX0000 alert_time: Sat Oct 22 2016 15:31:23 GMT-0700 (PDT) alert_type: FingerprintingDisabled alert_msg: A1068:Disabling fingerprinting (deduplication) for future writes. Calculated metadata usage of 128928090328 bytes exceeds safety limit of 128849018880 bytes on Controller VM 27886XXXX. The metadata disk size is 638580662272. cluster_uuid: 000xxxxx-xxxx-xxxx-0000-00000000xxx cluster_id: xxxx alert_body: No Alert Body Available
输出消息
|
130021 |
---|---|
|
已禁用指纹识别 |
|
元数据磁盘用于存储元数据和数据。一旦磁盘上的元数据部分超过安全阈值,AOS 就会禁用未来写入的指纹识别(重复数据删除)。元数据大小可能会因多种原因而增加,例如快照太多,或者仅仅是因为指纹识别的数据太多。 |
|
一旦元数据大小达到安全限制以下(例如,通过删除不需要的快照,或者扩大集群大小),指纹识别将自动启用。 |
|
不具备重复数据删除的优点。 |
|
A1068 |
|
已禁用指纹识别 |
|
禁用指纹识别(重复数据删除)以供将来写入。计算出的元数据使用量metadata_usage字节超出了控制器 VM service_vm_id上的metadata_limit字节的安全限制。元数据磁盘大小为metadata_disk_size 。 |
解决方案
注意:由于 Azure 群集上 NC2 的 SSH 限制,请按照本指南启用远程支持隧道并联系Nutanix 支持以解决此问题。
注意:已知缺陷会导致生成错误警报,即使没有存储容器使用重复数据删除也是如此。这特别影响 AOS 版本 5.20.2 至 5.20.4 和 6.0.2 至 6.1.2。当集群上的元数据使用率足够高以至于需要暂时禁用指纹识别,直到现有的垃圾收集系统赶上时,就会发生这种误报。之后重新启用它。在这种情况下,不会发生指纹识别,也无需担心。
故障排除
1. 验证集群中任何存储容器是否启用了重复数据删除。如果没有容器启用重复数据删除,则可以放心地将此警报视为误报,并忽略它。
nutanix@cvm:~$ ncli ctr ls | grep -E " Id| Name | Finger| On-Disk" Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::10 Name : NutanixManagementShare Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::492 Name : SelfServiceContainer Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::9 Name : default-container-91507931805487 Fingerprint On Write : off On-Disk Dedup : off
2. 通过在任意 CVM 上运行以下命令来验证集群上是否禁用了重复数据删除:
nutanix@cvm$ ncc health_checks stargate_checks dedup_auto_disabled_check
Running /health_checks/stargate_checks/dedup_auto_disabled_check [ PASS ] -----------------------------------------------------------------------------------+ +---------------+ | State | Count | +---------------+ | Pass | 1 | | Total | 1 | +---------------+
如果返回值为 PASS,请通知 Nutanix 支持部门已重新启用指纹识别。否则,如果返回 WARN 或 INFO,请继续执行解决问题部分。
INFO: Fingerprinting/Dedup is disabled by stargate.
WARN: Fingerprinting is disabled by stargate, but configured on Storage Container(s): [u'xxx']
解决问题
如果 NCC 确认集群上已禁用指纹识别,请考虑联系Nutanix 支持。收集其他信息并附加到支持案例中。
预防问题
您可以采取以下建议措施来尝试避免此问题:
- 确保 Cassandra 元数据环平衡。有关详细信息,请参阅KB 1342 。
- 将 SSD 升级为更高容量的驱动器。
- 避免使用具有不同容量的节点集群。此问题可能是由于节点之间的 SSD 层大小不同造成的。
- 扩展现有的集群。
- 确保集群工作负载适合从重复数据删除中获益。请参阅Prism Web 控制台指南中的重复数据删除最佳实践部分。
注意:每个存储容器可能有所不同。仅在适当的情况下启用重复数据删除。
收集其他信息
- 在收集更多信息之前,请升级 NCC。有关升级 NCC 的信息,请参阅KB 2871 。
- 收集 NCC 输出文件 ncc-output-latest.log。有关收集输出文件的信息,请参阅KB 2871 。
- 使用以下命令收集 Logbay 包。有关 Logbay 的更多信息,请参阅KB 6691 。
nutanix@cvm$ logbay collect --aggregate=true
将文件附加到案件
在支持门户上查看支持案例时,使用回复选项并从那里上传文件。
如果要上传的 NCC 日志包大小大于 5 GB,Nutanix 建议使用 Nutanix FTP 服务器,因为支持的大小有限制。请参阅KB 1294 。
请求援助
如果您需要 Nutanix 支持的进一步帮助,请在支持门户上为案例添加评论,要求 Nutanix 支持与您联系。如果您需要紧急帮助,请拨打我们的全球支持电话号码之一联系支持团队。您还可以单击案例中的“升级”按钮并在评论中说明紧急程度,Nutanix 支持将与您联系。
结案
如果此知识库解决了您的问题,并且您想要关闭案例,请单击初始案例电子邮件中知识库编号旁边的“赞”图标。这将通知 Nutanix 支持继续关闭案例。您还可以更新支持案例,说明可以关闭案例,Nutanix 支持将关闭案例。
相关文章
- Nutanix Portal 中的原始文章: Nutanix KB 文章:3788
- Nutanix 登陆页面