Nutanix 警报 - A1068 - 指纹识别已禁用

Nutanix 警报 - A1068 - 指纹识别已禁用

Nutanix 警报 - A1068 - 指纹识别已禁用

这是机器翻译的文章,请单击此处查看原始英文版本。

描述

这篇 Nutanix 文章提供了对 Nutanix 集群的FingerprintingDisabled警报进行故障排除所需的信息。有关警报的概述(包括发出警报时联系的人员),请参阅KB 1959

注意:您可以通过 Nutanix Insights 提供支持的支持门户上的发现查看受此警报影响的特定集群。

警报概述
如果在集群中任何一个控制器虚拟机上的元数据超过 250 GB 或元数据使用量默认阈值的 50% 时自动禁用重复数据删除,则会生成FingerprintingDisabled警报。

有关指纹识别(重复数据删除)的更多信息,请参阅Prism Web Guide

警报示例:

 Block Serial Number: 14SMXXXX0000 alert_time: Sat Oct 22 2016 15:31:23 GMT-0700 (PDT) alert_type: FingerprintingDisabled alert_msg: A1068:Disabling fingerprinting (deduplication) for future writes. Calculated metadata usage of 128928090328 bytes exceeds safety limit of 128849018880 bytes on Controller VM 27886XXXX. The metadata disk size is 638580662272. cluster_uuid: 000xxxxx-xxxx-xxxx-0000-00000000xxx cluster_id: xxxx alert_body: No Alert Body Available

输出消息

检查身份证
130021
描述
已禁用指纹识别
失败的原因
元数据磁盘用于存储元数据和数据。一旦磁盘上的元数据部分超过安全阈值,AOS 就会禁用未来写入的指纹识别(重复数据删除)。元数据大小可能会因多种原因而增加,例如快照太多,或者仅仅是因为指纹识别的数据太多。
决议
一旦元数据大小达到安全限制以下(例如,通过删除不需要的快照,或者扩大集群大小),指纹识别将自动启用。
影响
不具备重复数据删除的优点。
警报编号
A1068
警报标题
已禁用指纹识别
警报消息
禁用指纹识别(重复数据删除)以供将来写入。计算出的元数据使用量metadata_usage字节超出了控制器 VM service_vm_id上的metadata_limit字节的安全限制。元数据磁盘大小为metadata_disk_size

解决方案

注意:由于 Azure 群集上 NC2 的 SSH 限制,请按照本指南启用远程支持隧道并联系Nutanix 支持以解决此问题。

注意:已知缺陷会导致生成错误警报,即使没有存储容器使用重复数据删除也是如此。这特别影响 AOS 版本 5.20.2 至 5.20.4 和 6.0.2 至 6.1.2。当集群上的元数据使用率足够高以至于需要暂时禁用指纹识别,直到现有的垃圾收集系统赶上时,就会发生这种误报。之后重新启用它。在这种情况下,不会发生指纹识别,也无需担心。

故障排除

1. 验证集群中任何存储容器是否启用了重复数据删除。如果没有容器启用重复数据删除,则可以放心地将此警报视为误报,并忽略它。

 nutanix@cvm:~$ ncli ctr ls | grep -E " Id| Name | Finger| On-Disk" Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::10 Name : NutanixManagementShare Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::492 Name : SelfServiceContainer Fingerprint On Write : off On-Disk Dedup : off Id : 00057ee3-76e3-7134-6547-ac1f6b5b7075::9 Name : default-container-91507931805487 Fingerprint On Write : off On-Disk Dedup : off

2. 通过在任意 CVM 上运行以下命令来验证集群上是否禁用了重复数据删除:

 nutanix@cvm$ ncc health_checks stargate_checks dedup_auto_disabled_check
 Running /health_checks/stargate_checks/dedup_auto_disabled_check [ PASS ] -----------------------------------------------------------------------------------+ +---------------+ | State | Count | +---------------+ | Pass | 1 | | Total | 1 | +---------------+

如果返回值为 PASS,请通知 Nutanix 支持部门已重新启用指纹识别。否则,如果返回 WARN 或 INFO,请继续执行解决问题部分。

 INFO: Fingerprinting/Dedup is disabled by stargate.
 WARN: Fingerprinting is disabled by stargate, but configured on Storage Container(s): [u'xxx']

解决问题

如果 NCC 确认集群上已禁用指纹识别,请考虑联系Nutanix 支持。收集其他信息并附加到支持案例中。

预防问题
您可以采取以下建议措施来尝试避免此问题:

  1. 确保 Cassandra 元数据环平衡。有关详细信息,请参阅KB 1342
  2. 将 SSD 升级为更高容量的驱动器。
  3. 避免使用具有不同容量的节点集群。此问题可能是由于节点之间的 SSD 层大小不同造成的。
  4. 扩展现有的集群。
  5. 确保集群工作负载适合从重复数据删除中获益。请参阅Prism Web 控制台指南中的重复数据删除最佳实践部分。

注意:每个存储容器可能有所不同。仅在适当的情况下启用重复数据删除。

收集其他信息

  • 在收集更多信息之前,请升级 NCC。有关升级 NCC 的信息,请参阅KB 2871
  • 收集 NCC 输出文件 ncc-output-latest.log。有关收集输出文件的信息,请参阅KB 2871
  • 使用以下命令收集 Logbay 包。有关 Logbay 的更多信息,请参阅KB 6691
     nutanix@cvm$ logbay collect --aggregate=true


将文件附加到案件

在支持门户上查看支持案例时,使用回复选项并从那里上传文件。
如果要上传的 NCC 日志包大小大于 5 GB,Nutanix 建议使用 Nutanix FTP 服务器,因为支持的大小有限制。请参阅KB 1294

请求援助
如果您需要 Nutanix 支持的进一步帮助,请在支持门户上为案例添加评论,要求 Nutanix 支持与您联系。如果您需要紧急帮助,请拨打我们的全球支持电话号码之一联系支持团队。您还可以单击案例中的“升级”按钮并在评论中说明紧急程度,Nutanix 支持将与您联系。

结案
如果此知识库解决了您的问题,并且您想要关闭案例,请单击初始案例电子邮件中知识库编号旁边的“赞”图标。这将通知 Nutanix 支持继续关闭案例。您还可以更新支持案例,说明可以关闭案例,Nutanix 支持将关闭案例。

相关文章

文件ID:HT516497
初始发布日期:05/17/2024
最近修改日期:05/30/2024