يرجى ملاحظة: هذا الموقع يتضمن نظام الوصول. اضغط على Control-F11 لضبط موقع الويب على ضعاف البصر الذين يستخدمون قارئ الشاشة ؛ اضغط على Control-F10 لفتح قائمة إمكانية الوصول.

فحص صحة NCC: cfs_fatal_check

فحص صحة NCC: cfs_fatal_check

فحص صحة NCC: cfs_fatal_check

هذه المقالة مترجمة باستخدام الترجمة الآلية، الرجاء النقر هنا لعرض الإصدار الانجليزي الأصلي.

وصف

يعد فحص صحة NCC cfs_fatal_check بمثابة فحص لتحديد ما إذا كانت عملية CFS (خدمة إطار عمل المجمع) مستقرة. توجد عملية CFS ضمن خدمةcluster_health وترسل بيانات النبض إلى Insights. سيتم تشغيل الفحص إذا تمت إعادة تشغيل عملية CFS 4 مرات على الأقل خلال الساعتين الماضيتين. حتى تستقر عملية CFS، قد يتأخر إرسال بيانات الدعم عن بعد/الرؤى النبضية والدعم الاستباقي.

قبل تشغيل هذا الفحص، قم بترقية NCC إلى الإصدار الأحدث. تم تقديم هذا الفحص في NCC 4.6.1.

تشغيل فحص NCC

يمكنك إجراء هذا الفحص كجزء من فحوصات الصحة الكاملة التي تقوم بها NCC.

 nutanix@cvm$ ncc health_checks run_all

أو يمكنك تشغيل هذا الفحص بشكل منفصل.

 nutanix@cvm$ ncc health_checks pulse_checks cfs_fatal_check

يمكنك أيضًا تشغيل عمليات التحقق من صفحة صحة وحدة تحكم الويب Prism. حدد الإجراءات > تشغيل عمليات التحقق . حدد كافة عمليات التحقق ثم انقر فوق تشغيل .

تمت جدولة هذا الاختيار ليتم تشغيله كل 7200 ثانية.
سيؤدي هذا الفحص إلى إنشاء عملية CFS التي ليست في حالة تنبيه مستقرة .

مخرجات العينة

للحالة: تمرير

 Running : health_checks pulse_checks cfs_fatal_check [==================================================] 100% /health_checks/pulse_checks/cfs_fatal_check [ PASS ] ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ +-----------------------+ | State | Count | +-----------------------+ | Pass | 1 | | Total Plugins | 1 | +-----------------------+ Plugin output written to /home/nutanix/data/logs/ncc-output-latest.log

للحالة: تحذير

 Running : health_checks pulse_checks cfs_fatal_check [==================================================] 100% /health_checks/pulse_checks/cfs_fatal_check [ WARN ] ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ Detailed information for cfs_fatal_check: Node XYZ240: Warn: CFS process is not in a stable state. Refer to KB 13150 (http://portal.nutanix.com/kb/13150) for details on cfs_fatal_check or Recheck with: ncc health_checks pulse_checks cfs_fatal_check --cvm_list=XYZ240 +-----------------------+ | State | Count | +-----------------------+ | Fail | 1 | | Total Plugins | 1 | +-----------------------+ Plugin output written to /home/nutanix/data/logs/ncc-output-latest.log

رسائل الإخراج

التحقق من الهوية
140005
وصف
هذا فحص لتحديد ما إذا كانت عملية CFS مستقرة. توجد عملية CFS ضمن خدمةcluster_health وترسل بيانات النبض إلى Insights. سيتم تشغيل الفحص إذا تمت إعادة تشغيل عملية CFS 4 مرات على الأقل خلال الساعتين الماضيتين.
أسباب الفشل
يمكن إعادة تشغيل عملية CFS بشكل متكرر إذا واجهت خطأ غير قابل للاسترداد، أو فشلت عملية CFS في أداء مهمة تعتمد على نظام الملفات أو عملية حارس الحيوان، أو إذا تم إيقافها بواسطة قاتل نفاد الذاكرة (OOM).
القرارات
توجد عملية CFS ضمن خدمةcluster_health الموجودة على جهاز التحكم الظاهري. تحقق من تشغيل خدمة Cluster_health على العقدة المتأثرة. تحقق من سجلات خدمة cfs.out وcluster_health للحصول على مزيد من التفاصيل حول سبب العطل.
تأثير
يمكن أن تتأخر بيانات الرؤى والدعم الاستباقي حتى تستقر عملية CFS.

حل

يوفر Pulse بيانات النظام التشخيصي لدعم Nutanix لتقديم دعم استباقي ومدرك للسياق لحلول Nutanix. توصي Nutanix العملاء بتمكين النبض. راجع مراقبة صحة النبض لمزيد من التفاصيل.

  • إذا كانت مجموعتك تقوم بتشغيل إصدار NCC أقدم من 4.6.3.1، فقم بترقية NCC إلى الإصدار الأحدث باستخدام Life Cycle Manager(LCM).
  • قم بحل التنبيه "عملية CFS ليست في حالة مستقرة" من Prism Web Console.
  • أعد تشغيل فحص NCC كما هو موضح أعلاه.
    • إذا كنت لا تزال ترى فشل فحص NCC، فقم بتشغيل فحص NCC التالي للتحقق من الاتصال بخوادم Nutanix Pulse Insights.
 nutanix@cvm$ ncc health_checks pulse_checks rest_connection_checks
  • إذا فشل الفحص أعلاه، فاتبع الإرشادات من KB-5490 لحل مشكلة عدم إمكانية الوصول. قد تكون هناك مشكلة في الاتصال بالشبكة الأولية تتطلب حلاً. قم بمراجعة DNS والتوجيه وجدار الحماية أو قوائم ACL الخاصة بشبكتك.
  • الأسباب الأخرى للتنبيه هي أن عملية CFS قد يتم إعادة تشغيلها بشكل متكرر إذا واجهت خطأ غير قابل للاسترداد، أو فشلت عملية CFS في أداء مهمة تعتمد على نظام الملفات أو عملية حارس الحيوان، أو إذا تم إيقافها بسبب نفاد الذاكرة ( OOM) القضايا.
    • تحقق من تشغيل خدمة CFS على المجموعة:
 nutanix@CVM:~$ ps aux | grep /home/nutanix/ncc/bin/nusights/cfs | grep -v grep | awk '$11 == "/home/nutanix/ncc/bin/nusights/cfs" { print $0 }' nutanix 4899 0.2 0.2 1438992 83792 ? Sl Jan03 6:31 /home/nutanix/ncc/bin/nusights/cfs -use_iam=True -log_dir=/home/nutanix/data/logs/ -logtostderr=True -logstacktostderr=True -useUTC=True -config_dir=/home/nutanix/ncc/config/nusights -protocol=https -tls_host_name= -ca_cert_path=/home/nutanix/ncc/cert/insights_collector/cacert.pem -rest_base_url=/nusights/services -rest_protocol_version=v1 -use_pc_as_proxy=True -experimental_dump_to_file=True -experimental_dump_transported_data_to_file=False -stats_flush_frequency_secs=900 -num_os_threads=1 -max_rss_memory_limit_mb=628 -high_rss_mb=130 -low_rss_pt=70 -resource_check_interval_secs=5 -enable_self_monitoring=false -prof_dir=/home/nutanix/data/cores/ -mem_profile_rate=-1 -enable_live_debug=False -v=0 -cgroup_subsystems=cpu,cpuacct,memory -use_resumable_file_upload=True -enable_metering_mode_monitoring=True -enable_message_batching=True -max_batch_message_size_in_kb=64 -batch_msg_send_duration_in_sec=120 -enable_local_stats_storage=True -read_additional_cvmconfig_info=true -commit_log_read_buf_size_mb=2 -token_generation_rate_per_sec=100.000000 -burst_size=200
  • تحقق مما إذا كانت خدمة CFS قد تعطلت مؤخرًا. في الأمر أدناه، يتم تشغيل عملية CFS لمدة يومين و6 ساعات ودقيقتين و33 ثانية.
 nutanix@CVM:~$ ps -eo etime,args | grep /home/nutanix/ncc/bin/nusights/cfs | grep -v grep | awk '$2 == "/home/nutanix/ncc/bin/nusights/cfs" { print $0 }' 2-06:02:33 /home/nutanix/ncc/bin/nusights/cfs -use_iam=True -log_dir=/home/nutanix/data/logs/ -logtostderr=True -logstacktostderr=True -useUTC=True -config_dir=/home/nutanix/ncc/config/nusights -protocol=https -tls_host_name= -ca_cert_path=/home/nutanix/ncc/cert/insights_collector/cacert.pem -rest_base_url=/nusights/services -rest_protocol_version=v1 -use_pc_as_proxy=True -experimental_dump_to_file=True -experimental_dump_transported_data_to_file=False -stats_flush_frequency_secs=900 -num_os_threads=1 -max_rss_memory_limit_mb=628 -high_rss_mb=130 -low_rss_pt=70 -resource_check_interval_secs=5 -enable_self_monitoring=false -prof_dir=/home/nutanix/data/cores/ -mem_profile_rate=-1 -enable_live_debug=False -v=0 -cgroup_subsystems=cpu,cpuacct,memory -use_resumable_file_upload=True -enable_metering_mode_monitoring=True -enable_message_batching=True -max_batch_message_size_in_kb=64 -batch_msg_send_duration_in_sec=120 -enable_local_stats_storage=True -read_additional_cvmconfig_info=true -commit_log_read_buf_size_mb=2 -token_generation_rate_per_sec=100.000000 -burst_size=200
  • تحقق من وجود حالة فادحة حديثة في cfs.out.
 nutanix@CVM:~$ grep -B8 ^F ~/data/logs/cfs.out* I0418 08:22:18.217482Z 13365 transport.go:993] HTTP(S) proxy: Testing connectivity to end point https://insights.nutanix.com:443/nusights/services/v1/test by making a http POST without any proxy with timeoutSecs: 60. I0418 08:22:46.813213Z 13365 cvmconfig.go:838] current status has remained to be the same from prevStatus: false I0418 08:22:47.794832Z 13365 cfs_stats.go:356] Publishing the commitlog stats to DB. I0418 08:23:18.218412Z 13365 transport.go:2231] Reset cached transport 0xc0000e57c0 for transportKey PULSE:DIRECT:insights.nutanix.com. E0418 08:23:18.218466Z 13365 transport.go:1026] HTTP(S) proxy: Test request to https://insights.nutanix.com:443/nusights/services/v1/test without any proxy failed with error Post "https://insights.nutanix.com:443/nusights/services/v1/test": context deadline exceeded and response nil I0418 08:23:18.218479Z 13365 transport.go:1083] Server endpoint(https://insights.nutanix.com:443/nusights/services/v1/test) is not reachable directly without any proxy. I0418 08:23:18.218486Z 13365 transport.go:1044] Trying connectivity tests for proxy type PC Proxy I0418 08:23:18.218493Z 13365 transport.go:1144] 10830.378976167 Seconds lapsed since the connectivity test is started. F0418 08:23:18.218505Z   13365 transport.go:1161] QFATAL Exiting CFS since POST Endpoint https://insights.nutanix.com:443/nusights/services/ is not reachable via any of the configured proxies .
  • أعد تشغيل خدمةcluster_health لمحاولة تثبيت عملية CFS:
 nutanix@CVM:~$ genesis stop cluster_health nutanix@CVM:~$ cluster start
  • راقب استقرار عملية CFS عن طريق إعادة تشغيل فحص NCC.

مقالات ذات صلة

معرف المستند:HT516498
تاريخ النشر الأصلي:05/17/2024
تاريخ آخر تعديل:05/30/2024