NCC állapotfelmérés: cfs_fatal_check
NCC állapotfelmérés: cfs_fatal_check
NCC állapotfelmérés: cfs_fatal_check
Leírás
Az NCC állapotellenőrzés cfs_fatal_check egy ellenőrzés annak megállapítására, hogy a CFS (Collector Framework Service) folyamat stabil-e. A CFS-folyamat a cluster_health szolgáltatás alatt található, és Pulse adatokat küld az Insightsnak. Az ellenőrzés akkor indul el, ha a CFS-folyamat az elmúlt 2 órában legalább 4 alkalommal újraindult. Amíg a CFS-folyamat nem stabilizálódik, a távoli támogatási/impulzus Insights adatok és a proaktív támogatás elküldése késhet.
Az ellenőrzés futtatása előtt frissítse az NCC-t a legújabb verzióra. Ezt az ellenőrzést az NCC 4.6.1-ben vezették be.
Az NCC ellenőrzés futtatása
Ezt az ellenőrzést a teljes NCC állapotellenőrzés részeként futtathatja.
nutanix@cvm$ ncc health_checks run_all
Vagy lefuttathatja ezt az ellenőrzést külön is.
nutanix@cvm$ ncc health_checks pulse_checks cfs_fatal_check
Az ellenőrzéseket a Prism webkonzol Egészség oldaláról is futtathatja. Válassza a Műveletek > Ellenőrzések futtatása lehetőséget . Válassza az Összes ellenőrzés lehetőséget , majd kattintson a Futtatás gombra .
Ez az ellenőrzés a tervek szerint 7200 másodpercenként fut le.
Ez az ellenőrzés olyan CFS-folyamatot generál, amely nincs stabil állapotú riasztásban.
Minta kimenetek
Állapothoz: PASS
Running : health_checks pulse_checks cfs_fatal_check [==================================================] 100% /health_checks/pulse_checks/cfs_fatal_check [ PASS ] ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ +-----------------------+ | State | Count | +-----------------------+ | Pass | 1 | | Total Plugins | 1 | +-----------------------+ Plugin output written to /home/nutanix/data/logs/ncc-output-latest.log
Állapothoz: Figyelmeztetés
Running : health_checks pulse_checks cfs_fatal_check [==================================================] 100% /health_checks/pulse_checks/cfs_fatal_check [ WARN ] ---------------------------------------------------------------------------------------------------------------------------------------------------------------------------+ Detailed information for cfs_fatal_check: Node XYZ240: Warn: CFS process is not in a stable state. Refer to KB 13150 (http://portal.nutanix.com/kb/13150) for details on cfs_fatal_check or Recheck with: ncc health_checks pulse_checks cfs_fatal_check --cvm_list=XYZ240 +-----------------------+ | State | Count | +-----------------------+ | Fail | 1 | | Total Plugins | 1 | +-----------------------+ Plugin output written to /home/nutanix/data/logs/ncc-output-latest.log
Kimeneti üzenetküldés
|
140005 |
---|---|
|
Ez egy ellenőrzés annak megállapítására, hogy a CFS-folyamat stabil-e. A CFS-folyamat a cluster_health szolgáltatás alatt található, és Pulse adatokat küld az Insightsnak. Az ellenőrzés akkor indul el, ha a CFS-folyamat az elmúlt 2 órában legalább 4 alkalommal újraindult. |
|
A CFS-folyamat ismételten újraindulhat, ha helyrehozhatatlan hibát észlel, vagy a CFS-folyamat nem hajt végre egy, a fájlrendszertől vagy az állatkert-kezelő folyamattól függő feladatot, vagy ha az Out Of Memory (OOM) gyilkos megöli. |
|
A CFS-folyamat a vezérlő virtuális gépén a cluster_health szolgáltatás alatt található. Ellenőrizze, hogy a cluster_health szolgáltatás fut-e az érintett csomóponton. Az összeomlás okával kapcsolatos további részletekért tekintse meg a cfs.out és a cluster_health szolgáltatásnaplókat. |
|
Az Insights adatok és a proaktív támogatás késleltethető, amíg a CFS-folyamat stabilizálódik. |
Megoldás
A Pulse diagnosztikai rendszeradatokat biztosít a Nutanix Support számára, hogy proaktív, környezettudatos támogatást nyújtson a Nutanix megoldásokhoz. A Nutanix azt javasolja az ügyfeleknek, hogy engedélyezzék a pulzust. További részletekért olvassa el a Pulzus állapotának monitorozását .
- Ha a fürt 4.6.3.1-nél régebbi NCC-verziót futtat, frissítse az NCC-t a legújabb verzióra a Life Cycle Manager (LCM) segítségével.
- Oldja meg a „CFS-folyamat nincs stabil állapotban” riasztást a Prism Web Console-ból.
- Futtassa újra az NCC ellenőrzést a fenti utasítások szerint.
- Ha továbbra is az NCC-ellenőrzés hibáját látja, futtassa a következő NCC-ellenőrzést a Nutanix Pulse Insights kiszolgálókhoz való kapcsolódás ellenőrzéséhez.
nutanix@cvm$ ncc health_checks pulse_checks rest_connection_checks
- Ha a fenti ellenőrzés sikertelen, kövesse a KB-5490 utasításait az elérhetetlenség elhárításához. Előfordulhat, hogy felfelé irányuló hálózati csatlakozási probléma van, amely megoldást igényel. Tekintse át a hálózat DNS-ét, útválasztását és tűzfalát vagy ACL-eit.
- A riasztás további oka, hogy a CFS-folyamat ismételten újraindulhat, ha helyrehozhatatlan hibát észlel, a CFS-folyamat nem hajt végre egy, a fájlrendszertől vagy az állatkert-kezelő folyamattól függő feladatot, vagy ha memóriahiány miatt leáll ( OOM) problémák.
- Ellenőrizze, hogy a CFS szolgáltatás fut-e a fürtön:
nutanix@CVM:~$ ps aux | grep /home/nutanix/ncc/bin/nusights/cfs | grep -v grep | awk '$11 == "/home/nutanix/ncc/bin/nusights/cfs" { print $0 }' nutanix 4899 0.2 0.2 1438992 83792 ? Sl Jan03 6:31 /home/nutanix/ncc/bin/nusights/cfs -use_iam=True -log_dir=/home/nutanix/data/logs/ -logtostderr=True -logstacktostderr=True -useUTC=True -config_dir=/home/nutanix/ncc/config/nusights -protocol=https -tls_host_name= -ca_cert_path=/home/nutanix/ncc/cert/insights_collector/cacert.pem -rest_base_url=/nusights/services -rest_protocol_version=v1 -use_pc_as_proxy=True -experimental_dump_to_file=True -experimental_dump_transported_data_to_file=False -stats_flush_frequency_secs=900 -num_os_threads=1 -max_rss_memory_limit_mb=628 -high_rss_mb=130 -low_rss_pt=70 -resource_check_interval_secs=5 -enable_self_monitoring=false -prof_dir=/home/nutanix/data/cores/ -mem_profile_rate=-1 -enable_live_debug=False -v=0 -cgroup_subsystems=cpu,cpuacct,memory -use_resumable_file_upload=True -enable_metering_mode_monitoring=True -enable_message_batching=True -max_batch_message_size_in_kb=64 -batch_msg_send_duration_in_sec=120 -enable_local_stats_storage=True -read_additional_cvmconfig_info=true -commit_log_read_buf_size_mb=2 -token_generation_rate_per_sec=100.000000 -burst_size=200
- Ellenőrizze, hogy a CFS szolgáltatás nemrégiben összeomlott-e. Az alábbi parancsban a CFS folyamat 2 napig, 6 óráig, 2 percig és 33 másodpercig fut.
nutanix@CVM:~$ ps -eo etime,args | grep /home/nutanix/ncc/bin/nusights/cfs | grep -v grep | awk '$2 == "/home/nutanix/ncc/bin/nusights/cfs" { print $0 }' 2-06:02:33 /home/nutanix/ncc/bin/nusights/cfs -use_iam=True -log_dir=/home/nutanix/data/logs/ -logtostderr=True -logstacktostderr=True -useUTC=True -config_dir=/home/nutanix/ncc/config/nusights -protocol=https -tls_host_name= -ca_cert_path=/home/nutanix/ncc/cert/insights_collector/cacert.pem -rest_base_url=/nusights/services -rest_protocol_version=v1 -use_pc_as_proxy=True -experimental_dump_to_file=True -experimental_dump_transported_data_to_file=False -stats_flush_frequency_secs=900 -num_os_threads=1 -max_rss_memory_limit_mb=628 -high_rss_mb=130 -low_rss_pt=70 -resource_check_interval_secs=5 -enable_self_monitoring=false -prof_dir=/home/nutanix/data/cores/ -mem_profile_rate=-1 -enable_live_debug=False -v=0 -cgroup_subsystems=cpu,cpuacct,memory -use_resumable_file_upload=True -enable_metering_mode_monitoring=True -enable_message_batching=True -max_batch_message_size_in_kb=64 -batch_msg_send_duration_in_sec=120 -enable_local_stats_storage=True -read_additional_cvmconfig_info=true -commit_log_read_buf_size_mb=2 -token_generation_rate_per_sec=100.000000 -burst_size=200
- Ellenőrizze a legutóbbi FATAL-t a cfs.out-ban.
nutanix@CVM:~$ grep -B8 ^F ~/data/logs/cfs.out* I0418 08:22:18.217482Z 13365 transport.go:993] HTTP(S) proxy: Testing connectivity to end point https://insights.nutanix.com:443/nusights/services/v1/test by making a http POST without any proxy with timeoutSecs: 60. I0418 08:22:46.813213Z 13365 cvmconfig.go:838] current status has remained to be the same from prevStatus: false I0418 08:22:47.794832Z 13365 cfs_stats.go:356] Publishing the commitlog stats to DB. I0418 08:23:18.218412Z 13365 transport.go:2231] Reset cached transport 0xc0000e57c0 for transportKey PULSE:DIRECT:insights.nutanix.com. E0418 08:23:18.218466Z 13365 transport.go:1026] HTTP(S) proxy: Test request to https://insights.nutanix.com:443/nusights/services/v1/test without any proxy failed with error Post "https://insights.nutanix.com:443/nusights/services/v1/test": context deadline exceeded and response nil I0418 08:23:18.218479Z 13365 transport.go:1083] Server endpoint(https://insights.nutanix.com:443/nusights/services/v1/test) is not reachable directly without any proxy. I0418 08:23:18.218486Z 13365 transport.go:1044] Trying connectivity tests for proxy type PC Proxy I0418 08:23:18.218493Z 13365 transport.go:1144] 10830.378976167 Seconds lapsed since the connectivity test is started. F0418 08:23:18.218505Z 13365 transport.go:1161] QFATAL Exiting CFS since POST Endpoint https://insights.nutanix.com:443/nusights/services/ is not reachable via any of the configured proxies .
- Indítsa újra a cluster_health szolgáltatást a CFS-folyamat stabilizálásához:
nutanix@CVM:~$ genesis stop cluster_health nutanix@CVM:~$ cluster start
- Figyelje a CFS-folyamat stabilitását az NCC ellenőrzés újbóli futtatásával.
kapcsolódó cikkek
- Eredeti cikk a Nutanix portálon: Nutanix KB Cikk : 13150
- Nutanix nyitóoldal