NCC állapotellenőrzés: cluster_services_status
NCC állapotellenőrzés: cluster_services_status
NCC állapotellenőrzés: cluster_services_status
Leírás
Az NCC állapotellenőrzés cluster_services_status ellenőrzi, hogy a Controller VM (CVM) szolgáltatások a közelmúltban újraindultak-e a fürtben.
Kattintson ide a bejelölt szolgáltatások megjelenítéséhez
Az NCC-3.10.1 előtt
Ez az ellenőrzés 4 óránként lefut, és az elmúlt 24 órában generált FATAL naplókat keresi.
Bár ez az NCC-ellenőrzés a szolgáltatás aktuális állapotát és a korábbi összeomlásokat is ellenőrzi, ez az ellenőrzés csak akkor eredményez FAIL állapotot, ha egy vagy több szolgáltatás többször összeomlott, és VÉGZETES naplót generált az elmúlt 24 órában (5 alkalommal egyetlen vezérlőn virtuális gép vagy 10-szer a fürtben).
Feladás az NCC-3.10.1 címre
Ez az ellenőrzés 10 percenként lefut, és az elmúlt 24 órában generált FATAL naplókat keresi.
Az ellenőrzés a következő két esetben sikertelen:
- Egy szolgáltatás FATAL 10-szer a fürtben, egy nap alatt 10-nél több csomóponttal rendelkező fürtök esetén (OR) A FATAL-ok száma egy napon belül nagyobb vagy egyenlő, mint a fürtben lévő csomópontok száma, a legfeljebb 10 csomópontot tartalmazó fürtök esetében csomópontok.
- Egy szolgáltatás FATAL 5-ször egyetlen CVM-ben, egy nap alatt.
A fürt egyetlen csomópontja jelenti a cluster_services_status ellenőrzés FAIL állapotát a fürt összes többi CVM-je nevében. A FATAL naplók keresésekor ügyeljen arra, hogy minden CVM-et megvizsgáljon, és útmutatóként használja a FAIL állapotüzenetben szereplő érintett szolgáltatások listáját.
Ha a közelmúltban karbantartási tevékenységeket hajtottak végre a fürtön, az ellenőrzés FAIL állapota azt jelzi, hogy a szolgáltatások instabilok, ami potenciálisan befolyásolhatja a fürt teljesítményét vagy szervizelhetőségét.
Az NCC 3.5.1-es verziójától kezdve ez az ellenőrzés a Prism Central virtuális gépekre vonatkozik egy kibővített PC-fürtben.
Az NCC ellenőrzés futtatása
Futtassa ezt az ellenőrzést a teljes NCC állapotellenőrzés részeként.
nutanix@cvm$ ncc health_checks run_all
Vagy lefuttathatja ezt az ellenőrzést egyenként is.
nutanix@cvm$ ncc health_checks system_checks cluster_services_status
Az ellenőrzéseket a Prism webkonzol állapotoldaláról is futtathatja: válassza a Műveletek > Ellenőrzések futtatása lehetőséget . Válassza az Összes ellenőrzés lehetőséget, majd kattintson a Futtatás gombra .
Ez az ellenőrzés alapértelmezés szerint 10 percenként fut le.
Ez az ellenőrzés 1 hiba után figyelmeztetést generál.
Minta kimenet
Állapothoz: PASS
/health_checks/system_checks/cluster_services_status futtatása az összes csomóponton [ PASS ]
-------------------------------------------------- ----------------------+
+---------------+
| állam | Gróf |
+---------------+
| Pass | 1 |
| Összesen | 1 |
+---------------+
A beépülő modul kimenete a /home/nutanix/data/logs/ncc-output-latest.log fájlba írt
Állapot: FAIL
A cluster_services_status részletes információi:
xxxx csomópont:
SIKERTELEN: Az elmúlt 24 órában kidobott komponensek magja: ['cerebro', 'curator']
A cluster_services_status részleteiért tekintse meg a KB 3378-at (http://portal.nutanix.com/kb/3378), vagy ellenőrizze újra a következővel: ncc health_checks system_checks cluster_services_status
Kimeneti üzenetküldés
Ellenőrizze az azonosítót | 3034 |
Leírás | Ellenőrizze, hogy a szolgáltatások a közelmúltban újraindultak-e a fürtben. |
A sikertelenség okai | Ez a riasztás azt jelzi, hogy a fürtben egy vagy több szolgáltatás újraindult. |
Határozatok | Ha ez a riasztás egyszer vagy ritkán fordul elő, nincs szükség teendőre. Ha ez gyakori, forduljon a Nutanix ügyfélszolgálatához. |
Hatás | A fürt teljesítménye jelentősen csökkenhet. Több, azonos feltétellel rendelkező szolgáltatás esetén előfordulhat, hogy a fürt nem tudja kiszolgálni az I/O kéréseket. |
Figyelmeztetés azonosítója | A3034 |
Intelligens cím figyelmeztetése | A fürtszolgáltatás gyakran újraindul |
Figyelmeztetés címe | A fürtszolgáltatási szolgáltatások gyakran újraindulnak |
Figyelmeztető üzenet | A szolgáltatások többszöri újraindítása történt az összes vezérlő virtuális gépen. Ezeknek a szolgáltatásoknak a legutóbbi összeomlása időbélyegekkel történt. |
Megoldás
Ha a cluster_services_status ellenőrzés FAIL állapotot ad vissza, tegye a következőket:
- Tekintse meg az összes Controller virtuális gépen generált alapkiíratások listáját.:
nutanix@cvm$ allssh 'ls -ltr /home/nutanix/data/cores'
- Futtassa a logbay alkalmazást bármely Controller virtuális gépről az elmúlt 24 óra naplófájljainak összegyűjtéséhez. ( A logbay -ről további információkért lásd: Nutanix KB 6691. )
nutanix@cvm$ logbay collection --aggregate=true --duration=-24h
Ez létrehoz egy zip fájlt a /home/nutanix/data/logbay/bundles/ könyvtárban.
Megjegyzés: Az összesített naplóköteg túl nagy lehet nagyobb klasztereken a 24 órás naplógyűjtéshez. Ilyen esetben használja a logbay-t az --aggregate opció nélkül, és töltsön fel naplócsomagokat az egyes CVM-ekből a támogatási esetbe.
- Ellenőrizze a következőket, és keresse meg azokat a *.stack_trace.txt.gz fájlokat, amelyeknek azon a CVM-en kell lenniük, amely magkiíratásokat hozott létre.
nutanix@cvm$ allssh 'ls -ltr /home/nutanix/data/cores'
- Hozzon létre egy új esetet a Nutanix támogatási portálon , és csatolja a fenti parancsok kimenetét és a logbay csomagot a támogatási esethez.
további információ
- Nutanix KB 3378 - Eredeti dokumentum a Nutanix portálon
- Nutanix nyitóoldal
- Lenovo ISG támogatási terv – ThinkAgile HX Appliance és Lenovo Converged HX Series