NCC állapotellenőrzés: cluster_services_status

Ez egy gépi fordítású cikk, az eredeti angol verzió megtekintéséhez kattintson ide.

Leírás

Az NCC állapotellenőrzés cluster_services_status ellenőrzi, hogy a Controller VM (CVM) szolgáltatások a közelmúltban újraindultak-e a fürtben.

Kattintson ide a bejelölt szolgáltatások megjelenítéséhez

Az NCC-3.10.1 előtt

Ez az ellenőrzés 4 óránként lefut, és az elmúlt 24 órában generált FATAL naplókat keresi.

Bár ez az NCC-ellenőrzés a szolgáltatás aktuális állapotát és a korábbi összeomlásokat is ellenőrzi, ez az ellenőrzés csak akkor eredményez FAIL állapotot, ha egy vagy több szolgáltatás többször összeomlott, és VÉGZETES naplót generált az elmúlt 24 órában (5 alkalommal egyetlen vezérlőn virtuális gép vagy 10-szer a fürtben).

Feladás az NCC-3.10.1 címre

Ez az ellenőrzés 10 percenként lefut, és az elmúlt 24 órában generált FATAL naplókat keresi.

Az ellenőrzés a következő két esetben sikertelen:

Egy szolgáltatás FATAL 10-szer a fürtben, egy nap alatt 10-nél több csomóponttal rendelkező fürtök esetén (OR) A FATAL-ok száma egy napon belül nagyobb vagy egyenlő, mint a fürtben lévő csomópontok száma, a legfeljebb 10 csomópontot tartalmazó fürtök esetében csomópontok.
Egy szolgáltatás FATAL 5-ször egyetlen CVM-ben, egy nap alatt.

A fürt egyetlen csomópontja jelenti a cluster_services_status ellenőrzés FAIL állapotát a fürt összes többi CVM-je nevében. A FATAL naplók keresésekor ügyeljen arra, hogy minden CVM-et megvizsgáljon, és útmutatóként használja a FAIL állapotüzenetben szereplő érintett szolgáltatások listáját.

Ha a közelmúltban karbantartási tevékenységeket hajtottak végre a fürtön, az ellenőrzés FAIL állapota azt jelzi, hogy a szolgáltatások instabilok, ami potenciálisan befolyásolhatja a fürt teljesítményét vagy szervizelhetőségét.

Az NCC 3.5.1-es verziójától kezdve ez az ellenőrzés a Prism Central virtuális gépekre vonatkozik egy kibővített PC-fürtben.

Az NCC ellenőrzés futtatása

Futtassa ezt az ellenőrzést a teljes NCC állapotellenőrzés részeként.

 nutanix@cvm$ ncc health_checks run_all

Vagy lefuttathatja ezt az ellenőrzést egyenként is.

 nutanix@cvm$ ncc health_checks system_checks cluster_services_status

Az ellenőrzéseket a Prism webkonzol állapotoldaláról is futtathatja: válassza a Műveletek > Ellenőrzések futtatása lehetőséget . Válassza az Összes ellenőrzés lehetőséget, majd kattintson a Futtatás gombra .

Ez az ellenőrzés alapértelmezés szerint 10 percenként fut le.
Ez az ellenőrzés 1 hiba után figyelmeztetést generál.

Minta kimenet

Állapothoz: PASS

 /health_checks/system_checks/cluster_services_status futtatása az összes csomóponton [ PASS ]
-------------------------------------------------- ----------------------+
+---------------+
| állam | Gróf |
+---------------+
| Pass | 1 |
| Összesen | 1 |
+---------------+
A beépülő modul kimenete a /home/nutanix/data/logs/ncc-output-latest.log fájlba írt

Állapot: FAIL

 A cluster_services_status részletes információi:
 xxxx csomópont:
 SIKERTELEN: Az elmúlt 24 órában kidobott komponensek magja: ['cerebro', 'curator']
 A cluster_services_status részleteiért tekintse meg a KB 3378-at (http://portal.nutanix.com/kb/3378), vagy ellenőrizze újra a következővel: ncc health_checks system_checks cluster_services_status

Kimeneti üzenetküldés

Ellenőrizze az azonosítót	3034
Leírás	Ellenőrizze, hogy a szolgáltatások a közelmúltban újraindultak-e a fürtben.
A sikertelenség okai	Ez a riasztás azt jelzi, hogy a fürtben egy vagy több szolgáltatás újraindult.
Határozatok	Ha ez a riasztás egyszer vagy ritkán fordul elő, nincs szükség teendőre. Ha ez gyakori, forduljon a Nutanix ügyfélszolgálatához.
Hatás	A fürt teljesítménye jelentősen csökkenhet. Több, azonos feltétellel rendelkező szolgáltatás esetén előfordulhat, hogy a fürt nem tudja kiszolgálni az I/O kéréseket.
Figyelmeztetés azonosítója	A3034
Intelligens cím figyelmeztetése	A fürtszolgáltatás gyakran újraindul
Figyelmeztetés címe	A fürtszolgáltatási szolgáltatások gyakran újraindulnak
Figyelmeztető üzenet	A szolgáltatások többszöri újraindítása történt az összes vezérlő virtuális gépen. Ezeknek a szolgáltatásoknak a legutóbbi összeomlása időbélyegekkel történt.

Megoldás

Ha a cluster_services_status ellenőrzés FAIL állapotot ad vissza, tegye a következőket:

Tekintse meg az összes Controller virtuális gépen generált alapkiíratások listáját.:
```
 nutanix@cvm$ allssh 'ls -ltr /home/nutanix/data/cores'
```

Futtassa a logbay alkalmazást bármely Controller virtuális gépről az elmúlt 24 óra naplófájljainak összegyűjtéséhez. ( A logbay -ről további információkért lásd: Nutanix KB 6691. )
```
 nutanix@cvm$ logbay collection --aggregate=true --duration=-24h
```
Ez létrehoz egy zip fájlt a /home/nutanix/data/logbay/bundles/ könyvtárban.
Megjegyzés: Az összesített naplóköteg túl nagy lehet nagyobb klasztereken a 24 órás naplógyűjtéshez. Ilyen esetben használja a logbay-t az --aggregate opció nélkül, és töltsön fel naplócsomagokat az egyes CVM-ekből a támogatási esetbe.

Ellenőrizze a következőket, és keresse meg azokat a *.stack_trace.txt.gz fájlokat, amelyeknek azon a CVM-en kell lenniük, amely magkiíratásokat hozott létre.
```
 nutanix@cvm$ allssh 'ls -ltr /home/nutanix/data/cores'
```

Hozzon létre egy új esetet a Nutanix támogatási portálon , és csatolja a fenti parancsok kimenetét és a logbay csomagot a támogatási esethez.

további információ

Nutanix KB 3378 - Eredeti dokumentum a Nutanix portálon
Nutanix nyitóoldal
Lenovo ISG támogatási terv – ThinkAgile HX Appliance és Lenovo Converged HX Series

Dokumentum azonosítója:HT516511

Eredeti közzététel dátuma:05/21/2024

Utolsó módosítás dátuma:05/30/2024