Pemeriksaan Kesehatan NCC: ahv_crash_file_check

Pemeriksaan Kesehatan NCC: ahv_crash_file_check

Pemeriksaan Kesehatan NCC: ahv_crash_file_check

Ini merupakan artikel terjemahan mesin, silakan klik disini untuk melihat versi asli Inggris.

Keterangan

Pemeriksaan kesehatan NCC ahv_crash_file_check melaporkan jika ada dump crash host AHV yang terdeteksi pada host cluster mana pun.

Pemeriksaan ini diperkenalkan di NCC 3.5.1.

Menjalankan Pemeriksaan NCC

Jalankan pemeriksaan ini sebagai bagian dari Pemeriksaan Kesehatan NCC yang lengkap.

 nutanix@cvm$ ncc health_checks run_all

Atau jalankan pemeriksaan ini secara terpisah.

 nutanix@cvm$ ncc health_checks hypervisor_checks ahv_crash_file_check

Pada NCC 3.0, Anda juga dapat menjalankan pemeriksaan dari halaman Kesehatan konsol web Prism: pilih Actions > Run Checks . Pilih Semua pemeriksaan dan klik Jalankan .

Dalam rilis NCC yang lebih lama dari 4.0.1, pemeriksaan ini mencari keberadaan file crash dump di direktori /var/crash host AHV. Mulai dari NCC 4.0.1 hanya file crash dump yang dibuat dalam 7 hari terakhir yang diperiksa.
Jika crash dumps ditemukan, NCC menampilkan output WARN dengan referensi ke file spesifik yang ditemukan.

Pemeriksaan ini hanya berlaku untuk AHV Hypervisor.

Pengecekan ini rencananya akan dilakukan setiap hari.

Pemeriksaan ini menghasilkan peringatan mulai dari NCC 4.6.2.

Contoh keluaran

Untuk Status: PERINGATAN

Berikut contoh keluaran pengecekan ketika terdeteksi AHV Kernel Crash Dump.

 Berjalan : health_checks hypervisor_checks ahv_crash_file_check [============== ======] 100% /health_checks/hypervisor_checks/ahv_crash_file_check [ PERINGATAN ] -------------------------------- ----------------------------------------+ Informasi detail untuk ahv_crash_file_check: Node xxxx: PERINGATAN : Menemukan file kerusakan berikut di xxxx: {name_of_dump_file}. Lihat KB 4866 (http://portal.nutanix.com/kb/4866) untuk detail tentang ahv_crash_file_check atau Periksa ulang dengan: ncc health_checks hypervisor_checks ahv_crash_file_check --cvm_list=xxxx

Anda juga mungkin melihat pesan berikut di Prism / Health.

 "Menemukan file kerusakan kernel pada host AHV."
"Beri tahu dukungan Nutanix untuk menyelidiki masalah kernel."
"Masalah kernel dapat mempengaruhi fungsi hypervisor."
"Menemukan file kerusakan berikut"
"File Kerusakan AHV Terbaru Terdeteksi di node"

Pesan keluaran

Periksa ID 11053
Keterangan Periksa apakah /var/crash kosong.
Penyebab kegagalan Ditemukan file kerusakan kernel pada host AHV.
Resolusi Beritahu dukungan Nutanix untuk menyelidiki masalah kernel.
Dampak Masalah kernel dapat mempengaruhi fungsi hypervisor.

Larutan

Jika AHV Kernel Crash Dumps terdeteksi, hubungi Dukungan untuk penyelidikan lebih lanjut mengenai alasan dan apa yang terjadi hingga menghasilkan file dump dan berikan panduan untuk menghindari terulangnya kembali.

Saat menyampaikan kasus kepada Dukungan, sertakan hal berikut:

  • Keluaran pemeriksaan NCC.
  • Daftar file dengan stempel waktu:
     [root@ahvhost ~]# ls -lahtr /var/crash/
  • Salinan file dump crash tertentu.

Catatan: dalam beberapa kasus yang jarang terjadi, peringatan peringatan dapat dimunculkan tanpa mencantumkan nama file kerusakan:

 "Gagal melakukan pemeriksaan file mogok di xxxx:"

Jalankan perintah " ls -lahtr /var/crash/ " pada host AHV yang terpengaruh. Jika tidak ditemukan file kerusakan, atasi peringatan tersebut.

Mengumpulkan Informasi Tambahan

  • Sebelum mengumpulkan informasi tambahan, tingkatkan NCC. Untuk informasi tentang upgrade NCC, lihat Nutanix KB 2871 .
  • Unggah file keluaran NCC ncc-output-latest.log , yang dibuat saat menjalankan pemeriksaan NCC. Lihat Nutanix KB 2871 untuk detail tentang menjalankan NCC dan mengumpulkan file ini.
  • Kumpulkan bundel Logbay menggunakan perintah berikut. Untuk informasi lebih lanjut tentang Logbay, lihat Nutanix KB 6691 .
 nutanix@cvm$ logbay kumpulkan --aggregate=true

informasi tambahan

Dokumen ID:HT516510
Tanggal Penerbitan Asli:05/21/2024
Last Modified Date:05/30/2024