Cara Kerja Upgrade di Nutanix

Cara Kerja Upgrade di Nutanix

Cara Kerja Upgrade di Nutanix

Ini merupakan artikel terjemahan mesin, silakan klik disini untuk melihat versi asli Inggris.

Keterangan

Pemutakhiran di Nutanix selalu dirancang agar dapat dilakukan tanpa memerlukan waktu henti bagi VM Pengguna dan beban kerjanya. Dokumen ini dimaksudkan sebagai pengantar yang menjelaskan cara kerja setiap jenis pemutakhiran dan untuk berbagi beberapa praktik terbaik yang bermanfaat bagi para administrator. Anda akan menemukan informasi serupa di Panduan Pemutakhiran Acropolis (ingatlah untuk selalu memilih panduan yang sesuai dengan AOS yang saat ini berjalan di kluster Anda).

Versi yang terpengaruh: Semua Versi, Semua Versi Nutanix Files, SEMUA Versi LCM, SEMUA Versi AOS, SEMUA Versi AHV
Berikut ini berlaku untuk SEMUA pemutakhiran Nutanix:

Apakah diperlukan waktu henti?

Tidak. VM Pengguna dapat melakukan migrasi langsung antar host tergantung pada jenis peningkatan yang dilakukan, tetapi seharusnya tidak ada dampak pada layanannya. Pengguna harus tetap memiliki akses ke VM mereka dan dapat bekerja seperti biasa selama peningkatan. VM yang tidak dapat melakukan migrasi langsung, seperti yang menggunakan vGPU atau Aturan Afinitas, harus dimatikan atau setelan ini harus dihapus sebelum peningkatan apa pun yang memerlukan boot ulang host. Kegagalan untuk melakukannya akan mengakibatkan peningkatan terhenti dalam proses evakuasi VM Pengguna.

Apakah ada dampak terhadap kinerja?

Nutanix menyarankan untuk melakukan pemutakhiran selama periode pemeliharaan terjadwal atau di luar jam kerja normal Anda; jika tidak, pengguna mungkin mengalami latensi selama proses pemutakhiran. Latensi ini mungkin sangat terasa untuk kluster yang hanya menggunakan uplink jaringan berkecepatan 1GB karena keterbatasan bandwidth yang tersedia pada konfigurasi ini.

Apa Urutan Peningkatan yang Direkomendasikan?

Bagian Urutan Peningkatan yang Direkomendasikan dari panduan acropolis dapat dirujuk untuk memahami urutan yang harus diikuti untuk peningkatan.

Apa yang terjadi jika pemutakhiran macet?

  • Jika Anda mengalami kegagalan selama pemeriksaan pra-pemutakhiran, tinjau artikel yang dikutip di Prism untuk informasi tentang cara mengatasi masalah tersebut. Setelah masalah teratasi, klik tautan untuk kembali ke versi yang tersedia di Prism, lalu coba pemutakhiran lagi.
  • Jika proses upgrade itu sendiri macet, hubungi Dukungan Nutanix untuk mendapatkan bantuan. Jangan mencoba melakukan intervensi karena hal ini berpotensi mengakibatkan pemadaman.
  • Nutanix tidak mendukung pengembalian untuk pemutakhiran perangkat lunak.

Bagaimana saya mengetahui apakah suatu versi kompatibel?

  • Jika suatu versi muncul di bagian Upgrade Software atau Life Cycle Manager (LCM) di Prism, itu artinya secara otomatis versi tersebut sudah terkonfirmasi kompatibel dengan kluster saat ini, dan Anda bisa beralih ke versi baru kapan saja.
  • Jika Anda tidak melihat versi yang Anda inginkan tercantum, mungkin ada beberapa alasan. Rilis yang lebih baru memerlukan waktu sebelum tersedia untuk One-Click Download, tetapi Anda tetap bisa mendapatkan file biner dan metadata langsung dari Portal Nutanix lalu mengunggahnya ke Prism secara manual. Mungkin juga Anda perlu beralih ke versi perantara (peningkatan multi-langkah) untuk terlebih dahulu membawa klaster ke versi yang dapat ditingkatkan ke versi yang Anda inginkan.
  • Halaman Jalur Pemutakhiran di Portal Nutanix akan menunjukkan versi AOS, Prism Central (PC), atau Nutanix Files yang dapat digunakan klaster Anda saat ini berdasarkan apa yang sedang Anda jalankan. Jika Anda perlu menggunakan versi yang lebih baru daripada yang ditampilkan di halaman Jalur Pemutakhiran, mulailah dengan memutakhirkan klaster ke versi terbaru yang memungkinkan terlebih dahulu. Setelah itu, Anda akan dapat mencapai versi yang Anda inginkan pada percobaan berikutnya. Untuk menghemat waktu, ingatlah bahwa klaster yang menjalankan AOS pada cabang rilis Dukungan Jangka Panjang (LTS) (seperti 5.5.x) selalu dapat memutakhirkan langsung ke cabang rilis LTS berikutnya yang tersedia (seperti 5.10.x).
  • Untuk melihat apakah versi AOS, Prism Central, dan Nutanix Files tertentu kompatibel satu sama lain, periksa Interoperabilitas Produk Perangkat Lunak .

Apa yang harus saya lakukan sebelumnya?

  • Selalu merupakan idea yang baik untuk menginstal dan menjalankan Nutanix Cluster Check (NCC) versi terbaru untuk memastikan klaster Anda dalam kondisi terbaik sebelum memulai pemutakhiran.
  • Untuk memastikan bahwa Prism memiliki akses ke perangkat lunak dan firmware yang ingin Anda pilih, tinjau persyaratan port dan firewall dan verifikasi bahwa jaringan Anda dikonfigurasikan sebagaimana mestinya. Jika Anda menggunakan Prism Central, pastikan port SSL 9440 terbuka di kedua arah antara VM Prism Central dan kluster yang terdaftar.
  • Jika klaster Anda terdaftar di Prism Central, pastikan klaster ini diperbarui sebelum memutakhirkan AOS pada klaster Prism Element. Prism Central dirancang untuk mengelola klaster Prism Element yang berada dalam versi utama yang sama dan versi sebelumnya. Misalnya, Prism Central 5.10.0.1 didukung untuk mengelola klaster Prism Element yang menjalankan 5.10.0.2 karena versi utama (5.10.0) sama. Namun, PC 5.10.0.1 tidak didukung untuk mengelola klaster PE yang menjalankan 5.10.1 karena versi PE ini merupakan versi utama yang lebih baru. Dalam kasus seperti itu, PC harus dimutakhirkan ke versi 5.10.1 atau versi yang lebih baru agar kompatibel kembali dengan klaster yang dikelolanya.
  • Periksa halaman Jalur Pemutakhiran dan Matriks Kompatibilitas di Portal Nutanix untuk memastikan perangkat lunak baru tersebut kompatibel. Matriks Kompatibilitas juga berisi panduan tentang kompatibilitas perangkat lunak dengan Solusi Mitra Nutanix Ready dan Sistem Operasi Tamu AHV.
  • Baca Catatan Rilis di Portal Dukungan untuk mendapatkan informasi tentang masalah yang diketahui dalam rilis serta perbaikan bug, peningkatan, atau fitur apa saja yang disertakan.
  • Jika Anda menggunakan hypervisor atau aplikasi pihak ketiga, periksa situs web vendor untuk memastikan kompatibilitasnya dengan versi AOS yang diinginkan.

Larutan

Di bawah ini Anda akan menemukan ringkasan prasyarat untuk setiap jenis pemutakhiran, apa yang terjadi di bagian belakang, dan berapa lama operasi tersebut diperkirakan akan berlangsung.

Perangkat Lunak AOS

Prasyarat Peningkatan

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

  • Pertama, pemeriksaan pra-peningkatan akan berjalan untuk memastikan bahwa klaster dapat ditingkatkan. Jika salah satu pemeriksaan pra-peningkatan gagal, Anda akan melihat informasi tentang hal ini di Prism dan peningkatan AOS yang sebenarnya tidak akan dimulai. Pengguna harus mengeklik Kembali ke Versi dan memulai peningkatan lagi setelah masalah yang dilaporkan oleh pemeriksaan pra-peningkatan teratasi. Untuk melihat daftar lengkap pemeriksaan pra-peningkatan dan artikel terkaitnya, lihat KB 6524 .
  • Berikutnya, perangkat lunak AOS disalin ke setiap CVM (Controller VM) dalam kluster.
  • Pada tahap terakhir, VM Pengendali dalam klaster akan melakukan boot ulang satu per satu ke versi AOS yang baru. Lalu lintas penyimpanan dari VM Pengguna akan dialihkan ke CVM tetangga saat VM lokal sedang dimutakhirkan. Selama periode singkat ini (sekitar 10 menit), VM Pengguna lokal mungkin mengalami sedikit latensi tambahan karena mereka menerima I/O penyimpanan dari CVM jarak jauh.

Berapa lama?

Proses ini mungkin memakan waktu 15-20 menit per node. Proses pemutakhiran dalam kluster dua node akan memakan waktu lebih lama dari proses biasanya karena adanya langkah tambahan berupa sinkronisasi data saat transisi antara status node tunggal dan dua node. Meskipun demikian, kluster tetap beroperasi selama pemutakhiran.

Perangkat Lunak Prism Central

Gambaran Umum dan Persyaratan

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

  • Pertama, pemeriksaan pra-peningkatan akan berjalan untuk memastikan bahwa klaster dapat ditingkatkan. Jika salah satu pemeriksaan pra-peningkatan gagal, Anda akan melihat informasi tentang hal ini di Prism dan peningkatan yang sebenarnya tidak akan dimulai. Pengguna harus mengeklik Kembali ke Versi dan memulai peningkatan lagi setelah masalah yang dilaporkan oleh pemeriksaan pra-peningkatan teratasi. Untuk melihat daftar lengkap pemeriksaan pra-peningkatan dan artikel terkaitnya, lihat KB 6524 .
  • Jika Anda memiliki Prism Central Single-VM biasa, perangkat lunak baru akan disiapkan dan kemudian PCVM akan di-boot ulang untuk masuk ke versi baru. Selama waktu yang singkat ini, UI tidak akan tersedia, tetapi tidak akan ada pengaruh pada kluster Prism Element yang dikelola oleh Prism Central.
  • Jika Anda memiliki Prism Central Scale-Out (tiga PCVM), perangkat lunak akan disalin ke setiap PCVM dan kemudian PCVM akan di-boot ulang satu per satu untuk muncul di perangkat lunak baru. Layanan dan UI Prism Central akan tetap tersedia selama pemutakhiran.
  • Setelah PCVM melakukan booting dari proses upgrade, akan butuh beberapa menit agar UI tersedia. Login dan pastikan bahwa tugas untuk Prism Central Upgrade telah berhasil diselesaikan (100%).

Berapa lama?

Untuk Single-VM Prism Central, sekitar 25 menit.
Untuk Scale-Out Prism Central (tiga PCVM), sekitar 1 jam.

Perangkat Lunak Hypervisor

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

  • Pertama, pemeriksaan pra-peningkatan akan berjalan untuk memastikan bahwa klaster dapat ditingkatkan. Jika salah satu pemeriksaan pra-peningkatan gagal, Anda akan melihat informasi tentang hal ini di Prism dan peningkatan hypervisor yang sebenarnya tidak akan dimulai. Pengguna harus mengeklik Kembali ke Versi dan memulai peningkatan lagi setelah masalah yang dilaporkan oleh pemeriksaan pra-peningkatan teratasi. Untuk melihat daftar lengkap pemeriksaan pra-peningkatan dan artikel terkaitnya, lihat KB 6524 .
  • Host dalam kluster dipilih melalui pemutakhiran dan tugas diserahkan untuk memigrasikan VM Pengguna dari host.
  • Setelah CVM menjadi satu-satunya mesin virtual yang tersisa pada host, ia ditempatkan ke Mode Pemeliharaan dan perangkat lunak baru untuk hypervisor disiapkan.
  • Setelah versi hypervisor baru diinstal, booting ulang host akan dilakukan.
  • Setelah host kembali ke versi perangkat lunak baru setelah di-boot ulang, host dikeluarkan dari Mode Pemeliharaan dan CVM dihidupkan.
  • Cluster akan menunggu Controller VM dan layanannya untuk online sebelum memilih host berikutnya yang akan menjalani pemutakhiran. Hypervisor akan menyeimbangkan User VM di seluruh node yang dimutakhirkan sesuai kebutuhan berdasarkan konfigurasi yang ada.

Berapa lama?

Hal ini bergantung pada berapa lama waktu yang dibutuhkan untuk mengevakuasi VM Pengguna dari setiap host sebelum dimatikan untuk pemutakhiran. Perkiraan yang baik adalah sekitar 30-45 menit per node.

Firmware dengan Pengelola Siklus Hidup (LCM)

Bagian ini akan berfokus terutama pada pembaruan firmware dengan LCM; namun, Anda juga dapat menggunakan LCM untuk memutakhirkan perangkat lunak seperti AOS dan Foundation. Memperbarui entitas perangkat lunak dengan LCM menggunakan mekanisme yang sama yang tersedia di bagian Perangkat Lunak One Click Upgrade Prism yang lama. Jika Anda tertarik dengan cara kerjanya, silakan lihat bagian dokumen ini yang menjelaskan alur kerja tersebut.

Lihat KB 7536 untuk FAQ tentang fitur ini. Anda harus mengonfigurasi aturan di firewall eksternal Anda untuk mengizinkan pembaruan LCM. Lihat Panduan Konsol Web Prism: Persyaratan Firewall untuk detailnya. Lihat Panduan LCM untuk detail lengkap tentang penggunaan fitur ini.

Kemampuan LCM untuk menginventarisasi atau memperbarui komponen tertentu mungkin bergantung pada versi AOS dan Foundation yang berjalan di kluster. Pengguna yang ingin melihat daftar lengkap pembaruan yang tersedia sebaiknya mempertimbangkan untuk memperbarui perangkat lunak ini terlebih dahulu atau memeriksa Catatan Rilis LCM untuk melihat apakah ada dependensi ini di lingkungan Anda.

Apa yang terjadi ketika saya mengeklik Perbarui ?

  • Pra-pemeriksaan pertama akan dijalankan untuk memastikan bahwa klaster dalam kondisi baik agar pemutakhiran dapat dilanjutkan. Prism akan melaporkan jika ada pra-pemeriksaan yang gagal dan Anda dapat merujuk ke KB 4584 untuk penjelasan masing-masing pra-pemeriksaan dan cara mengatasi masalah tersebut. Setelah masalah yang menyebabkan pra-pemeriksaan gagal diatasi, jalankan Inventaris baru lalu coba operasi pemutakhiran lagi.
  • Pada dasarnya, semua pembaruan firmware yang dilakukan melalui LCM mengharuskan host untuk melakukan boot ke area pementasan berbasis CentOS yang disebut Phoenix dengan pengecualian berikut.
    • Modul tertentu untuk platform Dell.
    • LCM 2.3.2 dan seterusnya, untuk firmware DISK, LCM menggunakan mekanisme pembaruan berbasis IVU yang tidak memerlukan boot ulang host.
    • LCM 2.4.0 dan seterusnya, untuk BIOS dan firmware BMC, ketika kondisi tertentu terpenuhi, LCM menggunakan mekanisme pembaruan Redfish yang tidak memerlukan boot ulang host.
  • LCM memiliki kecerdasan bawaan yang memberi tahu urutan pembaruan firmware yang harus dilakukan, sehingga pengguna tidak perlu khawatir tentang pembaruan mana yang harus dilakukan terlebih dahulu. Pengguna cukup memilih tindakan Perbarui Semua dan LCM akan secara otomatis memenuhi semua dependensi antar-firmware.
  • Jika beberapa host dipilih untuk menjalankan pembaruan firmware, LCM akan mengevakuasi VM Pengguna dari host satu per satu dan mem-boot-nya ke area pementasan Phoenix untuk menjalankan pembaruan. Tidak ada VM pengguna yang akan dimatikan dan beban kerja Anda akan terus dilayani tanpa gangguan.
  • Bergantung pada firmware yang dimutakhirkan, Anda mungkin melihat hypervisor Anda melakukan boot ulang beberapa kali kembali ke Phoenix. Ini adalah perilaku yang wajar dan Anda tidak boleh mencoba melakukan intervensi.
  • Setelah pembaruan firmware selesai, node yang dipilih akan melakukan boot kembali ke hypervisor dan menyalakan VM Pengendali lokal, guna memastikan semua layanan kluster aktif dan berjalan.
  • Terakhir, LCM akan memastikan bahwa hypervisor lokal sekali lagi dapat menjadi host VM Pengguna sebelum pemutakhiran berlanjut ke node berikutnya.

Berapa lama?

Hal ini bergantung pada jumlah pembaruan firmware yang dilakukan pada node tertentu dan berapa lama waktu yang dibutuhkan untuk mengevakuasi VM Pengguna dari setiap host. Sebagai referensi,

  • Pemutakhiran firmware SATA DOM (Phoenix) cenderung memakan waktu sekitar 45 menit per node.
  • Pembaruan firmware BIOS dan BMC (Phoenix) cenderung memakan waktu yang sama dengan SATA DOM.
  • Pembaruan firmware BIOS dan BMC (Redfish) cenderung memakan waktu sekitar 10 - 15 menit.
  • Pemutakhiran firmware DISK (IVU) memerlukan waktu lebih sedikit dibandingkan dengan mekanisme Phoenix, tetapi total waktu sebanding dengan jumlah disk yang dimutakhirkan.

Perangkat Lunak Yayasan

Satu-satunya prasyarat untuk pemutakhiran perangkat lunak Foundation adalah bahwa semua CVM aktif, dan bahwa layanan Foundation dalam keadaan berhenti di seluruh kluster. Layanan ini biasanya tidak berjalan kecuali pemutakhiran LCM atau operasi Perluasan Kluster sedang berlangsung.

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

Biner fondasi diperbarui di semua CVM. Tidak ada layanan, CVM, atau hypervisor yang sedang berjalan yang dimulai ulang.

Berapa lama?

Ini memakan waktu sekitar satu menit.

Perangkat Lunak Nutanix Cluster Check (NCC)

Tidak ada prasyarat untuk peningkatan NCC selain semua CVM harus aktif. Lihat Panduan NCC untuk petunjuk tentang cara meningkatkan.

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

Perangkat lunak NCC yang baru disalin ke setiap CVM, lalu layanan cluster_health, yang bertanggung jawab untuk pemantauan kesehatan dan logika yang mendasari peringatan klaster, dimulai ulang pada setiap node. Tidak ada layanan yang terlibat dalam jalur data yang dimulai ulang.

Berapa lama?

Ini memakan waktu sekitar lima menit.

Perangkat Lunak Server File (Nutanix Files)

Menginstal (atau Memutakhirkan) File

Apa yang terjadi ketika saya mengeklik Tingkatkan Sekarang ?

  • Pertama, pemeriksaan pra-peningkatan akan berjalan untuk memastikan bahwa klaster dapat ditingkatkan. Jika salah satu pemeriksaan pra-peningkatan gagal, Anda akan melihat informasi tentang hal ini di Prism dan peningkatan File Server yang sebenarnya tidak akan dimulai. Pengguna harus mengeklik Kembali ke Versi dan memulai peningkatan lagi setelah masalah yang dilaporkan oleh pemeriksaan pra-peningkatan teratasi. Untuk melihat daftar lengkap pemeriksaan pra-peningkatan dan artikel terkaitnya, lihat KB-6524 .
  • Setelah pemutakhiran File Server dimulai, setiap VM File Server dimutakhirkan satu per satu ke versi Nutanix Files yang baru. Saat FSVM tidak aktif untuk pemutakhiran, pengguna yang terhubung ke share yang dihosting oleh node ini mungkin mengalami kehilangan konektivitas selama sekitar 20-30 detik. Setelah periode singkat ini, FSVM lain akan mengambil alih hosting share tersebut, dan pengguna akan mendapatkan kembali akses ke file mereka.
  • Setelah tiap FSVM menyelesaikan boot ulang ke Nutanix Files versi baru, pemutakhiran akan memastikan bahwa FSVM tersebut dapat kembali menjadi host berbagi sebelum mulai memutakhirkan FSVM berikutnya.

Berapa lama?

Sekitar 20 menit per File Server VM.

Informasi Tambahan

Dokumen ID:HT514179
Tanggal Penerbitan Asli:09/08/2022
Last Modified Date:09/02/2024