Jak upgrady fungují ve společnosti Nutanix
Jak upgrady fungují ve společnosti Nutanix
Jak upgrady fungují ve společnosti Nutanix
Popis
Upgrady na Nutanix jsou vždy navrženy tak, aby byly provedeny bez nutnosti jakýchkoli prostojů pro uživatelské VM a jejich pracovní zátěž. Tento dokument má sloužit jako úvod popisující, jak jednotlivé typy upgradu fungují, a sdílet některé užitečné osvědčené postupy pro administrátory. Podobné informace najdete v Průvodci upgradem Acropolis (nezapomeňte vždy vybrat průvodce, který odpovídá AOS aktuálně spuštěnému na vašem clusteru).
Dotčené verze: všechny verze, všechny verze souborů Nutanix, VŠECHNY verze LCM, VŠECHNY verze AOS, VŠECHNY verze AHV
Následující platí pro VŠECHNY upgrady Nutanix:
Je nutný prostoj?
Ne. Uživatelské virtuální počítače mohou migrovat mezi hostiteli v závislosti na typu provedeného upgradu, ale nemělo by to mít žádný dopad na jejich služby. Uživatelé by si měli zachovat přístup ke svým virtuálním počítačům a během upgradu by měli být schopni pracovat jako obvykle. Virtuální počítače, které nemohou migrovat za provozu, jako jsou ty s vGPU nebo Affinity Rules, budou muset být vypnuty nebo tato nastavení musí být odstraněna před jakýmkoli upgradem, který vyžaduje restart hostitele. Pokud tak neučiníte, upgrade uvízne v procesu evakuace uživatelských virtuálních počítačů.
Má to vliv na výkon?
Nutanix doporučuje provádět upgrady během období plánované údržby nebo mimo vaši běžnou pracovní dobu; v opačném případě mohou uživatelé zaznamenat latenci během procesu upgradu. Tato latence může být zvláště patrná u clusterů, které používají pouze 1GB rychlost síťového uplinku kvůli omezené šířce pásma dostupné v této konfiguraci.
Jaká je doporučená objednávka upgradu?
Sekce Doporučené pořadí upgradů z průvodce Akropole lze nalézt pro pochopení pořadí upgradů, které je třeba dodržet.
Co se stane, když se upgrade zasekne?
- Pokud během kontrol před upgradem narazíte na selhání, přečtěte si článek citovaný v Prism, kde najdete informace o tom, jak problém vyřešit. Jakmile je problém vyřešen, kliknutím na odkaz se vraťte k dostupným verzím v Prism a poté zkuste upgrade znovu.
- Pokud se samotný upgrade zasekne, požádejte o pomoc podporu Nutanix . Nepokoušejte se zasahovat , protože to může potenciálně vést k výpadku.
- Nutanix nepodporuje vrácení zpět pro upgrady softwaru.
Jak zjistím, zda je verze kompatibilní?
- Pokud se verze objeví v sekcích Upgrade Software nebo Life Cycle Manager (LCM) Prism, automaticky to znamená, že je již potvrzeno, že je kompatibilní s clusterem tak, jak je, a můžete kdykoli přejít na novou verzi.
- Pokud v seznamu nevidíte požadovanou verzi, může to být z několika důvodů. U novějších verzí nějakou dobu trvá, než jsou zpřístupněny ke stažení jedním kliknutím, ale stále můžete získat binární soubory a soubory metadat přímo z portálu Nutanix a poté je ručně nahrát na Prism. Může se také stát, že budete muset přejít na zprostředkující verzi (vícekrokový upgrade), abyste nejprve uvedli cluster na verzi, která je schopna upgradovat na požadovanou verzi.
- Stránka Upgrade Paths na portálu Nutanix vám ukáže, na jaké verze AOS, Prism Central (PC) nebo souborů Nutanix lze váš cluster použít právě teď na základě toho, co aktuálně používáte. Pokud potřebujete přejít na novější verzi, než je ta, která je zobrazena na stránce Upgrade Paths, začněte tím, že nejprve upgradujete cluster na nejnovější možnou verzi. Jakmile to uděláte, měli byste být schopni dosáhnout požadované verze při příštím pokusu. Abyste ušetřili čas, pamatujte, že klastr se systémem AOS ve větvi vydání Long-Term Support (LTS) (například 5.5.x) může vždy upgradovat přímo na další dostupnou větev vydání LTS (například 5.10.x).
- Chcete-li zjistit, zda jsou daná verze souborů AOS, Prism Central a Nutanix vzájemně kompatibilní, zkontrolujte interoperabilitu softwarových produktů .
Co mám udělat předem?
- Vždy je idea nainstalovat a spustit nejnovější verzi Nutanix Cluster Check (NCC), abyste se ujistili, že váš cluster je v nejlepším možném stavu před zahájením upgradu.
- Abyste zajistili, že Prism bude mít přístup k softwaru a firmwaru, ze kterých si chcete vybrat, zkontrolujte požadavky na port a firewall a ověřte, zda je vaše síť odpovídajícím způsobem nakonfigurována. Pokud používáte Prism Central, ujistěte se, že port SSL 9440 je otevřený v obou směrech mezi virtuálním počítačem Prism Central a všemi registrovanými clustery.
- Pokud je váš cluster registrován v Prism Central, ujistěte se, že je aktualizován před upgradem AOS na clusteru Prism Element. Prism Central je navržen pro správu clusterů Prism Element, které jsou v rámci stejné hlavní sestavení a starších verzí. Například Prism Central 5.10.0.1 je podporován pro správu clusterů Prism Element běžících na 5.10.0.2, protože hlavní sestavení (5.10.0) je stejné. PC 5.10.0.1 však není podporováno pro správu clusterů PE se systémem 5.10.1, protože tato verze PE je pozdější hlavní sestavení. V takových případech by měl být počítač upgradován na verzi 5.10.1 nebo novější, aby byl opět kompatibilní s clustery, které spravuje.
- Zkontrolujte stránky Upgrade Paths a Compatibility Matrix na portálu Nutanix, abyste se ujistili, že je nový software kompatibilní. Matice kompatibility také obsahuje pokyny týkající se kompatibility softwaru s řešeními Nutanix Ready Partner Solutions a hostovanými operačními systémy AHV.
- Přečtěte si poznámky k verzi na portálu podpory, kde získáte informace o známých problémech ve vydání a také o tom, jaké opravy chyb, vylepšení nebo funkce jsou s ním spojeny.
- Pokud používáte hypervizor nebo aplikaci třetí strany, zkontrolujte web dodavatele a ujistěte se, že je kompatibilní s požadovanou verzí AOS.
Řešení
Níže naleznete souhrn předpokladů pro každý typ upgradu, co se děje na backendu a jak dlouho lze očekávat, že operace bude trvat.
Software AOS
Co se stane, když kliknu na Upgradovat nyní ?
- Nejprve proběhnou kontroly před upgradem, aby se ujistil, že cluster lze upgradovat. Pokud některá z kontrol před upgradem selže, uvidíte o tom informace v Prism a vlastní aktualizace AOS se nespustí. Po vyřešení problému hlášeného předběžnými kontrolami budou uživatelé muset kliknout na Zpět na verze a znovu spustit upgrade. Chcete-li zobrazit úplný seznam předběžných kontrol a související články, podívejte se na KB 6524 .
- Dále je software AOS zkopírován do každého CVM (Controller VM) v clusteru.
- V poslední fázi se virtuální počítače Controller v clusteru jeden po druhém restartují na novou verzi AOS. Provoz úložiště z uživatelských virtuálních počítačů bude přesměrován do sousedního CVM, zatímco místní probíhá upgrade. Během tohoto krátkého období (asi 10 minut) mohou místní uživatelské virtuální počítače zaznamenat malé množství dodatečné latence, protože přijímají I/O úložiště ze vzdáleného CVM.
Jak dlouho to trvá?
To může trvat 15–20 minut na uzel. Proces upgradu v klastru se dvěma uzly bude trvat déle než běžný proces, a to kvůli dodatečnému kroku synchronizace dat při přechodu mezi stavem jednoho a dvou uzlů. Cluster však během upgradu zůstává funkční.
Software Prism Central
Co se stane, když kliknu na Upgradovat nyní ?
- Nejprve proběhnou kontroly před upgradem, aby se ujistil, že cluster lze upgradovat. Pokud některá z kontrol před upgradem selže, uvidíte o tom informace v Prism a vlastní aktualizace se nespustí. Po vyřešení problému hlášeného předběžnými kontrolami budou uživatelé muset kliknout na Zpět na verze a znovu spustit upgrade. Chcete-li zobrazit úplný seznam předběžných kontrol a související články, podívejte se na KB 6524 .
- Pokud máte běžný Single-VM Prism Central, bude nový software zinscenován a poté se PCVM restartuje, aby přešel na novou verzi. Během této krátké doby nebude uživatelské rozhraní dostupné, ale nebude mít žádný vliv na clustery Prism Element, které spravuje Prism Central.
- Pokud máte Scale-Out Prism Central (tři PCVM), software se zkopíruje do každého PCVM a poté se jeden po druhém restartují, aby se objevil nový software. Služby a uživatelské rozhraní Prism Central budou během upgradu stále dostupné.
- Po spuštění PCVM z upgradu bude několik minut trvat, než bude uživatelské rozhraní dostupné. Přihlaste se a ujistěte se, že úloha pro Prism Central Upgrade byla úspěšně dokončena (100 %).
Jak dlouho to trvá?
U Single-VM Prism Central asi 25 minut.
U Scale-Out Prism Central (tři PCVM) asi 1 hodina.
Hypervisorový software
Co se stane, když kliknu na Upgradovat nyní ?
- Nejprve proběhnou kontroly před upgradem, aby se ujistil, že cluster lze upgradovat. Pokud některá z kontrol před upgradem selže, uvidíte o tom informace v Prism a skutečný upgrade hypervizoru se nespustí. Po vyřešení problému hlášeného předběžnými kontrolami budou uživatelé muset kliknout na Zpět na verze a znovu spustit upgrade. Chcete-li zobrazit úplný seznam předběžných kontrol a související články, podívejte se na KB 6524 .
- Upgrade vybere hostitele v clusteru a odešle se úkol k migraci uživatelských virtuálních počítačů z hostitele.
- Jakmile je CVM jediným virtuálním strojem, který zůstane na hostiteli, přejde do režimu údržby a vytvoří se nový software pro hypervizor.
- Po instalaci nové verze hypervizoru dojde k restartování hostitele.
- Jakmile hostitel přejde z restartu na novou verzi softwaru, hostitel se přepne z režimu údržby a CVM se zapne.
- Cluster počká, až se virtuální počítač Controller a jeho služby připojí k režimu online, než vybere dalšího hostitele, který podstoupí upgrade. Hypervizor vyrovná uživatelské VM napříč upgradovaným uzlem podle potřeby na základě jeho stávající konfigurace.
Jak dlouho to trvá?
To závisí na tom, jak dlouho trvá evakuace uživatelských virtuálních počítačů z každého hostitele, než dojde k upgradu. Dobrý odhad je asi 30-45 minut na uzel.
Firmware s Life Cycle Manager (LCM)
Tato část se zaměří především na aktualizace firmwaru pomocí LCM; LCM však můžete také použít k upgradu softwaru jako AOS a Foundation. Aktualizace softwarových entit pomocí LCM využívá stejné mechanismy, které byly k dispozici ve starší sekci One Click Upgrade Software Prism. Pokud vás zajímá, jak tyto postupy fungují, podívejte se prosím do částí tohoto dokumentu, které tyto pracovní postupy popisují.
Nejčastější dotazy týkající se této funkce najdete v KB 7536 . Chcete-li povolit aktualizace LCM, musíte nakonfigurovat pravidla ve vaší externí bráně firewall. Podrobnosti naleznete v příručce Prism Web Console: Požadavky na bránu firewall . Úplné podrobnosti o používání této funkce naleznete v příručce LCM .
Schopnost LCM inventarizovat nebo aktualizovat určité součásti může záviset na tom, které verze AOS a Foundation běží v clusteru. Uživatelé, kteří chtějí vidět úplný seznam dostupných aktualizací, by měli nejprve zvážit aktualizaci tohoto softwaru nebo zkontrolovat poznámky k vydání LCM a zjistit, zda pro vaše prostředí existuje některá z těchto závislostí.
Co se stane, když kliknu na Aktualizovat ?
- Proběhnou první předběžné kontroly, aby se ujistil, že cluster je v dobrém stavu pro pokračování upgradu. Prism ohlásí, pokud některá předběžná kontrola selže, a můžete se obrátit na KB 4584, kde najdete vysvětlení každé z nich a jak problém vyřešit. Po vyřešení problému, který způsobil selhání předběžné kontroly, spusťte nový inventář a poté zkuste operaci upgradu znovu.
- V zásadě všechny aktualizace firmwaru prováděné prostřednictvím LCM vyžadují, aby hostitelé zavedli do pracovní oblasti založené na CentOS s názvem Phoenix s následujícími výjimkami.
- Některé moduly pro platformy Dell.
- LCM 2.3.2 a novější, pro firmware DISK, LCM využívá aktualizační mechanismus založený na IVU, který nevyžaduje restart hostitele.
- LCM 2.4.0 a novější, pro BIOS a firmware BMC, pokud jsou splněny určité podmínky, LCM využívá mechanismus aktualizace Redfish, který nevyžaduje restart hostitele.
- LCM má vestavěnou inteligenci, která mu říká, v jakém pořadí má provádět aktualizace firmwaru, takže se uživatelé nemusí starat o to, jaké aktualizace provést jako první. Uživatelé mohou jednoduše vybrat akci Aktualizovat vše a LCM automaticky uspokojí všechny závislosti mezi firmwarem.
- Pokud je pro provedení aktualizací firmwaru vybráno více hostitelů, LCM evakuuje uživatelské virtuální počítače z hostitelů jeden po druhém a spustí je do pracovní oblasti Phoenix, kde provede aktualizace. Žádné uživatelské virtuální počítače nebudou vypnuty a vaše pracovní zátěž by měla být nadále obsluhována bez přerušení.
- V závislosti na upgradovaném firmwaru můžete vidět, že se váš hypervizor několikrát restartuje zpět do Phoenixu. Toto je očekávané chování a neměli byste se snažit zasahovat.
- Po dokončení aktualizací firmwaru se vybraný uzel spustí zpět do hypervizoru a zapne místní virtuální počítač Controller, čímž se zajistí, že všechny služby clusteru jsou v provozu a běží.
- Nakonec LCM zajistí, že místní hypervizor může opět hostit uživatelské VM, než bude upgrade pokračovat na další uzel.
Jak dlouho to trvá?
To závisí na počtu aktualizací firmwaru prováděných na daném uzlu a na tom, jak dlouho trvá evakuace uživatelských virtuálních počítačů z každého hostitele. jako reference,
- Upgrade firmwaru SATA DOM (Phoenix) obvykle trvá asi 45 minut na uzel.
- Upgrady firmwaru BIOS a BMC (Phoenix) obvykle zaberou přibližně stejnou dobu jako SATA DOM.
- Upgrady firmwaru BIOS a BMC (Redfish) obvykle zaberou asi 10 - 15 minut.
- Upgrade firmwaru disku (IVU) trvá méně času ve srovnání s mechanismem Phoenix, ale celkový čas je úměrný počtu upgradovaných disků.
Software Foundation
Jediným předpokladem pro upgrade softwaru Foundation je, že jsou všechny CVM aktivní a že služba Foundation je v celém clusteru ve stavu zastaveno. Tato služba obvykle není spuštěna, pokud neprobíhá upgrade LCM nebo operace Cluster Expand.
Co se stane, když kliknu na Upgradovat nyní ?
Základní binární soubory jsou aktualizovány ve všech CVM. Nerestartují se žádné běžící služby, CVM ani hypervizory.
Jak dlouho to trvá?
To trvá asi jednu minutu.
Software Nutanix Cluster Check (NCC).
Neexistují žádné další předpoklady pro upgrade NCC kromě toho, že musí být všechny CVM aktivní. Pokyny k upgradu naleznete v příručce NCC .
Co se stane, když kliknu na Upgradovat nyní ?
Nový software NCC je zkopírován do každého CVM a poté je na každém uzlu restartována služba cluster_health, která je zodpovědná za monitorování stavu a logiku, která je základem výstrah klastru. Žádné služby zahrnuté v datové cestě nejsou restartovány.
Jak dlouho to trvá?
To trvá asi pět minut.
Software souborového serveru (Nutanix Files).
Instalace (nebo aktualizace) souborů
Co se stane, když kliknu na Upgradovat nyní ?
- Nejprve proběhnou kontroly před upgradem, aby se ujistil, že cluster lze upgradovat. Pokud některá z kontrol před upgradem selže, uvidíte o tom informace v Prism a skutečný upgrade souborového serveru se nespustí. Po vyřešení problému hlášeného předběžnými kontrolami budou uživatelé muset kliknout na Zpět na verze a znovu spustit upgrade. Chcete-li zobrazit úplný seznam předběžných kontrol a související články, podívejte se na KB-6524 .
- Jakmile začne upgrade souborového serveru, každý virtuální počítač se souborovým serverem se upgraduje jeden po druhém na novou verzi Nutanix Files. Zatímco FSVM je kvůli upgradu mimo provoz, uživatelé připojení ke sdíleným položkám hostovaným tímto uzlem mohou zaznamenat ztrátu připojení na dobu přibližně 20–30 sekund. Po této krátké době převezme hostování těchto sdílených položek další FSVM a uživatelé znovu získají přístup ke svým souborům.
- Poté, co každý FSVM dokončí svůj restart na novou verzi souborů Nutanix, upgrade zajistí, že může znovu hostovat sdílené položky, než začne upgradovat další FSVM.
Jak dlouho to trvá?
Přibližně 20 minut na virtuální počítač se souborovým serverem.
Další informace
- Nutanix KB 6945 - Původní dokument na portálu Nutanix