Hoe upgrades werken bij Nutanix

Hoe upgrades werken bij Nutanix

Hoe upgrades werken bij Nutanix

Dit artikel is een machinevertaling. Klik hier om de originele Engelse versie te bekijken.

Beschrijving

Upgrades bij Nutanix zijn altijd ontworpen om te worden uitgevoerd zonder downtime voor User VM's en hun workloads. Dit document is bedoeld als introductie waarin wordt beschreven hoe elk type upgrade werkt en om enkele nuttige best practices voor beheerders te delen. U vindt vergelijkbare informatie in de Acropolis Upgrade Guide (vergeet niet om altijd de gids te kiezen die overeenkomt met de AOS die momenteel op uw cluster draait).

Betrokken versies: Alle versies, Alle Nutanix Files-versies, ALLE LCM-versies, ALLE AOS-versies, ALLE AHV-versies
Het volgende geldt voor ALLE Nutanix-upgrades:

Is er downtime nodig?

Nee. Gebruikers-VM's kunnen live migreren tussen hosts, afhankelijk van het type upgrade dat wordt uitgevoerd, maar dit zou geen impact moeten hebben op hun services. Gebruikers moeten toegang tot hun VM's behouden en normaal kunnen werken tijdens de upgrade. VM's die niet live kunnen migreren, zoals die met vGPU's of Affinity Rules, moeten worden uitgeschakeld of deze instellingen moeten worden verwijderd voorafgaand aan een upgrade waarvoor een host opnieuw moet worden opgestart. Als u dit niet doet, blijft de upgrade steken in het proces van het evacueren van gebruikers-VM's.

Heeft dit invloed op de prestaties?

Nutanix raadt aan om upgrades uit te voeren tijdens uw geplande onderhoudsvenster of buiten uw normale kantooruren; anders kunnen gebruikers latentie ervaren tijdens het upgradeproces. Deze latentie kan vooral merkbaar zijn voor clusters die alleen 1GB-snelheidsnetwerkuplinks gebruiken vanwege de beperkte bandbreedte die beschikbaar is op deze configuratie.

Wat is de aanbevolen upgradevolgorde?

Raadpleeg het gedeelte Aanbevolen upgradevolgorde in de gids voor de Akropolis om te zien in welke volgorde u de upgrades moet uitvoeren.

Wat gebeurt er als de upgrade vastloopt?

  • Als u een fout tegenkomt tijdens pre-upgrade checks, bekijk dan het artikel dat in Prism wordt aangehaald voor informatie over hoe u het probleem kunt oplossen. Zodra het probleem is opgelost, klikt u op de link om terug te gaan naar de beschikbare versies in Prism en probeert u de upgrade opnieuw.
  • Als de upgrade zelf vastloopt, neem dan contact op met Nutanix Support voor assistentie. Probeer niet in te grijpen, want dit kan potentieel leiden tot een storing.
  • Nutanix ondersteunt geen terugdraaiingen voor software-upgrades.

Hoe weet ik of een versie compatibel is?

  • Als een versie in de secties Upgrade Software of Life Cycle Manager (LCM) van Prism verschijnt, betekent dit automatisch dat de compatibiliteit met de huidige cluster al is bevestigd. U kunt dan op elk gewenst moment overstappen op de nieuwe versie.
  • Als u de versie die u wilt niet ziet, kan dat verschillende redenen hebben. Nieuwere releases hebben wat tijd nodig voordat ze beschikbaar zijn voor One-Click Download, maar u kunt de binaire bestanden en metadatabestanden nog steeds rechtstreeks van de Nutanix Portal halen en ze vervolgens handmatig naar Prism uploaden. Het kan ook zijn dat u naar een tussenliggende versie (multi-step upgrade) moet gaan om het cluster eerst naar een versie te brengen die kan upgraden naar uw gewenste versie.
  • De pagina Upgrade Paths op de Nutanix Portal toont u welke versies van AOS, Prism Central (PC) of Nutanix Files uw cluster op dit moment kan gebruiken, op basis van wat u momenteel gebruikt. Als u naar een latere versie wilt dan die op de pagina Upgrade Paths wordt weergegeven, begin dan met het upgraden van het cluster naar de nieuwste mogelijke versie. Zodra dat is gebeurd, zou u de gewenste versie bij uw volgende poging moeten kunnen bereiken. Om tijd te besparen, onthoud dat een cluster met AOS op een Long-Term Support (LTS) releasebranch (zoals 5.5.x) altijd direct kan upgraden naar de volgende beschikbare LTS releasebranch (zoals 5.10.x).
  • Om te zien of een bepaalde versie van AOS, Prism Central en Nutanix Files compatibel zijn met elkaar, controleert u de Software Product Interoperability .

Wat moet ik vooraf doen?

  • Het is altijd een goed idea om de nieuwste versie van Nutanix Cluster Check (NCC) te installeren en uit te voeren. Zo weet u zeker dat uw cluster in de best mogelijke staat verkeert voordat u met een upgrade begint.
  • Om er zeker van te zijn dat Prism toegang heeft tot de software en firmware die u wilt kiezen, controleert u de poort- en firewallvereisten en verifieert u dat uw netwerk dienovereenkomstig is geconfigureerd. Als u Prism Central gebruikt, zorg er dan voor dat SSL-poort 9440 in beide richtingen open is tussen de Prism Central VM en alle geregistreerde clusters.
  • Als uw cluster is geregistreerd bij Prism Central, zorg er dan voor dat dit wordt bijgewerkt voordat u AOS op het Prism Element-cluster upgradet. Prism Central is ontworpen om Prism Element-clusters te beheren die zich binnen dezelfde hoofdbuild en eerdere versies bevinden. Prism Central 5.10.0.1 wordt bijvoorbeeld ondersteund om Prism Element-clusters te beheren die 5.10.0.2 draaien, aangezien de hoofdbuild (5.10.0) hetzelfde is. PC 5.10.0.1 wordt echter niet ondersteund om PE-clusters te beheren die 5.10.1 draaien, aangezien deze PE-versie een latere hoofdbuild is. In dergelijke gevallen moet de PC worden geüpgraded naar 5.10.1 of latere builds om deze weer compatibel te maken met de clusters die deze beheert.
  • Controleer de pagina's Upgrade Paths en Compatibility Matrix op de Nutanix Portal om er zeker van te zijn dat de nieuwe software compatibel is. De Compatibility Matrix bevat ook richtlijnen over softwarecompatibiliteit met Nutanix Ready Partner Solutions en AHV Guest Operating Systems.
  • Lees de Release Notes op de Support Portal voor informatie over bekende problemen in de release en welke bugfixes, verbeteringen of nieuwe functies ermee gepaard gaan.
  • Als u een hypervisor of applicatie van derden gebruikt, controleer dan op de website van de leverancier of deze compatibel is met de gewenste versie van AOS.

Oplossing

Hieronder vindt u een samenvatting van de vereisten voor elk type upgrade, wat er op de backend gebeurt en hoe lang de bewerking naar verwachting zal duren.

AOS-software

Upgradevereisten

Wat gebeurt er als ik op Nu upgraden klik?

  • Eerst worden de pre-upgrade checks uitgevoerd om te controleren of het cluster kan worden geüpgraded. Als een van de pre-upgrade checks mislukt, ziet u hierover informatie in Prism en start de daadwerkelijke AOS-upgrade niet. Gebruikers moeten op Back to Versions klikken en de upgrade opnieuw starten nadat het probleem dat door de pre-checks is gemeld, is opgelost. Bekijk KB 6524 voor de volledige lijst met pre-checks en de bijbehorende artikelen.
  • Vervolgens wordt de AOS-software naar elke CVM (Controller VM) in het cluster gekopieerd.
  • In de laatste fase worden de Controller VM's in het cluster één voor één opnieuw opgestart op de nieuwe AOS-versie. Opslagverkeer van User VM's wordt omgeleid naar een naburige CVM terwijl de lokale CVM wordt geüpgraded. Tijdens deze korte periode (ongeveer 10 minuten) kunnen de lokale User VM's een kleine hoeveelheid extra latentie ervaren, omdat ze hun opslag-I/O ontvangen van een externe CVM.

Hoe lang gaat het duren?

Dit kan 15-20 minuten per knooppunt duren. Het upgradeproces in een cluster met twee knooppunten duurt langer dan het gebruikelijke proces vanwege de extra stap van het synchroniseren van gegevens tijdens de overgang tussen de status van één knooppunt en de status van twee knooppunten. Desalniettemin blijft het cluster operationeel tijdens de upgrade.

Prism Centrale Software

Overzicht en vereisten

Wat gebeurt er als ik op Nu upgraden klik?

  • Eerst worden de pre-upgrade checks uitgevoerd om te controleren of het cluster kan worden geüpgraded. Als een van de pre-upgrade checks mislukt, ziet u hierover informatie in Prism en start de daadwerkelijke upgrade niet. Gebruikers moeten op Back to Versions klikken en de upgrade opnieuw starten nadat het probleem dat door de pre-checks is gemeld, is opgelost. Bekijk KB 6524 voor de volledige lijst met pre-checks en de bijbehorende artikelen.
  • Als u een gewone Single-VM Prism Central hebt, wordt de nieuwe software gefaseerd en start de PCVM opnieuw op om de nieuwe versie te installeren. Gedurende deze korte tijd is de UI niet beschikbaar, maar heeft dit geen effect op de Prism Element-clusters die worden beheerd door Prism Central.
  • Als u een Scale-Out Prism Central (drie PCVM's) hebt, wordt de software naar elke PCVM gekopieerd en worden ze één voor één opnieuw opgestart om de nieuwe software te starten. De Prism Central-services en UI blijven beschikbaar tijdens de upgrade.
  • Nadat de PCVM is opgestart na de upgrade, duurt het een paar minuten voordat de UI beschikbaar is. Meld u aan en zorg ervoor dat de taak voor Prism Central Upgrade succesvol is voltooid (100%).

Hoe lang gaat het duren?

Voor Single-VM Prism Central, ongeveer 25 minuten.
Voor Scale-Out Prism Central (drie PCVM's), ongeveer 1 uur.

Hypervisor-software

Wat gebeurt er als ik op Nu upgraden klik?

  • Eerst worden de pre-upgrade checks uitgevoerd om te controleren of het cluster kan worden geüpgraded. Als een van de pre-upgrade checks mislukt, ziet u hierover informatie in Prism en start de daadwerkelijke hypervisor-upgrade niet. Gebruikers moeten op Back to Versions klikken en de upgrade opnieuw starten nadat het probleem dat door de pre-checks is gemeld, is opgelost. Bekijk KB 6524 voor de volledige lijst met pre-checks en de bijbehorende artikelen.
  • Er wordt een host in het cluster gekozen door de upgrade en er wordt een taak ingediend om gebruikers-VM's van de host te migreren.
  • Zodra de CVM de enige virtuele machine is die op de host overblijft, wordt deze in de onderhoudsmodus geplaatst en wordt de nieuwe software voor de hypervisor gereedgemaakt.
  • Nadat de nieuwe hypervisorversie is geïnstalleerd, wordt de host opnieuw opgestart.
  • Zodra de host na het opnieuw opstarten overschakelt naar de nieuwe softwareversie, wordt de host uit de onderhoudsmodus gehaald en wordt de CVM opgestart.
  • Het cluster wacht tot de Controller VM en de services online zijn voordat de volgende host wordt geselecteerd die de upgrade moet ondergaan. De hypervisor zal User VM's over het geüpgradede knooppunt verdelen indien nodig op basis van de bestaande configuratie.

Hoe lang gaat het duren?

Dit hangt af van hoe lang het duurt om User VMs van elke host te evacueren voordat deze down gaat voor een upgrade. Een goede schatting is ongeveer 30-45 minuten per node.

Firmware met Life Cycle Manager (LCM)

Deze sectie richt zich voornamelijk op firmware-updates met LCM; u kunt LCM echter ook gebruiken om software zoals AOS en Foundation te upgraden. Het updaten van software-entiteiten met LCM maakt gebruik van dezelfde mechanismen die beschikbaar waren in de oude One Click Upgrade Software- sectie van Prism. Als u geïnteresseerd bent in hoe deze werken, raadpleeg dan de secties van dit document die deze workflows beschrijven.

Zie KB 7536 voor een FAQ over deze functie. U moet regels configureren in uw externe firewall om LCM-updates toe te staan. Zie de Prism Web Console Guide: Firewall Requirements voor meer informatie. Raadpleeg de LCM Guide voor volledige informatie over het gebruik van de functie.

Het vermogen van LCM om bepaalde componenten te inventariseren of bij te werken, kan afhankelijk zijn van welke versies van de AOS en Foundation op het cluster draaien. Gebruikers die een volledige lijst met beschikbare updates willen zien, moeten overwegen om deze software eerst bij te werken of de LCM Release Notes te controleren om te zien of een van deze afhankelijkheden voor uw omgeving bestaat.

Wat gebeurt er als ik op Bijwerken klik?

  • Eerst worden er pre-checks uitgevoerd om te controleren of het cluster in een goede staat verkeert om de upgrade te laten doorgaan. Prism meldt of er pre-checks mislukken en u kunt KB 4584 raadplegen voor een uitleg van elk van hen en hoe u het probleem kunt oplossen. Zodra het probleem waardoor de pre-check mislukte is opgelost, voert u een nieuwe inventaris uit en probeert u de upgradebewerking opnieuw.
  • In principe vereisen alle firmware-updates die via LCM worden uitgevoerd dat de hosts opstarten in een CentOS-gebaseerde staging-omgeving met de naam Phoenix, met de volgende uitzonderingen.
    • Bepaalde modules voor Dell-platforms.
    • Vanaf LCM 2.3.2 maakt LCM voor DISK-firmware gebruik van een op IVU gebaseerd updatemechanisme, waardoor de host niet opnieuw hoeft te worden opgestart.
    • Vanaf LCM 2.4.0 voor BIOS en BMC-firmware maakt LCM, wanneer aan bepaalde voorwaarden is voldaan, gebruik van het Redfish-updatemechanisme, waarvoor de host niet opnieuw hoeft te worden opgestart.
  • LCM heeft ingebouwde intelligentie die het vertelt in welke volgorde de firmware-updates moeten worden uitgevoerd, dus gebruikers hoeven zich geen zorgen te maken over welke updates ze eerst moeten uitvoeren. Gebruikers kunnen eenvoudig de actie Update All selecteren en LCM zal automatisch voldoen aan alle afhankelijkheden tussen de firmware.
  • Als er meerdere hosts worden geselecteerd om firmware-updates uit te voeren, zal LCM User VMs één voor één van de hosts evacueren en ze opstarten in de Phoenix staging area om de updates uit te voeren. Er worden geen User VMs uitgeschakeld en uw workload zou zonder onderbreking bediend moeten blijven worden.
  • Afhankelijk van de firmware die wordt geüpgraded, ziet u mogelijk uw hypervisor meerdere keren opnieuw opstarten in Phoenix. Dit is verwacht gedrag en u moet niet proberen in te grijpen.
  • Zodra de firmware-updates zijn voltooid, start het geselecteerde knooppunt opnieuw op in de hypervisor en wordt de lokale Controller VM ingeschakeld. Zo wordt gecontroleerd of alle clusterservices actief zijn en draaien.
  • Ten slotte zorgt de LCM ervoor dat de lokale hypervisor weer gebruikers-VM's kan hosten voordat de upgrade naar het volgende knooppunt wordt voortgezet.

Hoe lang gaat het duren?

Dit hangt af van het aantal firmware-updates dat op een bepaald knooppunt wordt uitgevoerd en hoe lang het duurt om User VM's van elke host te evacueren. Als referentie:

  • Het upgraden van de SATA DOM-firmware (Phoenix) duurt doorgaans ongeveer 45 minuten per knooppunt.
  • BIOS en BMC-firmware-upgrades (Phoenix) duren doorgaans ongeveer even lang als SATA DOM.
  • BIOS en BMC-firmware-upgrades (Redfish) duren doorgaans 10 tot 15 minuten.
  • De DISK-firmware-upgrade (IVU) duurt korter dan het Phoenix-mechanisme, maar de totale tijd is evenredig met het aantal schijven dat wordt geüpgraded.

Stichting Software

De enige vereiste voor een Foundation-software-upgrade is dat alle CVM's actief zijn en dat de Foundation-service zich in een stopped-state bevindt in het cluster. Deze service wordt doorgaans niet uitgevoerd, tenzij er een LCM-upgrade of Cluster Expand-bewerking plaatsvindt.

Wat gebeurt er als ik op Nu upgraden klik?

De basisbinaries zijn updates voor alle CVM's. Er worden geen actieve services, CVM's of hypervisors opnieuw opgestart.

Hoe lang gaat het duren?

Dit duurt ongeveer een minuut.

Nutanix Cluster Check (NCC)-software

Er zijn geen vereisten voor een NCC-upgrade, behalve dat alle CVM's actief moeten zijn. Bekijk de NCC-gids voor instructies over hoe u kunt upgraden.

Wat gebeurt er als ik op Nu upgraden klik?

De nieuwe NCC-software wordt naar elke CVM gekopieerd en vervolgens wordt de cluster_health-service, die verantwoordelijk is voor de gezondheidsbewaking en de logica die ten grondslag ligt aan clusterwaarschuwingen, op elk knooppunt opnieuw gestart. Er worden geen services opnieuw gestart die betrokken zijn bij het gegevenspad.

Hoe lang gaat het duren?

Dit duurt ongeveer vijf minuten.

Bestandsserver (Nutanix-bestanden) software

Bestanden installeren (of upgraden)

Wat gebeurt er als ik op Nu upgraden klik?

  • Eerst worden de pre-upgrade checks uitgevoerd om te controleren of het cluster kan worden geüpgraded. Als een van de pre-upgrade checks mislukt, ziet u informatie hierover in Prism en start de daadwerkelijke File Server upgrade niet. Gebruikers moeten op Back to Versions klikken en de upgrade opnieuw starten nadat het probleem dat door de pre-checks is gemeld, is opgelost. Bekijk KB-6524 voor de volledige lijst met pre-checks en de bijbehorende artikelen.
  • Zodra de upgrade van de File Server begint, wordt elke File Server VM één voor één geüpgraded naar de nieuwe versie van Nutanix Files. Terwijl een FSVM down is voor de upgrade, kunnen gebruikers die verbonden zijn met shares die door dit knooppunt worden gehost, een verlies van connectiviteit ervaren gedurende een duur van ongeveer 20-30 seconden. Na deze korte periode zal een andere FSVM de hosting van die shares oppakken en krijgen gebruikers weer toegang tot hun bestanden.
  • Nadat elke FSVM opnieuw is opgestart met de nieuwe versie van Nutanix Files, zorgt de upgrade ervoor dat er weer shares kunnen worden gehost voordat de upgrade van de volgende FSVM wordt gestart.

Hoe lang gaat het duren?

Ongeveer 20 minuten per File Server VM.

Aanvullende informatie

Document-ID:HT514179
Oorspronkelijke publicatiedatum:09/08/2022
Laatste gewijzigde datum:09/02/2024