So aktivieren, deaktivieren und überprüfen Sie LACP auf AHV-Hosts

So aktivieren, deaktivieren und überprüfen Sie LACP auf AHV-Hosts

So aktivieren, deaktivieren und überprüfen Sie LACP auf AHV-Hosts

Dieser Beitrag wurde maschinell übersetzt. Für die englische Originalversion bitte hier klicken.

Beschreibung

Dieser Artikel führt Sie durch die Konfiguration, Aktivierung, Deaktivierung und Überprüfung des Link Aggregation Control Protocol (LACP) auf AHV-Hosts mit Folgendem:

Weitere Informationen finden Sie im AHV Networking Best Practices Guide i n Nutanix-Portal für eine vollständige Dokumentation zur Netzwerkkonfiguration für AHV-Hosts.

Vorteile von LACP

  • Eine einzelne Benutzer-VM mit mehreren TCP-Streams könnte in einem AHV-Knoten mit zwei 10-GB-Adaptern eine Bandbreite von bis zu 20 Gbit/s nutzen.
  • Ein Traffic-Hashing-Algorithmus wie Balance-TCP kann den Verkehr aktiv-aktiv zwischen mehreren Links aufteilen. Da die Uplinks als einzelne L2-Verbindung erscheinen, kann der Algorithmus den Verkehr zwischen den Bond-Mitgliedern ausgleichen, ohne die MAC-Adresstabellen der Switches zu berücksichtigen.
  • Mit LACP werden mehrere Links zu separaten physischen Switches als ein einziger Layer-2-Link angezeigt.
    Hinweis: Um mehrere Upstream-Switches zu verwenden, müssen Sie MLAG oder vPC auf dem physischen Switch konfigurieren.

[ Zurück nach oben ]

Empfohlene Switch-Konfiguration

Es wird empfohlen, LACP-Fallback auf dem Switch zu aktivieren, der zum Verbinden der AHV-Knoten verwendet wird. Beispielbefehle finden Sie weiter unten. Informationen zu anderen Switch-Anbietern finden Sie in deren Produkthandbüchern.

Arista:

 Port-Channel-LACP-Fallback individuell

Cisco Nexus:

 kein lacp suspend-individual

**Der Fallback-Modus ist standardmäßig deaktiviert

Cisco-Katalysator:

 kein Port-Channel-Standalone-Deaktivierung

**Der Fallback-Modus ist standardmäßig deaktiviert

Juniper QFX:

 Erzwingen

**Spezifische Überlegungen zu Juniper-Switches finden Sie unter Nutanix KB-15541 .

[ Zurück nach oben ]

Lösung

AOS 5.19 oder neuer

Es ist möglich, LACP über die Benutzeroberfläche von Prism Element (PE) oder Prism Central (PC) zu aktivieren. Weitere Informationen zu virtuellen Switches finden Sie im Kapitel „Über virtuelle Switches“ des AHV-Administratorhandbuchs . Informationen zum Verwalten virtueller Switches finden Sie im Kapitel „Erstellen oder Aktualisieren eines virtuellen Switches“ .

Es besteht die Möglichkeit, dass ein virtueller Switch aufgrund inkonsistenter Bond-Konfigurationen über alle Knoten hinweg nicht ordnungsgemäß bereitgestellt wird. Anschließend muss die Bond-Konfiguration manuell aktualisiert werden, damit die Bond-/Bridge-Konfiguration auf allen Knoten übereinstimmt. Verwenden Sie KEINE ovs-vsctl- Befehle, um Änderungen auf Bridge-Ebene vorzunehmen (wie z. B. Deaktivieren oder Aktivieren von LACP). Verwenden Sie stattdessen manage_ovs- Befehle.
Bevor Sie manage_ovs verwenden, um Änderungen auf OVS-Ebene vorzunehmen, muss der virtuelle Switch vorübergehend deaktiviert werden.

Sie können die folgende Schrittfolge befolgen:

  1. Virtuellen Switch auflisten
     nutanix@cvm$ acli net.list_virtual_switch
    
  1. Deaktivieren Sie den virtuellen Switch im Cluster, indem Sie den folgenden Befehl auf einer Controller-VM (CVM) ausführen:
     nutanix@cvm$ acli net.disable_virtual_switch
    
  1. Verwenden Sie dann die im Abschnitt „ So deaktivieren Sie LACP auf dem Host “ genannten manage_ovs- Befehle, um die Bond-Konfiguration von LACP in Active-Backup/Balance-SLB zu ändern.
    HINWEIS : Für AOS >= 5.19 und < 5.20.2
    • Es gibt ein bekanntes Problem mit dem virtuellen Switch, aufgrund dessen der virtuelle Switch automatisch neu erstellt wird, selbst nachdem er deaktiviert wurde. Dieses Problem wurde ab AOS 5.20.2 behoben.
    • Es wird automatisch neu erstellt, wenn im Cluster kein virtueller Switch vorhanden ist und einer der ersten AHV-Knoten im Cluster die Verbindung zum Netzwerk trennt und die Netzwerkkonnektivität wiederherstellt. Dieses Szenario kann möglicherweise während des Vorgangs der Änderung der Bond-Konfiguration auf AHV und/oder der Portkonfigurationsänderungen auf der Seite des physischen Switches auftreten.
    • Wenn der virtuelle Switch aufgrund dieses Problems erneut aktiviert wird, schlagen manage_ovs-Befehle mit folgendem Fehler fehl:
       2021-08-24 17:46:20,254Z INFO manage_ovs:400 UUID für lokalen Host ist ecb39f18-fdfe-465e-a944-2506f189ee72
      24.08.2021 17:46:20,261Z KRITISCH manage_ovs:450 Brückenname: br0 wird vom virtuellen Switch verwendet: vs0. OVS-Brücke: br0, die vom virtuellen Switch verwendet wird, kann nicht mit manage_ovs geändert werden.
    • Führen Sie in einer solchen Situation die Schritte (a) und (b) aus, um zu prüfen, ob im Cluster ein virtueller Switch vorhanden ist. Deaktivieren Sie ihn anschließend erneut, bevor Sie zum nächsten Knoten wechseln, um Änderungen an der Bond-Konfiguration vorzunehmen.
  1. Sobald die Bond-Konfiguration auf allen Knoten konsistent ist, migrieren Sie die entsprechenden Brücken zu virtuellen Switches, wie im folgenden Beispiel gezeigt.
     nutanix@cvm$ acli net.migrate_br_to_virtual_switch brX vs_name=vsX
    
    Beispiel:
    nutanix@cvm$ acli net.migrate_br_to_virtual_switch br0 vs_name=vs0

[ Zurück nach oben ]

Manuelle Methode

  • Siehe AHV Networking Best Practices Guide
  • Verbundene Ports aggregieren die physischen Schnittstellen auf dem AHV-Host. Standardmäßig erstellt das System eine Verbindung namens br0-up in Bridge br0 , die alle physischen Schnittstellen enthält. Änderungen an der Standardverbindung (br0-up) mithilfe von manage_ovs -Befehlen können diese bei Verwendung älterer Beispiele in bond0 umbenennen. Denken Sie also daran, dass Ihr System möglicherweise anders benannt ist als die Beispiele unten.
  • Frühere Versionen dieses Handbuchs verwendeten den Bond-Namen „bond0“ statt „br0-up“ (bond0 war früher der Standard). Nutanix empfiehlt die Verwendung des Namens „br0-up“, um diese Schnittstelle schnell als Bridge-br0-Uplink zu identifizieren. Mithilfe dieses Namensschemas können Uplinks für zusätzliche Bridges leicht voneinander unterschieden werden.

In den folgenden Beispielen verwenden wir br0-up als Anleihennamen anstelle von bond0 oder einem anderen benutzerdefinierten Benennungsschema.

WARNUNG: Durch das Aktualisieren von Uplinks mit „manage_ovs“ wird die Bindung gelöscht und mit der Standardkonfiguration neu erstellt.
Beachten Sie Folgendes, bevor Sie Uplinks aktualisieren:

  • Wenn der Active-Backup-Lastausgleichsmodus verwendet wird, kann eine Uplink-Aktualisierung eine kurze Trennung des Hostnetzwerks verursachen.
  • Wenn der Lastausgleichsmodus „balance-slb“ oder „balance-tcp“ (LACP) verwendet wird, setzt ein Uplink-Update die Konfiguration auf „aktiv-passiv“ zurück. Netzwerkverbindungen, die auf LACP angewiesen sind, werden an diesem Punkt unterbrochen, da der Host nicht mehr auf Keepalives reagiert. Dieser Zustand kann gemildert werden, indem der folgende Befehl auf dem lokalen CVM in den AOS-Versionen 5.5.3+ und 5.6.1+ ausgeführt wird:
     nutanix@cvm$ manage_ovs --bridge <Brückenname> --interfaces <Schnittstellennamen> --bond_name <Bondname> --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks

Es wird dringend empfohlen, Änderungen nur an einem Knoten gleichzeitig vorzunehmen, nachdem sichergestellt wurde, dass der Cluster Knotenausfälle tolerieren kann. Die Verwendung des Befehls allssh manage_ovs update_uplinks kann zu einem Clusterausfall führen. Verwenden Sie ihn nur, wenn der Cluster nicht in Produktion ist und keine Benutzer-VMs ausgeführt werden.

[ Zurück nach oben ]

Workflow-Übersicht

  1. Stellen Sie über SSH eine Verbindung zu CVM (Controller VM) her. Stellen Sie sicher, dass Sie mit dem richtigen CVM verbunden sind, indem Sie dessen Namen und IP überprüfen.
  2. Befolgen Sie das Kapitel „Überprüfen der Clusterintegrität“ im AHV-Administrationshandbuch, um sicherzustellen, dass der Cluster einen ausgefallenen Knoten tolerieren kann. Fahren Sie nicht fort, wenn der Cluster den Ausfall von mindestens einem Knoten nicht tolerieren kann.
  3. Legen Sie den Knoten und CVM in die Wartungsmodus:

a. Überprüfen Sie, ob der Wartungsmodus der Zielhosts geändert werden kann:

 nutanix@cvm$ acli host.enter_maintenance_mode_check <Host-IP>

b. Setzen Sie den Host in den Wartungsmodus. Dadurch werden laufende VMs auf andere Hosts migriert:

 nutanix@cvm$ acli host.enter_maintenance_mode <Host-IP>

c. Aktivieren Sie den Wartungsmodus für den CVM auf dem Zielhost. Dieser Schritt dient dazu, zu verhindern, dass CVM-Dienste durch mögliche Verbindungsprobleme beeinträchtigt werden. Sie können diesen Schritt überspringen, wenn die CVM-Dienste nicht ausgeführt werden oder der Cluster angehalten wurde.

 nutanix@cvm$ ncli host edit id=<Host-ID> enable-maintenance-mode=true

Hinweis: Sie finden die <Host-ID> in der Ausgabe des Befehls „ncli host ls“:

 ncli-Hostliste
Id: 00058977-c18c-af17-0000-000000006f89::2872 <--- "2872" ist die Host-ID
Uuid: ddc9d93b-68e0-4220-85f9-63b73d08f0ff
...
  1. Stellen Sie über IPMI eine Verbindung zum Host her, da der LACP-Konfigurationsprozess zu einer Netzwerktrennung führen kann.
  2. Führen Sie die erforderlichen Konfigurationsschritte durch ( So konfigurieren Sie LACP in AHV , So deaktivieren Sie LACP auf dem Host ).
  3. Stellen Sie nach Abschluss der Konfiguration sicher, dass sowohl Host als auch CVM über das Netzwerk erreichbar sind. Stellen Sie außerdem sicher, dass alle Netzwerkkarten im Verbund betriebsbereit sind, indem Sie die Verbindungen nacheinander beenden und die Konnektivität überprüfen.
  4. Wenn alle Tests erfolgreich abgeschlossen sind, entfernen Sie CVM und Knoten aus dem Wartungsmodus:

a. Führen Sie von einem der anderen CVMs den folgenden Befehl aus, um den Wartungsmodus des betroffenen CVMs zu beenden:

 nutanix@cvm$ ncli host edit id=<Host-ID> enable-maintenance-mode=false

b. Beenden Sie den Host im Wartungsmodus. Dadurch wird die VM-Lokalität wiederhergestellt:

 nutanix@cvm$ acli host.exit_maintenance_mode <Host-IP>

[ Zurück nach oben ]

Wie überprüfe ich den Bond-Namen und den Bridge-/Switch-Namen?

Führen Sie den Befehl von CVM aus, um den Bond-Namen und den Switch-/Bridge-Namen abzurufen:

 nutanix@cvm$ manage_ovs show_uplinks

Beispiel

 nutanix@cvm$ manage_ovs show_uplinks
Bridge br1: ---> Bridge-/Switch-Name
  Uplink-Ports: br1-up ---> Bond-Name
  Uplink-IFaces: eth1 eth0

Bridge br0: ---> Bridge-/Switch-Name
  Uplink-Ports: br0-up ---> Bond-Name
  Uplink-IFaces: eth3 eth2

In diesem Beispiel lautet der Bond-Name br0-up für Bridge/Switch br0 und br1-up für Bridge/Switch br1 .

[ Zurück nach oben ]

So konfigurieren Sie LACP in AHV

Um bestimmte Uplinks remote von einem anderen CVM im Cluster, der sich nicht im Wartungsmodus befindet, neu zu konfigurieren, wenn der Zielhost Netzwerkzugriff hat, verwenden Sie den Befehl manage_ovs . Verwenden Sie nach Bedarf Variablen:

 nutanix@cvm$ manage_ovs --bridge 
  
  --Schnittstellen 
   
  
   --Bindungsname 
    
   
     --Gastgeber 
     
    
     --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks
     
    
    
    
   
   
   
  
  
  
 

Nachfolgend sehen Sie ein Beispiel:

 nutanix@cvm$ manage_ovs --bridge br0 --interfaces eth2,eth3 --bond_name br0-up --host hh.hh.hh.hh --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks

Hinweis: Beachten Sie die LACP-Zeitoptionen (langsam und schnell). Wenn die Switches eine schnelle Konfiguration haben, denken Sie daran, dass Sie auch das LACP des Nutanix-Clusters auf den schnellen Modus einstellen müssen. Andernfalls kann es aufgrund einer Nichtübereinstimmung der LACP-Geschwindigkeit zu einem Ausfall kommen.

[ Zurück nach oben ]

So überprüfen Sie, ob LACP in AHV konfiguriert ist

Führen Sie die folgenden Befehle aus.

 root@ahv# ovs-appctl Bindung/zeigen br0-up 
root@ahv# ovs-appctl lacp/show br0-up

Arbeitsbeispiele:

Für die ovs-appctl bond/show , notieren Sie " lacp_status: negotiation "

 root@ahv# ovs-appctl Bindung/zeigen br0-up  
---- Bruder hoch ----  
Bond_Modus: Balance-TCP  
Anleihe darf Rezirkulation nutzen: ja, Recirc-ID: 301  
Bond-Hash-Basis: 0  
Hochlaufzeit: 0 ms  
Downdelay: 0 ms  
nächste Neuverteilung: 6757 ms  
lacp_status: ausgehandelt  
aktiver Slave-Mac: 0c:c4:7a:1e:3e:6e(eth2)  
  
Slave eth2: aktiviert  
        aktiver Sklave  
        may_enable: wahr  
        Hash 78: 127 kB laden  
        Hash 108: 13 kB laden  
        Hash 244: 94 kB laden  
  
Slave eth3: aktiviert  
        may_enable: wahr  
        Hash 9: 6 kB laden  
        Hash 11: 11 kB laden  
        Hash 23: 12 kB laden  
...

Beachten Sie für ovs-appctl lacp/showstatus: aktiv ausgehandelt“ und „aktuell angeschlossen “ für jede Schnittstelle:

 root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- Status: aktiv ausgehandelt sys_id: 0c:c4:7a:2f:4f:9d sys_priority: 65534 Aggregationsschlüssel: 1 lacp_time: langsam Slave: eth2: aktuell angeschlossen port_id: 1 port_priority: 65535 may_enable: true Akteur sys_id: 0c:c4:7a:2f:4f:9d Akteur sys_priority: 65534 Akteur port_id: 1 Akteur port_priority: 65535 Akteurschlüssel: 1 Akteurstatus: Aktivität Aggregation synchronisiert Sammeln Verteilen Partner sys_id: 00:2b:21:45:2d:12 Partner sys_priority: 32768 Partner port_id: 39 Partner Portpriorität: 32768 Partnerschlüssel: 115 Partnerstatus: Aktivitätsaggregation, synchronisiertes Sammeln, Verteilen, Slave: eth3: aktuell angeschlossene Port-ID: 2 Portpriorität: 65535 may_enable: true Akteur-Sys-ID: 0c:c4:7a:2f:4f:9d Akteur-Sys-ID: 65534 Akteur-Port-ID: 2 Akteur-Portpriorität: 65535 Akteurschlüssel: 1 Akteurstatus: Aktivitätsaggregation, synchronisiertes Sammeln, Verteilen, Partner-Sys-ID: 00:2b:21:45:2d:12 Partner-Sys-Priorität: 32768 Partner-Port-ID: 40 Partner-Portpriorität: 32768 Partnerschlüssel: 115 Partnerstatus: Aktivitätsaggregation, synchronisiertes Sammeln, Verteilen

Nicht funktionierende Beispiele

Für ovs-appctl bond/show beachten Sie " lacp_status: configured ":

 root@ahv# ovs-appctl bond/show br0-up ---- br0-up ---- bond_mode: balance-tcp Bond darf Recirculation verwenden: nein, Recirc-ID: -1 bond-hash-basis: 0 Updelay: 0 ms Downdelay: 0 ms lacp_status: konfiguriert lacp_fallback_ab: true Active-Backup primär: 
  
  aktiver Slave-Mac: 00:e0:ed:8b:72:a1(eth2) < gekürzt >
  
 

„konfiguriert“ bedeutet, dass LACP auf dem AHV-Host konfiguriert wurde, der Host jedoch nicht in der Lage war, LACP mit den Switch-Ports auszuhandeln.

Beachten Sie für ovs-appctl lacp/show br0-upstatus: active “ und „ defaulted attached “ für jede Schnittstelle:

 root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- Status: aktiv sys_id: ac:2f:7b:b6:fe:2e sys_priority: 65534 Aggregationsschlüssel: 1 lacp_time: schnell Slave: eth0: standardmäßig angeschlossen Port-ID: 2 Port-Priorität: 65535 may_enable: true Akteur sys_id: ac:2f:7b:b6:fe:2e Akteur sys_priority: 65534 Akteur Port-ID: 2 Akteur Port-Priorität: 65535 Akteurschlüssel: 1 Akteurstatus: Aktivitäts-Timeout Aggregation synchronisiert Sammeln Verteilen standardmäßig Partner sys_id: 00:00:00:00:00:00 Partner sys_priority: 0 Partner Port-ID: 0 Partner Port-Priorität: 0 Partner Schlüssel: 0 Partnerstatus: Slave: eth1: standardmäßig verbunden Port-ID: 3 Port-Priorität: 65535 may_enable: true Akteur-Sys-ID: ac:2f:7b:b6:fe:2e Akteur-Sys-Priorität: 65534 Akteur-Port-ID: 3 Akteur-Port-Priorität: 65535 Akteur-Schlüssel: 1 Akteurstatus: Aktivitäts-Timeout, Aggregation, synchronisiert, Sammeln, Verteilen, standardmäßig

Die Ausgabe zeigt an, dass LACP nicht ausgehandelt wurde. „Standardmäßig“ bedeutet, dass der AHV-Host keine LACP-PDUs vom Switch erhalten hat. Wenn Sie diese Konfiguration auf Ihrem Host sehen, überprüfen Sie die LACP-Konfiguration auf den Switches, mit denen der Host verbunden ist.

[ Zurück nach oben ]

So deaktivieren Sie LACP auf dem Host

Führen Sie die folgenden Schritte aus, um LACP auf dem Host sicher zu deaktivieren. Im Abschnitt „Workflow-Übersicht“ oben finden Sie Schritte zum Ausführen von Aufgaben vor und nach der Konfiguration.

  1. Konfigurieren Sie Hosts mit einem der folgenden Befehle für die Verwendung eines Bonding-Modus, der kein LACP erfordert.

a. Der folgende Befehl legt die Lastausgleichsrichtlinie auf Active-Backup fest. Dies bedeutet, dass nur ein aktiver Uplink verwendet wird und Standby-Adapter nur verwendet werden, wenn der aktive Adapter ausfällt.

 nutanix@cvm$ manage_ovs --bridge 
  
  --Schnittstellen 
   
  
   --Bindungsname 
    
   
     --Gastgeber 
     
    
     --bond_mode aktive-sicherung update_uplinks
     
    
    
    
   
   
   
  
  
  
 

Alle Mitglieder der Bindung müssen physisch verbunden sein, sonst erzeugt der Befehl manage_ovs eine Warnung und wird beendet, ohne die Bindung zu konfigurieren. Um diesen Fehler zu vermeiden und Schnittstellen der Bindung bereitzustellen, auch wenn sie nicht verbunden sind, verwenden Sie das Flag require_link=false.

 nutanix@cvm$ manage_ovs --bridge 
  
  --Schnittstellen 
   
  
   --Bindungsname 
    
   
     --Gastgeber 
     
    
     --bond_mode aktives Backup --require_link=false Update_Uplinks
     
    
    
    
   
   
   
  
  
  
 

b. Der folgende Befehl legt die Lastausgleichsrichtlinie auf „balance-slb“ fest, wodurch der VM-Verkehr von stark genutzten zu weniger genutzten Schnittstellen neu verteilt wird und alle verfügbaren Uplinks verwendet werden. Weitere Informationen zu den Lastausgleichsrichtlinien finden Sie im AHV Networking Best Practices Guide .

  1. Schalten Sie LACP an den Switch-Ports aus.

[ Zurück nach oben ]

So finden Sie die MAC-Adresse einer AHV-Host-NIC

Um die MAC-Adresse einer AHV-Host-NIC zu finden, verwenden Sie einen der folgenden Befehle:

  • Führen Sie den folgenden Befehl auf dem AHV-Host aus
 [root@ahv ~]# ethtool -P <Schnittstelle>

Beispielausgabe:

 [root@ahv ~]# ethtool -P eth3
Ständige Adresse: 00:25:90:cb:39:27
  • Führen Sie den folgenden Befehl auf dem AHV-Host aus
 [root@ahv ~]# ifconfig <Schnittstelle>

Beispielausgabe:

 [root@ahv ~]# ifconfig eth3
eth3 Link encap:Ethernet HWaddr 00:25:90:CB:39:27 UP BROADCAST RUNNING MULTICAST MTU:1500 Metrik:1 RX-Pakete:46857327754 Fehler:0 verworfen:228250 Überläufe:0 Frame:0 TX-Pakete:49134503170 Fehler:0 verworfen:0 Überläufe:0 Träger:0 Kollisionen:0 txqueuelen:1000 RX-Bytes:49893674683483 (45,3 TiB) TX-Bytes:54855610562476 (49,8 TiB)

[ Zurück nach oben ]

Weitere Informationen

Dokumenten-ID:HT516513
Ursprüngliches Veröffentlichungsdatum:05/21/2024
Datum der letzten Änderung:05/30/2024