Come abilitare, disabilitare e verificare LACP sugli host AHV
Come abilitare, disabilitare e verificare LACP sugli host AHV
Come abilitare, disabilitare e verificare LACP sugli host AHV
Descrizione
Questo articolo illustra come configurare, abilitare, disabilitare e verificare il protocollo LACP (Link Aggregation Control Protocol) sugli host AHV con quanto segue:
- Benefici/Vantaggi del LACP
- Configurazione dell'interruttore consigliata
- Soluzione
- Configurazione, verifica e disabilitazione LACP
Per ulteriori informazioni consultare la guida alle migliori pratiche per la rete AVS i n Portale Nutanix per la documentazione completa sulla configurazione della rete per host AHV.
Benefici/Vantaggi del LACP
- Una VM a utente singolo con più flussi TCP può utilizzare fino a 20 Gbps di larghezza di banda in un nodo AHV con due adattatori da 10 GB .
- Un algoritmo di hashing del traffico come Balance-TCP può suddividere il traffico tra più collegamenti in modo attivo-attivo. Poiché gli uplink appaiono come un singolo collegamento L2, l'algoritmo può bilanciare il traffico tra i membri del legame senza alcun riguardo per le tabelle degli indirizzi MAC dello switch.
- Con LACP, più collegamenti a switch fisici separati appaiono come un singolo collegamento di livello 2.
Nota: per utilizzare più switch upstream, è necessario configurare MLAG o vPC sullo switch fisico.
[ Torna in cima ]
Configurazione dell'interruttore consigliata
Si consiglia di abilitare il fallback LACP sullo switch utilizzato per connettere i nodi AHV. Di seguito sono riportati i comandi di esempio. Per altri fornitori di switch, fare riferimento ai manuali dei prodotti.
Arista:
individuale di fallback lacp port-channel
Cisco Nexus:
nessuna sospensione lacp individuale
**La modalità fallback è disabilitata per impostazione predefinita
Catalizzatore Cisco:
nessuna disabilitazione autonoma del port-channel
**La modalità fallback è disabilitata per impostazione predefinita
QFX di ginepro:
forzare
**Vedi Nutanix KB-15541 per considerazioni specifiche con gli switch Juniper.
[ Torna in cima ]
Soluzione
AOS 5.19 o versione successiva
È possibile abilitare LACP utilizzando l'interfaccia utente Prism Element (PE) o Prism Central (PC). Fare riferimento al capitolo Informazioni sullo switch virtuale della Guida dell'amministratore AHV per ulteriori informazioni sugli switch virtuali. Fare riferimento al capitolo Creazione o aggiornamento di uno switch virtuale per informazioni su come gestire gli switch virtuali.
Esiste la possibilità che uno switch virtuale non venga distribuito correttamente a causa di una configurazione di bond incoerente tra i nodi e quindi la configurazione di bond deve essere aggiornata manualmente per far corrispondere la configurazione di bond/bridge su tutti i nodi. NON utilizzare i comandi ovs-vsctl per apportare modifiche al livello del bridge (come Disabilita o Abilita LACP). Utilizzare invece i comandi Manage_ovs .
Prima di utilizzare Manage_ovs per apportare modifiche al livello OVS, lo switch virtuale deve essere temporaneamente disabilitato.
È possibile seguire la sequenza di passaggi seguente:
- Elenca lo switch virtuale
nutanix@cvm$ acli net.list_virtual_switch
- Disabilitare l'interruttore virtuale sul cluster eseguendo il comando seguente su una VM controller (CVM):
nutanix@cvm$ acli net.disable_virtual_switch
- Quindi utilizzare i comandi Manage_ovs menzionati nella sezione " Come disattivare LACP sull'host " per modificare la configurazione del bond da LACP ad active-backup/balance-slb.
NOTA : per AOS >= 5.19 e < 5.20.2- Esiste un problema noto nello switch virtuale a causa del quale lo switch virtuale viene ricreato automaticamente anche dopo averlo disabilitato. Questo problema è stato risolto a partire da AOS 5.20.2.
- Viene ricreato automaticamente nello scenario in cui lo switch virtuale non è presente nel cluster e uno dei primi nodi AHV nel cluster si disconnette dalla rete e ripristina la connettività di rete. È possibile che si verifichi questo scenario durante il processo di modifica della configurazione del bond su AHV e/o apportando modifiche alla configurazione della porta sul lato dello switch fisico.
- Se lo switch virtuale viene riattivato a causa di questo problema, i comandi Manage_ovs falliranno con il seguente errore:
2021-08-24 17:46:20,254Z INFO Manage_ovs:400 L'UUID per l'host locale è ecb39f18-fdfe-465e-a944-2506f189ee72 2021-08-24 17:46:20,261Z CRITICO manager_ovs:450 Nome del bridge: br0 è utilizzato dallo switch virtuale: vs0. Bridge OVS: br0 utilizzato dallo switch virtuale non può essere modificato con Manage_ovs.
- In una situazione del genere, seguire i passaggi (a) e (b) per verificare se lo switch virtuale è presente sul cluster e quindi disabilitarlo nuovamente prima di passare al nodo successivo per apportare modifiche alla configurazione del bond
- Una volta che la configurazione del bond è stata resa coerente su tutti i nodi, migrare i bridge corrispondenti sugli switch virtuali come mostrato nell'esempio seguente.
nutanix@cvm$ acli net.migrate_br_to_virtual_switch brX vs_name=vsX Esempio: nutanix@cvm$ acli net.migrate_br_to_virtual_switch br0 vs_name=vs0
[ Torna in cima ]
Metodo manuale
- Consultate la guida best practice per la rete AVS
- Le porte collegate aggregano le interfacce fisiche sull'host AHV. Per impostazione predefinita, il sistema crea un collegamento denominato br0-up nel bridge br0 contenente tutte le interfacce fisiche. Le modifiche al bond predefinito (br0-up) utilizzando i comandi Manage_ovs possono rinominarlo in bond0 quando si utilizzano esempi precedenti, quindi tieni presente che il tuo sistema potrebbe avere un nome diverso rispetto agli esempi seguenti.
- Le versioni precedenti di questa guida utilizzavano il nome del bond bond0 invece di br0-up (bond0 era il nome predefinito). Nutanix consiglia di utilizzare il nome br0-up per identificare rapidamente questa interfaccia come uplink del bridge br0. L'utilizzo di questo schema di denominazione consente di distinguere facilmente gli uplink per bridge aggiuntivi gli uni dagli altri.
Negli esempi seguenti, utilizziamo br0-up come nome di bond invece di bond0 o qualsiasi altro schema di denominazione personalizzato.
ATTENZIONE: l'aggiornamento degli uplink utilizzando "manage_ovs" eliminerà e ricreerà il collegamento con la configurazione predefinita.
Considera quanto segue prima di aggiornare gli uplink:
- Se viene utilizzata la modalità di bilanciamento del carico di backup attivo, un aggiornamento del collegamento in salita può causare una breve disconnessione della rete host.
- Se viene utilizzata la modalità di bilanciamento del carico balance-slb o balance-tcp (LACP), un aggiornamento del collegamento in salita ripristinerà la configurazione su attivo-passivo. I collegamenti di rete che si basano su LACP a questo punto verranno interrotti poiché l'host smetterà di rispondere ai keepalive. Questa condizione può essere mitigata eseguendo il comando seguente sul CVM locale nelle versioni AOS 5.5.3+ e 5.6.1+:
nutanix@cvm$ Manage_ovs --bridge <nome bridge> --interfaces <nomi interfacce> --bond_name <nome bond> --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks
Si consiglia vivamente di eseguire modifiche su un nodo alla volta dopo essersi assicurati che il cluster possa tollerare il guasto del nodo. L'utilizzo del comando allssh Manage_ovs update_uplinks potrebbe causare un'interruzione del cluster. Utilizzalo solo se il cluster non è in produzione e non ha VM utente in esecuzione.
[ Torna in cima ]
Panoramica del flusso di lavoro
- Connettersi a CVM (Controller VM) tramite SSH. Assicurati di essere connesso al CVM corretto controllandone il nome e l'IP.
- Seguire il capitolo Verifica dell'integrità del cluster nella Guida all'amministrazione di AHV per assicurarsi che il cluster possa tollerare che il nodo sia inattivo. Non procedere se il cluster non può tollerare il guasto di almeno 1 nodo.
- Inserisci il nodo e il CVM nel file Modalità di manutenzione:
UN. Verifica la disponibilità della modifica della modalità di manutenzione degli host di destinazione:
nutanix@cvm$ acli host.enter_maintenance_mode_check <ip host>
B. Metti l'host in modalità di manutenzione. Ciò migrerà le VM in esecuzione su altri host:
nutanix@cvm$ acli host.enter_maintenance_mode <ip host>
C. Abilita la modalità di manutenzione per il CVM sull'host di destinazione. Questo passaggio serve a evitare che i servizi CVM vengano influenzati da possibili problemi di connettività. Puoi saltare questo passaggio se i servizi CVM non sono in esecuzione o se il cluster si è arrestato.
nutanix@cvm$ ncli host edit id=<ID host> abilita-maintenance-mode=true
Nota: puoi trovare <host ID> nell'output del comando "ncli host ls":
elenco host ncli
ID: 00058977-c18c-af17-0000-000000006f89::2872 <--- "2872" è l'ID host
Uuid: ddc9d93b-68e0-4220-85f9-63b73d08f0ff
...
- Connettersi all'host tramite IPMI, poiché il processo di configurazione LACP potrebbe causare la disconnessione della rete.
- Eseguire i passaggi di configurazione richiesti ( Come configurare LACP in AHV , Come disabilitare LACP sull'host ).
- Una volta completata la configurazione, assicurati che sia l'host che il CVM siano accessibili tramite rete. Inoltre, assicurati che tutte le NIC del collegamento siano operative chiudendo i collegamenti uno per uno e verificando la connettività.
- Se tutti i test vengono completati con successo, rimuovere CVM e nodo dalla modalità di manutenzione:
UN. Da uno degli altri CVM, esegui il comando seguente per uscire dalla modalità di manutenzione del CVM interessato:
nutanix@cvm$ ncli host edit id=<ID host> abilita-maintenance-mode=false
B. Uscire dall'host in modalità di manutenzione. Ciò ripristinerà la località della VM:
nutanix@cvm$ acli host.exit_maintenance_mode <ip host>
[ Torna in cima ]
Come controllare il nome dell'obbligazione e il nome del bridge/switch?
Esegui il comando da CVM per ottenere il nome del bond e il nome dello switch/bridge:
nutanix@cvm$ Manage_ovs show_uplinks
Esempio
nutanix@cvm$ Manage_ovs show_uplinks Bridge br1: ---> Nome del bridge/switch Porte uplink: br1-up ---> nome del bond Iface di uplink: eth1 eth0 Bridge br0: ---> Nome del bridge/switch Porte uplink: br0-up ---> nome del bond Uplink iface: eth3 eth2
In questo esempio, il nome del bond è br0-up per bridge/switch br0 e br1-up per bridge/switch br1 .
[ Torna in cima ]
Come configurare LACP in AHV
Per riconfigurare uplink specifici in remoto da un altro CVM in modalità non di manutenzione nel cluster quando l'host di destinazione ha accesso alla rete, utilizzare il comando Manage_ovs . Utilizzare le variabili secondo necessità:
nutanix@cvm$ manager_ovs --bridge--interfacce --nome_bond --ospite --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks
Vedi sotto per un esempio:
nutanix@cvm$ Manage_ovs --bridge br0 --interfaces eth2,eth3 --bond_name br0-up --host hh.hh.hh.hh --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks
Nota: considerare le opzioni temporali LACP (lento e veloce). Se gli switch hanno una configurazione veloce, tieni presente che devi impostare anche il LACP di Nutanix Cluster in modalità veloce. In caso contrario, potresti subire un'interruzione a causa di una mancata corrispondenza della velocità LACP.
[ Torna in cima ]
Come verificare se LACP è configurato in AHV
Esegui i seguenti comandi.
root@ahv# ovs-appctl bond/show br0-up
root@ahv# ovs-appctl lacp/show br0-up
Esempi di lavoro:
Per il bond/show ovs-appctl , nota " lacp_status:negoziato "
root@ahv# ovs-appctl bond/show br0-up
---- fratello ----
bond_mode: saldo-tcp
il bond può utilizzare il ricircolo: sì, Recirc-ID: 301
base hash bond: 0
ritardo di aggiornamento: 0 ms
ritardo: 0 ms
prossimo ribilanciamento: 6757 ms
lacp_status: negoziato
schiavo attivo mac: 0c:c4:7a:1e:3e:6e(eth2)
schiavo eth2: abilitato
schiavo attivo
may_enable: vero
hash 78: carico 127 kB
hash 108: carico 13 kB
hash 244: carico 94 kB
schiavo eth3: abilitato
may_enable: vero
hash 9: carico di 6 kB
hash 11: carico di 11 kB
hash 23: carico 12 kB
...
Per ovs-appctl lacp/show , annota " status: active negozied " e " current attach " per ciascuna interfaccia:
root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- stato: attivo negoziato sys_id: 0c:c4:7a:2f:4f:9d sys_priority: 65534 chiave di aggregazione: 1 lacp_time: slave lento: eth2: attualmente collegato port_id: 1 port_priority: 65535 may_enable: true actor sys_id: 0c:c4:7a:2f:4f:9d actor sys_priority: 65534 actor port_id: 1 actor port_priority: 65535 actor key: 1 actor state: attività aggregazione sincronizzata raccolta distribuzione partner sys_id: 00:2b:21:45:2d:12 partner sys_priority: 32768 partner port_id: 39 partner port_priority: 32768 chiave partner: 115 stato partner: attività aggregazione sincronizzata raccolta distribuzione slave: eth3: attualmente collegato port_id: 2 port_priority: 65535 may_enable: true actor sys_id: 0c:c4:7a:2f:4f:9d actor sys_priority: 65534 actor port_id: 2 actor port_priority: 65535 actor key: 1 actor state: aggregazione di attività sincronizzata raccolta distribuzione partner sys_id: 00: 2b:21:45:2d:12 partner sys_priority: 32768 partner port_id: 40 partner port_priority: 32768 chiave partner: 115 stato partner: aggregazione di attività sincronizzata raccolta distribuzione
Esempi non funzionanti
Per ovs-appctl bond/show , nota " lacp_status: configurato ":
root@ahv# ovs-appctl bond/show br0-up ---- br0-up ---- bond_mode: balance-tcp bond può utilizzare ricircolo: no, Recirc-ID: -1 bond-hash-basis: 0 updelay : 0 ms downdelay: 0 ms lacp_status: configurato lacp_fallback_ab: true active-backup primario:schiavo attivo mac: 00:e0:ed:8b:72:a1(eth2) <troncato>
"configurato" indica che LACP è stato configurato sull'host AHV, ma l'host non è stato in grado di negoziare LACP con le porte dello switch.
Per ovs-appctl lacp/show br0-up , annota " status: active " e " defaulted attach " per ciascuna interfaccia:
root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- stato: attivo sys_id: ac:2f:7b:b6:fe:2e sys_priority: 65534 chiave di aggregazione: 1 lacp_time: fast slave: eth0: allegato predefinito port_id: 2 port_priority: 65535 may_enable: true actor sys_id: ac:2f:7b:b6:fe:2e actor sys_priority: 65534 actor port_id: 2 actor port_priority: 65535 actor key: 1 actor state: timeout attività aggregazione sincronizzata raccolta distribuzione partner predefinito sys_id: 00:00:00:00:00:00 partner sys_priority: 0 partner port_id: 0 partner port_priority: 0 partner key: 0 partner state: slave: eth1: predefinito collegato port_id: 3 port_priority: 65535 may_enable: true attore sys_id: ac:2f:7b:b6:fe:2e attore sys_priority: 65534 attore port_id: 3 attore port_priority: 65535 chiave attore: 1 stato attore: timeout attività aggregazione sincronizzata raccolta distribuzione predefinita
L'output indica che LACP non è stato negoziato. L'impostazione predefinita indica che l'host AHV non ha ricevuto le PDU LACP dallo switch. Se vedi questa configurazione sul tuo host, controlla la configurazione LACP sugli switch a cui è connesso l'host.
[ Torna in cima ]
Come disabilitare LACP sull'host
Eseguire i seguenti passaggi per disabilitare in modo sicuro LACP sull'host. Controlla la sezione "Panoramica del flusso di lavoro" sopra per i passaggi per eseguire attività di pre e post configurazione.
- Configura gli host per utilizzare una modalità di bonding che non richiede LACP utilizzando uno dei comandi seguenti.
UN. Il comando seguente imposta la policy di bilanciamento del carico su active-backup, il che significa che viene utilizzato solo un uplink attivo e gli adattatori in standby vengono utilizzati solo quando l'adattatore attivo non funziona.
nutanix@cvm$ manager_ovs --bridge--interfacce --nome_bond --ospite --bond_mode active-backup update_uplinks
Tutti i membri del legame devono essere fisicamente connessi, altrimenti il comando Manage_ovs produce un avviso e si chiude senza configurare il legame. Per evitare questo errore e fornire le interfacce del bond anche se non sono connesse, utilizzare il flag require_link=false.
nutanix@cvm$ manager_ovs --bridge--interfacce --nome_bond --ospite --bond_mode active-backup --require_link=false update_uplinks
B. Il comando seguente imposta la policy di bilanciamento del carico su balance-slb, che ribilancia il traffico della VM dalle interfacce molto utilizzate a quelle meno utilizzate e utilizza tutti gli uplink disponibili. Puoi fare riferimento alla Guida alle best practice per la rete AHV per comprendere meglio le policy di bilanciamento del carico.
- Disattiva LACP sulle porte dello switch.
[ Torna in cima ]
Come trovare l'indirizzo MAC di una scheda NIC host AHV
Per trovare l'indirizzo MAC di una scheda NIC host AHV, utilizzare uno dei seguenti comandi:
- Esegui il seguente comando sull'host AHV
[root@ahv ~]# ethtool -P <interfaccia>
Output di esempio:
[root@ahv ~]# ethtool -P eth3
Indirizzo permanente: 00:25:90:cb:39:27
- Esegui il seguente comando sull'host AHV
[root@ahv ~]# ifconfig <interfaccia>
Output di esempio:
[root@ahv ~]# ifconfig eth3
eth3 Link encap:Ethernet HWaddr 00:25:90:CB:39:27 UP BROADCAST RUNNING MULTICAST MTU:1500 Metrico:1 Pacchetti RX:46857327754 errori:0 eliminati:228250 overrun:0 frame:0 Pacchetti TX:49134503170 errori:0 interrotti:0 superamenti:0 operatore:0 collisioni:0 txqueuelen:1000 Byte RX:49893674683483 (45,3 TiB) Byte TX:54855610562476 (49,8 TiB)
[ Torna in cima ]
Informazioni aggiuntive
- Nutanix KB 3263 - Documento originale nel portale Nutanix
- Pagina di destinazione di Nutanix
- Piano di supporto Lenovo ISG: dispositivo ThinkAgile HX e serie Lenovo Converged HX