Jak włączyć, wyłączyć i zweryfikować LACP na hostach AHV
Jak włączyć, wyłączyć i zweryfikować LACP na hostach AHV
Jak włączyć, wyłączyć i zweryfikować LACP na hostach AHV
Opis
W tym artykule opisano sposób konfigurowania, włączania, wyłączania i weryfikowania protokołu LACP (Link Aggregation Control Protocol) na hostach AHV za pomocą następujących elementów:
- Korzyści/zalety LACP
- Zalecana konfiguracja przełącznika
- Rozwiązanie
- Konfigurowanie, sprawdzanie i wyłączanie LACP
Aby uzyskać więcej informacji, zobacz Przewodnik po najlepszych praktykach sieciowych AHV n Portal Nutanix zawierający pełną dokumentację dotyczącą konfiguracji sieci dla hostów AHV.
Korzyści/zalety LACP
- Maszyna wirtualna jednego użytkownika z wieloma strumieniami TCP może wykorzystywać przepustowość do 20 Gb/s w węźle AHV z dwoma adapterami 10 GB .
- Algorytm mieszania ruchu, taki jak Balance-TCP, może dzielić ruch pomiędzy wiele łączy w sposób aktywny-aktywny. Ponieważ łącza wysyłające wyglądają jak pojedyncze łącze L2, algorytm może równoważyć ruch pomiędzy elementami obligacji bez względu na tablice adresów MAC przełączników.
- Dzięki LACP wiele łączy do oddzielnych przełączników fizycznych pojawia się jako jedno łącze warstwy 2.
Uwaga: aby używać wielu przełączników nadrzędnych, należy skonfigurować MLAG lub vPC na przełączniku fizycznym.
[ Powrót do góry ]
Zalecana konfiguracja przełącznika
Zaleca się włączenie trybu zastępczego LACP na przełączniku używanym do łączenia węzłów AHV. Przykładowe polecenia znajdziesz poniżej. Informacje na temat przełączników innych dostawców można znaleźć w instrukcjach ich produktów.
Arista:
indywidualny rezerwowy kanał portowy lacp
Nexus Cisco:
brak zawieszenia indywidualnego
**Tryb awaryjny jest domyślnie wyłączony
Katalizator Cisco:
brak możliwości samodzielnego wyłączenia kanału portu
**Tryb awaryjny jest domyślnie wyłączony
Efekty QFX jałowca:
na siłę
** Zobacz Nutanix KB-15541, aby uzyskać szczegółowe informacje na temat przełączników Juniper.
[ Powrót do góry ]
Rozwiązanie
AOS 5.19 lub nowszy
Możliwe jest włączenie LACP za pomocą interfejsu użytkownika Prism Element (PE) lub Prism Central (PC). Więcej informacji na temat przełączników wirtualnych można znaleźć w rozdziale Informacje o przełączniku wirtualnym w Podręczniku administratora AHV . Informacje na temat zarządzania przełącznikami wirtualnymi można znaleźć w rozdziale Tworzenie lub aktualizacja przełącznika wirtualnego .
Istnieje możliwość, że przełącznik wirtualny nie zostanie poprawnie wdrożony z powodu niespójnej konfiguracji powiązań między węzłami, a następnie należy ręcznie zaktualizować konfigurację powiązania, aby konfiguracja powiązania/mostu była zgodna we wszystkich węzłach. NIE używaj poleceń ovs-vsctl do wprowadzania zmian na poziomie mostu (takich jak Wyłącz lub Włącz LACP). Zamiast tego użyj poleceń zarządzaj_ovs .
Przed użyciem Manage_ovs do wprowadzenia zmian na poziomie OVS należy tymczasowo wyłączyć przełącznik wirtualny.
Można wykonać poniższą sekwencję kroków:
- Wyświetl listę przełączników wirtualnych
nutanix@cvm$ acli net.list_virtual_switch
- Wyłącz przełącznik wirtualny w klastrze, uruchamiając poniższe polecenie na maszynie wirtualnej kontrolera (CVM):
nutanix@cvm$ acli net.disable_virtual_switch
- Następnie użyj poleceń Manage_ovs wymienionych w sekcji „ Jak wyłączyć LACP na hoście ”, aby zmienić konfigurację powiązania z LACP na active-backup/balance-slb.
UWAGA : Dla AOS >= 5.19 i < 5.20.2- Występuje znany problem z przełącznikiem wirtualnym, przez który przełącznik wirtualny jest automatycznie tworzony na nowo nawet po jego wyłączeniu. Ten problem został rozwiązany w wersji AOS 5.20.2 i nowszych.
- Jest on automatycznie odtwarzany w scenariuszu, w którym przełącznik wirtualny nie jest obecny w klastrze, a jeden z pierwszych węzłów AHV w klastrze odłącza się od sieci i przywraca łączność sieciową. Możesz prawdopodobnie trafić na ten scenariusz podczas procesu zmiany konfiguracji powiązania na AHV i/lub wprowadzania zmian w konfiguracji portów po stronie przełącznika fizycznego.
- Jeśli przełącznik wirtualny zostanie ponownie włączony z powodu tego problemu, polecenia zarządzające_ovs nie powiedzą się i wyświetli się następujący błąd:
2021-08-24 17:46:20,254Z INFO zarządzaj_ovs:400 UUID dla hosta lokalnego to ecb39f18-fdfe-465e-a944-2506f189ee72 2021-08-24 17:46:20,261Z KRYTYCZNY zarządzaj_ovs:450 Nazwa mostu: br0 jest używana przez przełącznik wirtualny: vs0. Most OVS: br0 używany przez przełącznik wirtualny nie może być modyfikowany za pomocą zarządzaj_ovs.
- W takiej sytuacji wykonaj kroki (a) i (b), aby sprawdzić, czy przełącznik wirtualny jest obecny w klastrze, a następnie wyłącz go ponownie przed przejściem do następnego węzła w celu wprowadzenia zmian w konfiguracji połączenia
- Gdy konfiguracja połączenia zostanie ujednolicona we wszystkich węzłach, przeprowadź migrację odpowiednich mostów do przełączników wirtualnych, jak pokazano w przykładzie poniżej.
nutanix@cvm$ acli net.migrate_br_to_virtual_switch brX vs_name=vsX Przykład: nutanix@cvm$ acli net.migrate_br_to_virtual_switch br0 vs_name=vs0
[ Powrót do góry ]
Metoda ręczna
- Zapoznaj się z Przewodnikiem najlepszych praktyk dotyczących sieci AHV
- Połączone porty agregują fizyczne interfejsy hosta AHV. Domyślnie system tworzy wiązanie o nazwie br0-up w moście br0 zawierającym wszystkie interfejsy fizyczne. Zmiany domyślnej obligacji (br0-up) za pomocą poleceń zarządzaj_ovs mogą spowodować zmianę jej nazwy na bond0 w przypadku korzystania ze starszych przykładów, więc pamiętaj, że nazwa Twojego systemu może być inna niż w poniższych przykładach.
- W poprzednich wersjach tego przewodnika używana była nazwa wiązania bond0 zamiast br0-up (domyślnie była to nazwa bond0). Nutanix zaleca używanie nazwy br0-up, aby szybko zidentyfikować ten interfejs jako łącze nadrzędne br0. Użycie tego schematu nazewnictwa pozwala na łatwe rozróżnienie od siebie łączy w górę dla dodatkowych mostów.
W poniższych przykładach używamy br0-up jako nazwy wiązania zamiast bond0 lub innego niestandardowego schematu nazewnictwa.
OSTRZEŻENIE: Aktualizacja łączy nadrzędnych za pomocą „manage_ovs” spowoduje usunięcie i ponowne utworzenie powiązania z domyślną konfiguracją.
Przed aktualizacją łączy nadrzędnych rozważ następujące kwestie:
- Jeśli używany jest tryb równoważenia obciążenia z aktywną kopią zapasową, aktualizacja łącza zwrotnego może spowodować krótkotrwałe rozłączenie sieci hosta.
- Jeśli używany jest tryb równoważenia obciążenia Balance-slb lub Balance-tcp (LACP), aktualizacja łącza zwrotnego zresetuje konfigurację do aktywnego-pasywnego. Łącza sieciowe korzystające z protokołu LACP przestaną działać w tym momencie, gdy host przestanie odpowiadać na funkcję keepalive. Ten stan można złagodzić, uruchamiając następujące polecenie w lokalnym CVM w AOS w wersjach 5.5.3+ i 5.6.1+:
nutanix@cvm$ zarządzaj_ovs --bridge <nazwa mostu> --interfaces <nazwy interfejsów> --bond_name <nazwa obligacji> --bond_mode balans-tcp --lacp_mode fast --lacp_fallback true update_uplinks
Zdecydowanie zaleca się wprowadzanie zmian w jednym węźle na raz po upewnieniu się, że klaster toleruje awarię węzła. Użycie polecenia allssh zarządzaj_ovs update_uplinks może spowodować awarię klastra. Używaj go tylko wtedy, gdy klaster nie jest w fazie produkcyjnej i nie ma uruchomionych maszyn wirtualnych użytkowników.
[ Powrót do góry ]
Przegląd przepływu pracy
- Połącz się z CVM (VM kontrolera) przez SSH. Upewnij się, że masz połączenie z właściwym CVM, sprawdzając jego nazwę i adres IP.
- Postępuj zgodnie z rozdziałem „Weryfikacja kondycji klastra” w Podręczniku administratora AHV, aby upewnić się, że klaster toleruje awarię węzła. Nie kontynuuj, jeśli klaster nie toleruje awarii co najmniej 1 węzła.
- Umieść węzeł i CVM w pliku tryb konserwacji:
A. Sprawdź dostępność zmiany trybu konserwacji hostów docelowych:
nutanix@cvm$ acli host.enter_maintenance_mode_check <adres IP hosta>
B. Przełącz hosta w tryb konserwacji. Spowoduje to migrację działających maszyn wirtualnych na inne hosty:
nutanix@cvm$ acli host.enter_maintenance_mode <adres IP hosta>
C. Włącz tryb konserwacji dla CVM na hoście docelowym. Ten krok ma na celu zapobieganie wpływowi ewentualnych problemów z łącznością na usługi CVM. Możesz pominąć ten krok, jeśli usługi CVM nie są uruchomione lub klaster się zatrzymał.
nutanix@cvm$ ncli id edycji hosta=<identyfikator hosta> włącz-tryb-konserwacji=true
Uwaga: <identyfikator hosta> można znaleźć w wynikach polecenia „ncli host ls”:
lista hostów ncli
Identyfikator: 00058977-c18c-af17-0000-000000006f89::2872 <--- „2872” to identyfikator hosta
UUID: ddc9d93b-68e0-4220-85f9-63b73d08f0ff
...
- Połącz się z hostem przez IPMI, ponieważ proces konfiguracji LACP może spowodować rozłączenie sieci.
- Wykonaj wymagane kroki konfiguracyjne ( Jak skonfigurować LACP w AHV , Jak wyłączyć LACP na hoście ).
- Po zakończeniu konfiguracji upewnij się, że zarówno host, jak i CVM są dostępne przez sieć. Upewnij się także, że wszystkie karty sieciowe w połączeniu działają, wyłączając łącza jedno po drugim i sprawdzając łączność.
- Jeśli wszystkie testy zakończą się pomyślnie, usuń CVM i węzeł z trybu konserwacji:
A. Na jednym z pozostałych CVM uruchom następującą komendę, aby wyjść z trybu konserwacji odpowiedniego CVM:
nutanix@cvm$ identyfikator edycji hosta ncli=<identyfikator hosta> Enable-Maintenance-mode=false
B. Wyjdź z hosta do trybu konserwacji. Spowoduje to przywrócenie lokalizacji maszyny wirtualnej:
nutanix@cvm$ acli host.exit_maintenance_mode <adres IP hosta>
[ Powrót do góry ]
Jak sprawdzić nazwę obligacji i nazwę mostka/przełącznika?
Uruchom polecenie z CVM, aby uzyskać nazwę powiązania i nazwę przełącznika/mostu:
nutanix@cvm$ zarządzaj_ovs show_uplinks
Przykład
nutanix@cvm$ zarządzaj_ovs show_uplinks Most br1: ---> Nazwa mostu/przełącznika Porty łącza zwrotnego: br1-up ---> nazwa połączenia Ifaces łącza zwrotnego: eth1 eth0 Most br0: ---> Nazwa mostu/przełącznika Porty łącza zwrotnego: br0-up ---> nazwa połączenia Iface'y łącza zwrotnego: eth3 eth2
W tym przykładzie nazwa wiązania to br0-up dla mostka/przełącznika br0 i br1-up dla mostka/przełącznika br1 .
[ Powrót do góry ]
Jak skonfigurować LACP w AHV
Aby zdalnie ponownie skonfigurować określone łącza nadrzędne z innego CVM działającego w trybie innym niż konserwacyjny w klastrze, gdy host docelowy ma dostęp do sieci, użyj komendy zarządzaj_ovs . W razie potrzeby użyj zmiennych:
nutanix@cvm$ zarządzaj_ovs --bridge--interfejsy --nazwa_powiązania --gospodarz --bond_mode balans-tcp --lacp_mode szybki --lacp_fallback prawda update_uplinks
Poniżej znajdziesz przykład:
nutanix@cvm$ zarządzaj_ovs --bridge br0 --interfejsy eth2,eth3 --bond_name br0-up --host hh.hh.hh.hh --bond_mode balans-tcp --lacp_mode fast --lacp_fallback true update_uplinks
Uwaga: rozważ opcje czasu LACP (wolny i szybki). Jeśli przełączniki mają szybką konfigurację, pamiętaj, że musisz także ustawić LACP Nutanix Cluster na tryb szybki. W przeciwnym razie może dojść do awarii z powodu niedopasowania prędkości LACP.
[ Powrót do góry ]
Jak sprawdzić, czy LACP jest skonfigurowany w AHV
Uruchom następujące polecenia.
root@ahv# ovs-appctl bond/show br0-up
root@ahv# ovs-appctl lacp/show br0-up
Przykłady działania:
W przypadku ovs-appctl bond/show zanotuj „ lacp_status: negocjowane ”
root@ahv# ovs-appctl bond/show br0-up
---- br0-up ----
bond_mode: saldo-tcp
obligacja może wykorzystywać recyrkulację: tak, Recirc-ID: 301
podstawa skrótu obligacji: 0
opóźnienie aktualizacji: 0 ms
opóźnienie opóźnienia: 0 ms
następne zrównoważenie: 6757 ms
lacp_status: wynegocjowane
aktywny slave mac: 0c:c4:7a:1e:3e:6e(eth2)
slave eth2: włączone
aktywny niewolnik
may_enable: prawda
skrót 78: obciążenie 127 kB
skrót 108: obciążenie 13 kB
skrót 244: obciążenie 94 kB
slave eth3: włączone
may_enable: prawda
skrót 9: obciążenie 6 kB
skrót 11: obciążenie 11 kB
skrót 23: obciążenie 12 kB
...
W przypadku ovs-appctl lacp/show zanotuj „ status: aktywny wynegocjowany” i „bieżący podłączony ” dla każdego interfejsu:
root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- status: aktywny negocjowany sys_id: 0c:c4:7a:2f:4f:9d sys_priority: 65534 klucz agregacji: 1 lacp_time: powolny niewolnik: eth2: aktualnie podłączony port_id: 1 port_priority: 65535 may_enable: true aktor sys_id: 0c:c4:7a:2f:4f:9d aktor sys_priority: 65534 aktor port_id: 1 aktor port_priority: 65535 aktor klucz: 1 aktor stan: aktywność agregacja synchronizowana zbieranie partner dystrybucyjny sys_id: 00:2b:21:45:2d:12 partner sys_priority: 32768 partner port_id: 39 partner port_priority: 32768 partner klucz: 115 partner state: aktywność agregacja synchronizowana zbieranie dystrybuujący slave: eth3: aktualnie podłączony port_id: 2 port_priority: 65535 may_enable: true aktor sys_id: 0c:c4:7a:2f:4f:9d aktor sys_priority: 65534 aktor port_id: 2 aktor port_priority: 65535 aktor klucz: 1 aktor stan: agregacja aktywności zsynchronizowane zbieranie partner dystrybucyjny sys_id: 00: 2b:21:45:2d:12 partner sys_priority: 32768 partner port_id: 40 partner port_priority: 32768 partner klucz: 115 partner stan: agregacja aktywności synchronizacja zbieranie dystrybucja
Niedziałające przykłady
W przypadku ovs-appctl bond/show zanotuj „ lacp_status: skonfigurowany ”:
root@ahv# ovs-appctl bond/show br0-up ---- br0-up ---- bond_mode: Balance-tcp bond może używać recyrkulacji: nie, Recirc-ID: -1 bond-hash-basis: 0 updelay : Opóźnienie w dół 0 ms: 0 ms lacp_status: skonfigurowane lacp_fallback_ab: prawda, podstawowa aktywna kopia zapasowa:aktywny slave mac: 00:e0:ed:8b:72:a1(eth2) <obcięty>
„skonfigurowany” oznacza, że protokół LACP został skonfigurowany na hoście AHV, ale host nie był w stanie negocjować protokołu LACP z portami przełącznika.
W przypadku ovs-appctl lacp/show br0-up zanotuj „ status: aktywny ” i „ domyślnie podłączony ” dla każdego interfejsu:
root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- status: aktywny sys_id: ac:2f:7b:b6:fe:2e sys_priority: 65534 klucz agregacji: 1 lacp_time: szybki slave: eth0: domyślnie podłączony identyfikator_portu: 2 priorytet_portu: 65535 may_enable: true aktor sys_id: ac:2f:7b:b6:fe:2e aktor sys_priority: 65534 aktor port_id: 2 aktor port_priority: 65535 aktor klucz: 1 aktor stan: limit czasu aktywności agregacja synchronizowana zbieranie dystrybucja domyślny partner sys_id: 00:00:00:00:00:00 partner sys_priority: 0 partner port_id: 0 partner port_priority: 0 partner klucz: 0 partner stan: slave: eth1: domyślnie podłączony port_id: 3 port_priority: 65535 may_enable: true aktor sys_id: ac:2f:7b:b6:fe:2e aktor sys_priority: 65534 aktor port_id: 3 aktor port_priority: 65535 aktor klucz: 1 aktor stan: agregacja limitu czasu aktywności zsynchronizowane zbieranie dystrybucja domyślna
Dane wyjściowe wskazują, że LACP nie został wynegocjowany. Wartość domyślna wskazuje, że host AHV nie odebrał jednostek LACP PDU z przełącznika. Jeśli widzisz tę konfigurację na swoim hoście, sprawdź konfigurację LACP na przełącznikach, do których host jest podłączony.
[ Powrót do góry ]
Jak wyłączyć LACP na hoście
Wykonaj poniższe kroki, aby bezpiecznie wyłączyć LACP na hoście. Sprawdź sekcję „Przegląd przepływu pracy” powyżej, aby zapoznać się z krokami wykonywania zadań przed i po konfiguracji.
- Skonfiguruj hosty tak, aby korzystały z trybu łączenia, który nie wymaga LACP, używając jednego z poniższych poleceń.
A. Poniższe polecenie ustawia zasadę równoważenia obciążenia na active-backup, co oznacza, że używane jest tylko jedno aktywne łącze nadrzędne, a adaptery rezerwowe są używane tylko w przypadku awarii aktywnego adaptera.
nutanix@cvm$ zarządzaj_ovs --bridge--interfejsy --nazwa_powiązania --gospodarz --bond_mode aktywna kopia zapasowa aktualizacja_uplinks
Wszyscy członkowie powiązania muszą być fizycznie połączeni. W przeciwnym razie komenda zarządzaj_ovs wyświetli ostrzeżenie i zakończy działanie bez konfigurowania powiązania. Aby uniknąć tego błędu i zapewnić interfejsy powiązania, nawet jeśli nie są połączone, użyj flagi require_link=false.
nutanix@cvm$ zarządzaj_ovs --bridge--interfejsy --nazwa_powiązania --gospodarz --bond_mode aktywna kopia zapasowa --require_link=false update_uplinks
B. Poniższe polecenie ustawia zasadę równoważenia obciążenia na Balance-slb, która ponownie równoważy ruch maszyny wirtualnej z często używanych do mniej używanych interfejsów i wykorzystuje wszystkie dostępne łącza nadrzędne. Możesz zapoznać się z Przewodnikiem najlepszych praktyk sieciowych AHV , aby dowiedzieć się więcej o zasadach równoważenia obciążenia.
- Wyłącz LACP na portach przełącznika.
[ Powrót do góry ]
Jak znaleźć adres MAC karty sieciowej hosta AHV
Aby znaleźć adres MAC karty sieciowej hosta AHV, użyj jednego z następujących poleceń:
- Wykonaj następujące polecenie na hoście AHV
[root@ahv ~]# ethtool -P <interfejs>
Przykładowe wyjście:
[root@ahv ~]# ethtool -P eth3
Stały adres: 00:25:90:cb:39:27
- Wykonaj następujące polecenie na hoście AHV
[root@ahv ~]# ifconfig <interfejs>
Przykładowe wyjście:
[root@ahv ~]# ifconfig eth3
eth3 Link encap:Ethernet HWaddr 00:25:90:CB:39:27 BROADCAST RUNNING MULTICAST MTU:1500 Metryka:1 Pakiety RX:46857327754 błędy:0 porzucone:228250 przekroczenia:0 ramka:0 Pakiety TX:49134503170 błędy:0 porzucone: 0 przekroczeń: 0 przewoźnik: 0 kolizji: 0 txqueuelen: 1000 bajtów RX: 49893674683483 (45,3 TiB) bajtów TX: 54855610562476 (49,8 TiB)
[ Powrót do góry ]
Dodatkowe informacje
- Nutanix KB 3263 - Oryginalny dokument w portalu Nutanix
- Strona docelowa Nutanix
- Plan wsparcia Lenovo ISG — urządzenie ThinkAgile HX i seria Lenovo Converged HX