Cómo habilitar, deshabilitar y verificar LACP en hosts AHV

Cómo habilitar, deshabilitar y verificar LACP en hosts AHV

Cómo habilitar, deshabilitar y verificar LACP en hosts AHV

Este es un artículo traducido automáticamente. Haga clic aquí para ver la versión original en inglés.

Descripción

Este artículo lo guía a través de la configuración, habilitación, deshabilitación y verificación del Protocolo de control de agregación de enlaces (LACP) en hosts AHV con lo siguiente:

Para obtener más información, consulte la Guía de mejores prácticas de redes de AHV i n Portal Nutanix para obtener documentación completa sobre la configuración de redes para hosts AHV.

Beneficios/Ventajas de LACP

  • Una máquina virtual de un solo usuario con múltiples flujos TCP podría usar hasta 20 Gbps de ancho de banda en un nodo AHV con dos adaptadores de 10 GB .
  • Un algoritmo de hash de tráfico como balance-TCP puede dividir el tráfico entre múltiples enlaces de forma activo-activo. Debido a que los enlaces ascendentes aparecen como un único enlace L2, el algoritmo puede equilibrar el tráfico entre los miembros del enlace sin tener en cuenta las tablas de direcciones MAC del conmutador.
  • Con LACP, varios enlaces a conmutadores físicos separados aparecen como un único enlace de capa 2.
    Nota: Para utilizar varios conmutadores ascendentes, debe configurar MLAG o vPC en el conmutador físico.

[ Volver arriba ]

Configuración de interruptor recomendada

Se recomienda habilitar el respaldo de LACP en el conmutador utilizado para conectar los nodos AHV. Los comandos de muestra se pueden encontrar a continuación. Para otros proveedores de conmutadores, consulte los manuales de sus productos.

Arista:

 puerto-canal lacp reserva individual

Nexo de Cisco:

 sin lacp suspender-individual

**El modo alternativo está deshabilitado de forma predeterminada

Catalizador de Cisco:

 sin canal de puerto independiente-deshabilitado

**El modo alternativo está deshabilitado de forma predeterminada

Enebro QFX:

 vigente hasta

**Consulte Nutanix KB-15541 para conocer consideraciones específicas con los interruptores Juniper.

[ Volver arriba ]

Solución

AOS 5.19 o más reciente

Es posible habilitar LACP utilizando la interfaz de usuario de Prism Element (PE) o Prism Central (PC). Consulte el capítulo Acerca del conmutador virtual de la Guía de administración de AHV para obtener más información sobre los conmutadores virtuales. Consulte el capítulo Creación o actualización de un conmutador virtual para obtener información sobre cómo administrar conmutadores virtuales.

Existe la posibilidad de que un conmutador virtual no se implemente correctamente debido a una configuración de enlace inconsistente entre los nodos, y luego la configuración de enlace debe actualizarse manualmente para que la configuración de enlace/puente coincida en todos los nodos. NO utilice comandos ovs-vsctl para realizar cambios en el nivel del puente (como Deshabilitar o Habilitar LACP). En su lugar, utilice los comandos Manage_ovs .
Antes de usar Manage_ovs para realizar cambios en el nivel de OVS, el conmutador virtual debe desactivarse temporalmente.

Se puede seguir la siguiente secuencia de pasos:

  1. Listar conmutador virtual
     nutanix@cvm$ acli net.list_virtual_switch
    
  1. Deshabilite el conmutador virtual en el clúster ejecutando el siguiente comando en una VM controladora (CVM):
     nutanix@cvm$ acli net.disable_virtual_switch
    
  1. Luego use los comandos de Manage_ovs mencionados en la sección " Cómo deshabilitar LACP en el host " para cambiar la configuración de enlace de LACP a active-backup/balance-slb.
    NOTA : Para AOS >= 5.19 y < 5.20.2
    • Existe un problema conocido en el conmutador virtual debido a que el conmutador virtual se recrea automáticamente incluso después de deshabilitarlo. Este problema se solucionó en AOS 5.20.2 en adelante.
    • Se recrea automáticamente en un escenario en el que el conmutador virtual no está presente en el clúster y uno de los primeros nodos AHV del clúster se desconecta de la red y restaura la conectividad de la red. Posiblemente pueda llegar a este escenario durante el proceso de cambiar la configuración del enlace en AHV y/o realizar cambios en la configuración del puerto en el lado del conmutador físico.
    • Si el conmutador virtual se vuelve a habilitar debido a este problema, los comandos Manage_ovs fallarán con el siguiente error:
       2021-08-24 17:46:20,254Z INFORMACIÓN manager_ovs:400 UUID para el host local es ecb39f18-fdfe-465e-a944-2506f189ee72
      2021-08-24 17:46:20,261Z CRÍTICO manager_ovs:450 Nombre del puente: br0 es utilizado por el conmutador virtual: vs0. Puente OVS: el br0 utilizado por el conmutador virtual no se puede modificar con Manage_ovs.
    • En tal situación, siga los pasos (a) y (b) para verificar si el conmutador virtual está presente en el clúster y luego deshabilítelo nuevamente antes de pasar al siguiente nodo para realizar cambios en la configuración del enlace.
  1. Una vez que la configuración del enlace sea coherente en todos los nodos, migre los puentes correspondientes a los conmutadores virtuales como se muestra en el ejemplo siguiente.
     nutanix@cvm$ acli net.migrate_br_to_virtual_switch brX vs_name=vsX
    
    Ejemplo:
    nutanix@cvm$ acli net.migrate_br_to_virtual_switch br0 vs_name=vs0

[ Volver arriba ]

Método manual

  • Consulte la Guía de mejores prácticas de redes de AHV
  • Los puertos vinculados agregan las interfaces físicas en el host AHV. De forma predeterminada, el sistema crea un enlace denominado br0-up en el puente br0 que contiene todas las interfaces físicas. Los cambios al enlace predeterminado (br0-up) usando los comandos de Manage_ovs pueden cambiarle el nombre a bond0 cuando se usan ejemplos más antiguos, así que tenga en cuenta que su sistema puede tener un nombre diferente al de los ejemplos siguientes.
  • Las versiones anteriores de esta guía usaban el nombre del bono bond0 en lugar de br0-up (bond0 solía ser el predeterminado). Nutanix recomienda utilizar el nombre br0-up para identificar rápidamente esta interfaz como el enlace ascendente del puente br0. El uso de este esquema de nombres permite distinguir fácilmente los enlaces ascendentes de puentes adicionales entre sí.

En los ejemplos siguientes, utilizamos br0-up como nombre de enlace en lugar de bond0 o cualquier otro esquema de nomenclatura personalizado.

ADVERTENCIA: La actualización de los enlaces superiores mediante "manage_ovs" eliminará y volverá a crear el enlace con la configuración predeterminada.
Considere lo siguiente antes de actualizar los enlaces superiores:

  • Si se utiliza el modo de equilibrio de carga de respaldo activo, una actualización del enlace ascendente puede provocar una breve desconexión de la red del host.
  • Si se utiliza el modo de equilibrio de carga balance-slb o balance-tcp (LACP), una actualización del enlace ascendente restablecerá la configuración a activo-pasivo. Los enlaces de red que dependen de LACP dejarán de funcionar en este punto cuando el host deje de responder a keepalives. Esta condición se puede mitigar ejecutando el siguiente comando en el CVM local en las versiones de AOS 5.5.3+ y 5.6.1+:
     nutanix@cvm$ Manage_ovs --bridge <nombre del puente> --interfaces <nombres de las interfaces> --bond_name <nombre del enlace> --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks

Se recomienda encarecidamente realizar cambios en un nodo a la vez después de asegurarse de que el clúster puede tolerar fallas en los nodos. El uso del comando allssh Manage_ovs update_uplinks puede provocar una interrupción del clúster. Úselo solo si el clúster no está en producción y no tiene máquinas virtuales de usuario en ejecución.

[ Volver arriba ]

Descripción general del flujo de trabajo

  1. Conéctese a CVM (Controlador VM) a través de SSH. Asegúrese de estar conectado al CVM correcto comprobando su nombre e IP.
  2. Siga el capítulo Verificación del estado del clúster en la Guía de administración de AHV para asegurarse de que el clúster pueda tolerar que el nodo esté inactivo. No continúe si el clúster no puede tolerar la falla de al menos 1 nodo.
  3. Coloque el nodo y el CVM en el modo de mantenimiento:

a. Verifique la disponibilidad para cambiar el modo de mantenimiento de los hosts de destino:

 nutanix@cvm$ acli host.enter_maintenance_mode_check <ip del host>

b. Ponga el host en modo de mantenimiento. Esto migrará las máquinas virtuales en ejecución a otros hosts:

 nutanix@cvm$ acli host.enter_maintenance_mode <ip del host>

C. Habilite el modo de mantenimiento para el CVM en el host de destino. Este paso es para evitar que los servicios CVM se vean afectados por un posible problema de conectividad. Puede omitir este paso si los servicios CVM no se están ejecutando o si el clúster se ha detenido.

 nutanix@cvm$ ncli host edit id=<host ID> enable-maintenance-mode=true

Nota: Puede encontrar <host ID> en el resultado del comando "ncli host ls":

 lista de hosts ncli
    ID: 00058977-c18c-af17-0000-000000006f89::2872 <--- "2872" es el ID del host
    Usuario: ddc9d93b-68e0-4220-85f9-63b73d08f0ff
...
  1. Conéctese al host a través de IPMI, ya que el proceso de configuración de LACP podría provocar la desconexión de la red.
  2. Realice los pasos de configuración requeridos ( Cómo configurar LACP en AHV , Cómo deshabilitar LACP en el host ).
  3. Una vez completada la configuración, asegúrese de que tanto el host como el CVM sean accesibles a través de la red. Además, asegúrese de que todas las NIC del enlace estén operativas cerrando los enlaces uno por uno y verificando la conectividad.
  4. Si todas las pruebas se completan con éxito, elimine CVM y el nodo del modo de mantenimiento:

a. Desde uno de los otros CVM, ejecute el siguiente comando para salir del modo de mantenimiento del CVM afectado:

 nutanix@cvm$ ncli host edit id=<host ID> enable-maintenance-mode=false

b. Salga del host en modo de mantenimiento. Esto restaurará la localidad de la VM:

 nutanix@cvm$ acli host.exit_maintenance_mode <ip del host>

[ Volver arriba ]

¿Cómo comprobar el nombre del enlace y el nombre del puente/conmutador?

Ejecute el comando desde CVM para obtener el nombre del enlace y el nombre del conmutador/puente:

 nutanix@cvm$ administrar_ovs show_uplinks

Ejemplo

 nutanix@cvm$ administrar_ovs show_uplinks
Puente br1: ---> Nombre del puente/interruptor
  Puertos de enlace ascendente: br1-up ---> nombre del enlace
  Ifaces de enlace ascendente: eth1 eth0

Puente br0: ---> Nombre del puente/interruptor
  Puertos de enlace ascendente: br0-up ---> nombre del enlace
  Ifaces de enlace ascendente: eth3 eth2

En este ejemplo, el nombre del enlace es br0-up para puente/conmutador br0 y br1-up para puente/conmutador br1 .

[ Volver arriba ]

Cómo configurar LACP en AHV

Para reconfigurar enlaces ascendentes específicos de forma remota desde otro CVM en modo sin mantenimiento en el clúster cuando el host de destino tiene acceso a la red, use el comando Manage_ovs . Utilice variables según sea necesario:

 nutanix@cvm$ administrar_ovs --puente 
  
   --interfaces 
   
  
    --bond_name 
    
   
     --anfitrión 
     
    
      --bond_mode balance-tcp --lacp_mode rápido --lacp_fallback verdadero update_uplinks
     
    
    
    
   
   
   
  
  
  
 

Vea a continuación un ejemplo:

 nutanix@cvm$ Manage_ovs --bridge br0 --interfaces eth2,eth3 --bond_name br0-up --host hh.hh.hh.hh --bond_mode balance-tcp --lacp_mode fast --lacp_fallback true update_uplinks

Nota: Considere las opciones de tiempo LACP (lento y rápido). Si los conmutadores tienen una configuración rápida, tenga en cuenta que también debe configurar el LACP de Nutanix Cluster en modo rápido. De lo contrario, podría sufrir una interrupción debido a una discrepancia en la velocidad de LACP.

[ Volver arriba ]

Cómo verificar si LACP está configurado en AHV

Ejecute los siguientes comandos.

 root@ahv# ovs-appctl enlace/mostrar br0-up 
root@ahv# ovs-appctl lacp/show br0-up

Ejemplos de trabajo:

Para el bono/show ovs-appctl , tenga en cuenta " lacp_status: negociado "

 root@ahv# ovs-appctl enlace/mostrar br0-up  
---- br0-up ----  
modo_bond: saldo-tcp  
Bond puede utilizar recirculación: sí, Recirc-ID: 301  
base-hash-bonos: 0  
retraso de subida: 0 ms  
retardo de bajada: 0 ms  
próximo reequilibrio: 6757 ms  
lacp_status: negociado  
mac esclavo activo: 0c:c4:7a:1e:3e:6e(eth2)  
  
esclavo eth2: habilitado  
        esclavo activo  
        may_enable: verdadero  
        hash 78: carga de 127 kB  
        hash 108: carga de 13 kB  
        hash 244: carga de 94 kB  
  
esclavo eth3: habilitado  
        may_enable: verdadero  
        hash 9: carga de 6 kB  
        hash 11: carga de 11 kB  
        hash 23: carga de 12 kB  
...

Para ovs-appctl lacp/show , tenga en cuenta " estado: activo negociado" y "actualmente conectado " para cada interfaz:

 root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- estado: activo negociado sys_id: 0c:c4:7a:2f:4f:9d sys_priority: 65534 clave de agregación: 1 lacp_time: esclavo lento: eth2: port_id adjunto actual: 1 port_priority: 65535 may_enable: verdadero actor sys_id: 0c:c4:7a:2f:4f:9d actor sys_priority: 65534 actor port_id: 1 actor port_priority: 65535 actor clave: 1 actor estado: actividad agregación sincronizada, recopilación y distribución del socio sys_id: 00:2b:21:45:2d:12 socio sys_priority: 32768 socio port_id: 39 socio port_priority: 32768 clave del socio: 115 estado del socio: actividad agregación sincronizada recopilación y distribución esclavo: eth3: port_id adjunto actual: 2 port_priority: 65535 may_enable: verdadero actor sys_id: 0c:c4:7a:2f:4f:9d actor sys_priority: 65534 actor port_id: 2 actor port_priority: 65535 actor clave: 1 actor estado: agregación de actividad sincronizada recopilación distribuidora socio sys_id: 00: 2b:21:45:2d:12 prioridad_sys del socio: 32768 ID_puerto del socio: 40 prioridad_puerto del socio: 32768 clave del socio: 115 estado del socio: agregación de actividad sincronizada recopilación y distribución

Ejemplos que no funcionan

Para ovs-appctl bond/show , tenga en cuenta " lacp_status: configurado ":

 root@ahv# ovs-appctl bond/show br0-up ---- br0-up ---- bond_mode: el bono balance-tcp puede usar recirculación: no, Recirc-ID: -1 bond-hash-basis: 0 updelay : 0 ms de retardo de bajada: 0 ms lacp_status: configurado lacp_fallback_ab: verdadero respaldo activo primario: 
  
   mac esclavo activo: 00:e0:ed:8b:72:a1(eth2) <truncado>
  
 

"configurado" indica que LACP se ha configurado en el host AHV, pero el host no ha podido negociar LACP con los puertos del switch.

Para ovs-appctl lacp/show br0-up , tenga en cuenta " estado: activo " y " adjunto predeterminado " para cada interfaz:

 root@ahv# ovs-appctl lacp/show br0-up ---- br0-up ---- estado: activo sys_id: ac:2f:7b:b6:fe:2e sys_priority: 65534 clave de agregación: 1 lacp_time: rápido esclavo: eth0: port_id adjunto predeterminado: 2 port_priority: 65535 may_enable: verdadero actor sys_id: ac:2f:7b:b6:fe:2e actor sys_priority: 65534 actor port_id: 2 actor port_priority: 65535 clave de actor: 1 actor estado: tiempo de espera de actividad agregación sincronizada recopilación distribución socio predeterminado sys_id: 00:00:00:00:00:00 socio sys_priority: 0 socio port_id: 0 socio port_priority: 0 socio clave: 0 socio estado: esclavo: eth1: predeterminado adjunto port_id: 3 port_priority: 65535 may_enable: verdadero actor sys_id: ac:2f:7b:b6:fe:2e actor sys_priority: 65534 actor port_id: 3 actor port_priority: 65535 actor clave: 1 actor estado: tiempo de espera de actividad agregación sincronizada recopilación distribución predeterminada

El resultado indica que no se ha negociado LACP. Predeterminado indica que el host AHV no ha recibido PDU LACP del conmutador. Si ve esta configuración en su host, verifique la configuración de LACP en los conmutadores a los que está conectado el host.

[ Volver arriba ]

Cómo deshabilitar LACP en el host

Realice los siguientes pasos para desactivar LACP de forma segura en el host. Consulte la sección "Descripción general del flujo de trabajo" anterior para conocer los pasos para realizar tareas previas y posteriores a la configuración.

  1. Configure los hosts para usar un modo de vinculación que no requiera LACP usando uno de los siguientes comandos.

a. El siguiente comando establece la política de equilibrio de carga en respaldo activo, lo que significa que solo se usa un enlace superior activo y los adaptadores en espera se usan solo cuando falla el adaptador activo.

 nutanix@cvm$ administrar_ovs --puente 
  
   --interfaces 
   
  
    --bond_name 
    
   
     --anfitrión 
     
    
      --bond_mode actualización_uplinks de copia de seguridad activa
     
    
    
    
   
   
   
  
  
  
 

Todos los miembros del vínculo deben estar conectados físicamente, o el comando Manage_ovs genera una advertencia y sale sin configurar el vínculo. Para evitar este error y aprovisionar interfaces del enlace incluso si no están conectadas, utilice el indicador require_link=false.

 nutanix@cvm$ administrar_ovs --puente 
  
   --interfaces 
   
  
    --bond_name 
    
   
     --anfitrión 
     
    
      --bond_mode copia de seguridad activa --require_link=false update_uplinks
     
    
    
    
   
   
   
  
  
  
 

b. El siguiente comando establece la política de equilibrio de carga en balance-slb, que reequilibra el tráfico de la máquina virtual desde las interfaces más utilizadas a las menos utilizadas y utiliza todos los enlaces superiores disponibles. Puede consultar la Guía de mejores prácticas de redes de AHV para comprender más sobre las políticas de equilibrio de carga.

  1. Apague LACP en los puertos del conmutador.

[ Volver arriba ]

Cómo encontrar la dirección MAC de una NIC de host AHV

Para encontrar la dirección MAC de una NIC de host AHV, utilice cualquiera de los siguientes comandos:

  • Ejecute el siguiente comando en el host AHV
 [root@ahv ~]# ethtool -P <interfaz>

Salida de muestra:

 [root@ahv ~]# ethtool -P eth3
Dirección permanente: 00:25:90:cb:39:27
  • Ejecute el siguiente comando en el host AHV
 [root@ahv ~]# ifconfig <interfaz>

Salida de muestra:

 [root@ahv ~]# ifconfig eth3
eth3 Link encap:Ethernet HWaddr 00:25:90:CB:39:27 UP BROADCAST EJECUTANDO MULTICAST MTU:1500 Métrica:1 Paquetes RX:46857327754 errores:0 descartados:228250 desbordamientos:0 marco:0 Paquetes TX:49134503170 errores:0 eliminado: 0 desbordamientos: 0 portadora: 0 colisiones: 0 txqueuelen: 1000 bytes de RX: 49893674683483 (45,3 TiB) bytes de TX: 54855610562476 (49,8 TiB)

[ Volver arriba ]

información adicional

ID del documento:HT516513
Fecha de publicación original:05/21/2024
Fecha de última modificación:05/30/2024