Обратите внимание: на этом веб-сайте есть система специальных возможностей. Нажмите Control-F11, чтобы настроить веб-сайт для слабовидящих, использующих программу чтения с экрана; Нажмите Control-F10, чтобы открыть меню специальных возможностей.

Как работают обновления в Nutanix

Как работают обновления в Nutanix

Как работают обновления в Nutanix

Эта статья переведена автоматически. Щелкните здесь, чтобы просмотреть исходную версию на английском языке.

Описание

Обновления в Nutanix всегда разрабатываются так, чтобы не требовалось простоя виртуальных машин пользователей и их рабочих нагрузок. Этот документ предназначен для того, чтобы служить введением, описывающим, как работает каждый тип обновления, и поделиться некоторыми полезными рекомендациями для администраторов. Похожую информацию вы найдете в руководстве по обновлению Acropolis (не забудьте всегда выбирать руководство, которое соответствует AOS, работающему в данный момент на вашем кластере).

Затронутые версии: все версии, все версии файлов Nutanix, ВСЕ версии LCM, ВСЕ версии AOS, ВСЕ версии AHV
Следующее справедливо для ВСЕХ обновлений Nutanix:

Требуется ли простой?

Нет. Пользовательские виртуальные машины могут мигрировать в реальном времени между хостами в зависимости от типа выполняемого обновления, но это не должно влиять на их сервисы. Пользователи должны сохранить доступ к своим виртуальным машинам и иметь возможность работать в обычном режиме во время обновления. Виртуальные машины, которые не могут мигрировать в реальном времени, например, с vGPU или правилами Affinity, необходимо отключить или удалить эти настройки перед любым обновлением, требующим перезагрузки хоста. Невыполнение этого требования приведет к зависанию обновления в процессе эвакуации пользовательских виртуальных машин.

Есть ли влияние на производительность?

Nutanix рекомендует выполнять обновления во время запланированного окна обслуживания или вне обычных рабочих часов; в противном случае пользователи могут столкнуться с задержкой в процессе обновления. Эта задержка может быть особенно заметной для кластеров, которые используют только сетевые восходящие соединения со скоростью 1 ГБ из-за ограниченной пропускной способности, доступной в этой конфигурации.

Каков рекомендуемый порядок обновления?

Чтобы понять порядок, которому следует следовать при обновлениях, можно обратиться к разделу «Рекомендуемый порядок обновлений» из руководства Acropolis.

Что произойдет, если обновление зависнет?

  • Если вы столкнулись с ошибкой во время проверок перед обновлением, просмотрите статью, указанную в Prism, чтобы узнать, как решить проблему. После того, как проблема будет решена, щелкните ссылку, чтобы вернуться к доступным версиям в Prism, а затем попробуйте выполнить обновление еще раз.
  • Если само обновление зависло, обратитесь в службу поддержки Nutanix за помощью. Не пытайтесь вмешаться, так как это может привести к сбою.
  • Nutanix не поддерживает откат обновлений программного обеспечения.

Как узнать, совместима ли версия?

  • Если версия появляется в разделах «Обновление программного обеспечения» или «Диспетчер жизненного цикла» (LCM) Prism, это автоматически означает, что она уже подтверждена как совместимая с кластером в его текущем состоянии, и вы можете перейти на новую версию в любое время.
  • Если вы не видите нужную вам версию в списке, это может быть по нескольким причинам. Новые выпуски требуют некоторого времени, прежде чем они станут доступны для загрузки одним щелчком, но вы все равно можете получить двоичные файлы и файлы метаданных напрямую с портала Nutanix , а затем вручную загрузить их в Prism. Также может быть так, что вам нужно будет перейти на промежуточную версию (многоэтапное обновление), чтобы сначала перевести кластер на версию, которая может быть обновлена до нужной вам версии.
  • Страница Upgrade Paths на портале Nutanix покажет вам, какие версии AOS, Prism Central (PC) или Nutanix Files можно использовать в вашем кластере прямо сейчас, в зависимости от того, что вы используете в данный момент. Если вам нужно перейти на более позднюю версию, чем та, что показана на странице Upgrade Paths, начните с обновления кластера до последней возможной версии. После этого вы сможете достичь нужной версии при следующей попытке. Чтобы сэкономить время, помните, что кластер, работающий под управлением AOS в ветке выпуска Long-Term Support (LTS) (например, 5.5.x), всегда может быть обновлен напрямую до следующей доступной ветки выпуска LTS (например, 5.10.x).
  • Чтобы узнать, совместимы ли друг с другом определенные версии AOS, Prism Central и Nutanix Files, проверьте совместимость программных продуктов .

Что мне следует сделать заранее?

  • Всегда idea установить и запустить последнюю версию Nutanix Cluster Check (NCC), чтобы убедиться, что ваш кластер находится в наилучшей возможной форме, прежде чем начинать обновление.
  • Чтобы убедиться, что Prism имеет доступ к программному обеспечению и прошивке, которые вы хотите выбрать, проверьте требования к портам и брандмауэру и убедитесь, что ваша сеть настроена соответствующим образом. Если вы используете Prism Central, убедитесь, что порт SSL 9440 открыт в обоих направлениях между виртуальной машиной Prism Central и любыми зарегистрированными кластерами.
  • Если ваш кластер зарегистрирован в Prism Central, убедитесь, что он обновлен до обновления AOS в кластере Prism Element. Prism Central предназначен для управления кластерами Prism Element, которые находятся в той же основной сборке и более ранних версиях. Например, Prism Central 5.10.0.1 поддерживается для управления кластерами Prism Element, работающими под управлением 5.10.0.2, поскольку основная сборка (5.10.0) та же самая. Однако PC 5.10.0.1 не поддерживается для управления кластерами PE, работающими под управлением 5.10.1, поскольку эта версия PE является более поздней основной сборкой. В таких случаях PC следует обновить до 5.10.1 или более поздних сборок, чтобы вернуть его совместимость с кластерами, которыми он управляет.
  • Проверьте страницы Upgrade Paths и Compatibility Matrix на портале Nutanix, чтобы убедиться, что новое программное обеспечение совместимо. Compatibility Matrix также содержит руководство по совместимости программного обеспечения с Nutanix Ready Partner Solutions и гостевыми операционными системами AHV.
  • Прочитайте заметки о выпуске на портале поддержки, чтобы получить информацию об известных проблемах в выпуске, а также о том, какие исправления ошибок, улучшения или функции в нем реализованы.
  • Если вы используете сторонний гипервизор или приложение, проверьте веб-сайт поставщика, чтобы убедиться, что он совместим с желаемой версией AOS.

Решение

Ниже вы найдете краткое описание предварительных условий для каждого типа обновления, того, что происходит на внутреннем сервере, и ожидаемого времени выполнения операции.

Программное обеспечение АОС

Предварительные условия обновления

Что произойдет, если я нажму «Обновить сейчас» ?

  • Сначала будут запущены проверки перед обновлением, чтобы убедиться, что кластер можно обновить. Если какие-либо проверки перед обновлением завершатся неудачей, вы увидите информацию об этом в Prism, и фактическое обновление AOS не начнется. Пользователям придется нажать « Назад к версиям» и снова запустить обновление после того, как проблема, о которой сообщают предварительные проверки, будет устранена. Чтобы увидеть полный список предварительных проверок и связанных с ними статей, ознакомьтесь с KB 6524 .
  • Затем программное обеспечение AOS копируется на каждую CVM (контроллерную виртуальную машину) в кластере.
  • На последнем этапе виртуальные машины контроллера в кластере перезагружаются по одной на новую версию AOS. Трафик хранилища от виртуальных машин пользователя будет перенаправлен на соседнюю CVM, пока локальная обновляется. В течение этого короткого периода (около 10 минут) локальные виртуальные машины пользователя могут испытывать небольшую дополнительную задержку, поскольку они получают свои операции ввода-вывода хранилища от удаленной CVM.

Сколько времени это занимает?

Это может занять 15-20 минут на узел. Процесс обновления в кластере из двух узлов займет больше времени, чем обычно, из-за дополнительного шага синхронизации данных при переходе между состоянием одного узла и состоянием двух узлов. Тем не менее, кластер остается работоспособным во время обновления.

Центральное программное обеспечение Prism

Обзор и требования

Что произойдет, если я нажму «Обновить сейчас» ?

  • Сначала будут запущены проверки перед обновлением, чтобы убедиться, что кластер можно обновить. Если какие-либо проверки перед обновлением завершатся неудачей, вы увидите информацию об этом в Prism, и фактическое обновление не начнется. Пользователям придется нажать « Назад к версиям» и снова запустить обновление после того, как проблема, о которой сообщают предварительные проверки, будет устранена. Чтобы увидеть полный список предварительных проверок и связанных с ними статей, ознакомьтесь с KB 6524 .
  • Если у вас обычный Single-VM Prism Central, новое программное обеспечение будет подготовлено, а затем PCVM перезагрузится, чтобы перейти на новую версию. В течение этого короткого времени пользовательский интерфейс будет недоступен, но это не повлияет на кластеры Prism Element, управляемые Prism Central.
  • Если у вас Scale-Out Prism Central (три PCVM), программное обеспечение будет скопировано на каждую PCVM, а затем они будут перезагружать по одному, чтобы запустить новое программное обеспечение. Службы Prism Central и пользовательский интерфейс будут по-прежнему доступны во время обновления.
  • После загрузки PCVM после обновления, потребуется несколько минут, чтобы пользовательский интерфейс стал доступен. Войдите в систему и убедитесь, что задача Prism Central Upgrade успешно завершена (100%).

Сколько времени это занимает?

Для Single-VM Prism Central — около 25 минут.
Для Scale-Out Prism Central (три PCVM) — около 1 часа.

Программное обеспечение гипервизора

Что произойдет, если я нажму «Обновить сейчас» ?

  • Сначала будут запущены проверки перед обновлением, чтобы убедиться, что кластер можно обновить. Если какие-либо проверки перед обновлением завершатся неудачей, вы увидите информацию об этом в Prism, и фактическое обновление гипервизора не начнется. Пользователям придется нажать « Назад к версиям» и снова запустить обновление после того, как проблема, о которой сообщают предварительные проверки, будет устранена. Чтобы увидеть полный список предварительных проверок и связанных с ними статей, ознакомьтесь с KB 6524 .
  • При обновлении выбирается хост в кластере и отправляется задача по миграции виртуальных машин пользователей с хоста.
  • Как только CVM остается единственной виртуальной машиной на хосте, она переводится в режим обслуживания и начинается подготовка нового программного обеспечения для гипервизора.
  • После установки новой версии гипервизора производится перезагрузка хоста.
  • Как только хост выходит из режима перезагрузки с новой версией программного обеспечения, он выводится из режима обслуживания и включается CVM.
  • Кластер будет ждать, пока контроллер VM и его службы выйдут в сеть, прежде чем выбрать следующий хост для обновления. Гипервизор будет балансировать пользовательские VM на обновленном узле по мере необходимости на основе его существующей конфигурации.

Сколько времени это занимает?

Это зависит от того, сколько времени потребуется для эвакуации пользовательских виртуальных машин с каждого хоста, прежде чем он будет отключен для обновления. Хорошая оценка составляет около 30-45 минут на узел.

Прошивка с Life Cycle Manager (LCM)

В этом разделе основное внимание будет уделено обновлениям прошивки с помощью LCM; однако вы также можете использовать LCM для обновления программного обеспечения, например AOS и Foundation. Обновление программных объектов с помощью LCM использует те же механизмы, которые были доступны в устаревшем разделе One Click Upgrade Software Prism. Если вам интересно, как они работают, обратитесь к разделам этого документа, описывающим эти рабочие процессы.

См. KB 7536 для часто задаваемых вопросов об этой функции. Вам необходимо настроить правила во внешнем брандмауэре, чтобы разрешить обновления LCM. См. Prism Web Console Guide: Firewall Requirements для получения подробной информации. Ознакомьтесь с LCM Guide для получения полной информации об использовании этой функции.

Способность LCM инвентаризировать или обновлять определенные компоненты может зависеть от того, какие версии AOS и Foundation запущены в кластере. Пользователи, желающие увидеть полный список доступных обновлений, должны сначала обновить это программное обеспечение или проверить примечания к выпуску LCM , чтобы узнать, существуют ли какие-либо из этих зависимостей для вашей среды.

Что произойдет, если я нажму « Обновить» ?

  • Сначала будут запущены предварительные проверки, чтобы убедиться, что кластер находится в хорошем состоянии для продолжения обновления. Prism сообщит, если какие-либо предварительные проверки не пройдут, и вы можете обратиться к KB 4584 за объяснением каждой из них и способами решения проблемы. После устранения проблемы, которая привела к сбою предварительной проверки, запустите новую инвентаризацию, а затем попробуйте выполнить операцию обновления еще раз.
  • По сути, все обновления прошивки, выполняемые через LCM, требуют, чтобы хосты загружались в промежуточную область на базе CentOS, называемую Phoenix, за исключением следующих случаев.
    • Некоторые модули для платформ Dell.
    • LCM 2.3.2 и более поздние версии для прошивки DISK используют механизм обновления на основе IVU, который не требует перезагрузки хоста.
    • LCM 2.4.0 и более поздние версии для прошивки BIOS и BMC при соблюдении определенных условий используют механизм обновления Redfish, который не требует перезагрузки хоста.
  • LCM имеет встроенный интеллект, который сообщает ему, в каком порядке выполнять обновления прошивки, поэтому пользователям не нужно беспокоиться о том, какие обновления выполнять в первую очередь. Пользователи могут просто выбрать действие Обновить все , и LCM автоматически удовлетворит все зависимости между прошивками.
  • Если для обновления прошивки выбрано несколько хостов, LCM эвакуирует пользовательские виртуальные машины с хостов по одной и загружает их в промежуточную зону Phoenix для выполнения обновлений. Ни одна пользовательская виртуальная машина не будет отключена, и ваша рабочая нагрузка должна продолжать обслуживаться без сбоев.
  • В зависимости от обновляемой прошивки вы можете увидеть, как ваш гипервизор несколько раз перезагрузится обратно в Phoenix. Это ожидаемое поведение, и вам не следует пытаться вмешиваться.
  • После завершения обновления прошивки выбранный узел снова загрузится в гипервизор и включит локальную виртуальную машину контроллера, убедившись, что все службы кластера запущены и работают.
  • Наконец, LCM убедится, что локальный гипервизор снова может размещать пользовательские виртуальные машины, прежде чем обновление перейдет на следующий узел.

Сколько времени это занимает?

Это зависит от количества обновлений прошивки, выполняемых на данном узле, и от того, сколько времени требуется для эвакуации пользовательских виртуальных машин с каждого хоста. Для справки,

  • Обновление прошивки SATA DOM (Phoenix) обычно занимает около 45 минут на узел.
  • Обновление прошивки BIOS и BMC (Phoenix) обычно занимает примерно столько же времени, сколько и SATA DOM.
  • Обновление прошивки BIOS и BMC (Redfish) обычно занимает около 10–15 минут.
  • Обновление прошивки DISK (IVU) занимает меньше времени по сравнению с механизмом Phoenix, но общее время пропорционально количеству обновляемых дисков.

Базовое программное обеспечение

Единственным предварительным условием для обновления программного обеспечения Foundation является то, что все CVM включены, а служба Foundation находится в состоянии остановки по всему кластеру. Эта служба обычно не работает, если только не происходит обновление LCM или операция расширения кластера.

Что произойдет, если я нажму «Обновить сейчас» ?

Бинарные файлы Foundation обновляются во всех CVM. Работающие службы, CVM или гипервизоры не перезапускаются.

Сколько времени это занимает?

Это займет около минуты.

Программное обеспечение Nutanix Cluster Check (NCC)

Для обновления NCC нет никаких предварительных условий, кроме того, что все CVM должны быть запущены. Ознакомьтесь с руководством NCC для получения инструкций по обновлению.

Что произойдет, если я нажму «Обновить сейчас» ?

Новое программное обеспечение NCC копируется на каждую CVM, а затем служба cluster_health, которая отвечает за мониторинг работоспособности и логику, лежащую в основе оповещений кластера, перезапускается на каждом узле. Никакие службы, участвующие в пути данных, не перезапускаются.

Сколько времени это занимает?

Это займет около пяти минут.

Программное обеспечение файлового сервера (Nutanix Files)

Установка (или обновление) файлов

Что произойдет, если я нажму «Обновить сейчас» ?

  • Сначала будут запущены проверки перед обновлением, чтобы убедиться, что кластер можно обновить. Если какая-либо из проверок перед обновлением не пройдена, вы увидите информацию об этом в Prism, и фактическое обновление файлового сервера не начнется. Пользователям придется нажать « Назад к версиям» и снова запустить обновление после устранения проблемы, о которой сообщают предварительные проверки. Чтобы увидеть полный список предварительных проверок и связанных с ними статей, ознакомьтесь с KB-6524 .
  • После начала обновления файлового сервера каждая виртуальная машина файлового сервера обновляется по одной на новую версию Nutanix Files. Пока FSVM недоступна для обновления, пользователи, подключенные к общим ресурсам, размещенным на этом узле, могут столкнуться с потерей подключения на время около 20-30 секунд. После этого короткого периода другая FSVM возьмется за размещение этих общих ресурсов, и пользователи снова получат доступ к своим файлам.
  • После того как каждая FSVM завершит перезагрузку на новой версии Nutanix Files, обновление обеспечит возможность снова размещать общие ресурсы, прежде чем приступить к обновлению следующей FSVM.

Сколько времени это занимает?

Около 20 минут на виртуальную машину файлового сервера.

Дополнительная информация

  • Nutanix KB 6945 — Оригинальный документ на портале Nutanix
ID документа:HT514179
Дата публикации оригинала:09/08/2022
Дата последнего изменения:09/02/2024