Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products
  • Manage your Dell EMC sites, products, and product-level contacts using Company Administration.

Коммутатор Connectrix серии B. Дефекты FOS-849642 и FOS-847091 — Директоры и коммутаторы 7-го поколения могут столкнуться с состоянием сбоя, которое вызывает ошибки CRC, сбои портов или приводит к прерываниям перезагрузки

Summary: Директоры и коммутаторы 7-го поколения (X7-8, X7-4, 7730 и 7720), работающие под управлением любой версии Fabric OS (FOS) версии 9.1.x до Версия 9.1.1c или работа с FOS версии 9.2.0 может столкнуться со сбоем, что приводит к ошибкам CRC, сбоям портов или к прерывающая работу перезагрузка в ответ на серьезные перегрузки и активация поведения управления превышением лимита Функция Traffic Optimizer Дефекты FOS-849642 и FOS-847091 Эти два дефекта будут исправлены в FOS версии 9.1.1c и 9.2.0a. В ожидании этой квалификации заказчики, подверженные данной уязвимости, могут выбрать временное решение проблемы. ...

This article may have been automatically translated. If you have any feedback regarding its quality, please let us know using the form at the bottom of this page.

Article Content


Symptoms

Затронутые продукты
Brocade X7-8, X7-4, 7730 и 7720 под управлением FOS версии 9.1.x или FOS версии 9.2.0

, исправленной в выпусках Brocade FOS v9.1.1c, v9.2.0a

и более поздних версий, под угрозой могут быть только продукты 7-го поколения.
Директоры 7-го поколения (X7-8 и X7-4) с установленным блейд-модулем FC64-48 и/или FC32-X7-48 рискуют столкнуться с ошибками «overflow» и «verify». Блейд-серверы с портами FC32-64 и FC32-48, установленные в устройствах управления 7-го поколения, не рискуют столкнуться ни с одной из них.
Коммутаторы 7-го поколения (G730 и G720) рискуют столкнуться со сбоем превышения буфера. Эти коммутаторы не подвержены этой проблеме и риску столкнуться с состоянием ошибки «verify».
Для дальнейшего риска в фабрике должна возникнуть серьезная перегрузка, которая приведет к управлению превышением лимита с помощью Traffic
Optimizer. При обнаружении этого уровня отклика будет отображаться следующее сообщение RASlog:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, Потоки, предназначенные для устройства dev02, были перемещены в PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, строка: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Действие управления превышением лимита с помощью Traffic Optimizer существует только в микропрограмме FOS v9.1.x. Продукты 7-го
поколения, работающие на FOS версии 9.0.x, не рискуют ни в одном из условий сбоя.


Условия риска сбоя при перегреве буфера
Для перегрева буфера, в дополнение к периоду серьезной перегрузки, необходимо также настроить F-порты на директоре или коммутаторе 7-го
поколения с значениями по умолчанию на большее количество буферов. FOS назначит
не более 28 буферов по умолчанию.
Любой директор или коммутатор 7-го поколения с максимальным количеством буферов F-Port
выше значений по умолчанию, используемых FOS, потенциально риску может стать любой директор X7-8 или X7-4, который ранее использовал FOS v9.0.x
, мог столкнуться с ошибками проверки. В обоих случаях Traffic Optimizer
также должен попытаться управлять маршрутизагрузкой кадров в ответ на событие превышения лимита, вызванное в период серьезной перегрузки.

Чтобы определить директоры и коммутаторы, которые могут быть зонироваться, используйте команду portbuffershow
image.png
для просмотра использования буфера Если общее использование буфера для портов на том же ASIC/микросхеме, которые также зонироваться вместе, добавьте значение, которое превышает 256 буферов, то коммутатор 7-го поколения будет считаться под угрозой перезапуска буфера, если серьезное событие перегрузки требует управления превышением лимита трафика. Сбой не будет возникать при каждом событии управления превышением лимита, так как количество буферов, управляемых во время события, должно превышать 256, в то время как Traffic Optimizer управляет превышением лимита, но при настройке для обработки более 256 буферов коммутатор рискует.
В приведенном выше примере выходных данных, если все 8 F-портов находятся в одной зоне вместе,
коммутатор рискует столкнуться с превышением буфера кадра, в то время как Traffic Optimizer выполняет условие превышения лимита, так как общее количество использования буфера в этом примере составляет 360.
Однако в следующем примере, где не все F-порты зонироваться вместе, этот коммутатор не будет под угрозой, так как две зоны (показаны зеленым цветом) в общей сложности до 232 буферов и 128 буферов соответственно.
image.png
Максимальное количество портов, используемых для управления превышением лимита, составляет 8 портов. Если более 8 портов зонироваться вместе с одной и той же ASIC/микросхемой, то всего 8 портов с самыми высокими значениями использования буфера для определения риска.

ПРИМЕЧАНИЕ: Директоры и коммутаторы 7-го поколения, которые никогда не меняли количество буферов F-Port по умолчанию, не рискуют столкнуться с этой проблемой с перегревом буфера кадров. Максимальное значение, используемое в качестве параметра по умолчанию для продуктов Max/Reserved Buffers, составляет 28 для продуктов 7-го поколения, однако можно выделить меньше буферов в зависимости от типа коммутатора и скорости оптического модуля. Заказчики
, которые никогда не увеличили максимальное или зарезервированное количество буферов по умолчанию, не столкнулись с проблемой с перегревом буфера
. Даже при совместном использовании 8 портов при максимальном выделении по умолчанию 28
буферов на порт общее значение максимального использования буфера составляет всего 224 кадра.

«Проверка» условий риска сбоя
Помимо проблемы с перегревом буфера, директоры X7-8 и X7-4 также потенциально рискуют «проверить» сообщения об ошибках, если в этом порядке выполняются следующие условия:
  • Директор X7-8 или X7-4, который ранее был запущен на FOS версии 9.0.x
  • Затем директор обновляется до FOX 9.1.x.
  • Затем директор имеет F-порты, которые выйдите из системы и войдите в систему в версии v9.1.x.
  • Затем директор сталкивается с событием превышения лимита, которое требует управления с помощью Traffic Optimizer.
  • Затем директор выполняет аварийное переключение ha (обновление микропрограмм приводит к аварийному переключение на резервный ресурс)
  • Директор сталкивается с другим событием превышения лимита, которое требует управления с помощью Traffic Optimizer. 
Директоры X7-8 или X7-4, которые соответствуют всем этим условиям, в указанной последовательности могут столкнуться с риском «проверить» ошибки при управлении превышением лимита с помощью Traffic Optimizer.
  • Директоры X7-8 или X7-4, которые когда-либо запускались только на микропрограмме FOS версии 9.1.x, не рискуют столкнуться с ошибкой «verify», так как для всех портов используется только модель программирования v9.1. Для того чтобы директоры 7-го поколения были ранее запущены с FOS версии 9.0.x, они должны быть подвержены этой проблеме.
  • Директоры X7-8 или X7-4, которые были перезагружаются или выключены в режиме «холодной» загрузки и включения питания во время работы с микропрограммой FOS версии 9.1.x, также не рискуют столкнуться с ошибкой «verify», так как все порты будут использовать программирование v9.1 после перезагрузки.

Симптомы
Директоры и коммутаторы 7-го поколения, которые столкнулись с событием управления превышением лимита, будут наблюдать за следующим
журналом RASlog «Traffic Optimizer»:
[TO-1006], 1011618/1002267, FID 128, INFO, Switch_100, потоки, предназначенные для устройства b1a02, были перемещены в PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, строка: 1470, comp:cfsd, ltime:2023/05/17-06:15:33:923058
Из-за этих выявленных проблем могут появляться дополнительные признаки:
  • Может наблюдаться большое количество ошибок CRC на канале, которые не исправлены при замене оптического модуля/кабеля
  • Кадры могут быть отменены, кредит на канале может быть потерян
  • Порты могут быть неисправен, ASIC может остановиться и быть неисправен
  • Директор может наблюдать непредвиденное переключение ha при отказе или даже «холодную» перезагрузку директора.
  • Коммутаторы могут наблюдать «холодную» перезагрузку

Cause

Управление избыточным выделением емкости с помощью функции Traffic Optimizer
в определенных условиях может привести к сбоям при передаче управляемых кадров или портов.
В случае серьезной перегрузки эти сбои также могут повлиять на производительность других демонов Fabric OS (FOS), активных на коммутаторе,
что приводит к тайм-аутам таймера наблюдения по программному обеспечению, что приводит к переключения при отказе HA или критической ошибке коммутатора.

Директоры и коммутаторы 7-го поколения (X7-8, X7-4, 7730 и 7720),
которые сталкиваются с перегревом буферов кадров при попытке управления и перенаправки избыточных потоков в ответ на серьезное событие перегрузки, могут привести к непредвиденным ошибкам. Если
количество кадров превышает буфер, используемый для управления обработкой превышения лимита,
эти избыточные кадры могут быть пропущены во время обработки traffic Optimizer. Эти избыточные кадры
потенциально могут быть перезаписаны другими кадрами, что приводит к ошибкам CRC кадра или даже к ошибкам портов, если информация заголовка перезаписана. В случае серьезной перегрузки управление этими переполнимыми или избыточными кадрами может привести к блокировке других управляющих программ FOS
, что может привести к тайм-аутам наблюдения. Критически важные управляющие программы с тайм-аутом приведут к перезагрузке коммутатора с высокой доступностью при отказе или прерывания работы.

Помимо потенциальной обработки перегревов кадров, директоры X7-8 и X7-4, которые ранее использовались в FOS версии 9.0.x, а затем позднее модернизированы до FOS версии 9.1.x, могли столкнуться с ошибками после переключения ha при отказе (включая ошибки, вызванные модернизацией микропрограммы до более поздних версий v9.1.x). При управлении превышением лимита с помощью Traffic Optimizer будет наблюдаться несколько сообщений об ошибках «verify» из-за обнаруженного конфликта при программировании портов, созданных, когда некоторые порты, но не все порты сбрасываются в версии 9.1.x. Конфликт между программированием для управления перегрузкой на портах, которые не сбрасывались в версии 9.0.x, а затем сталкивались с управлением перегрузкой в то время как на портах версии 9.1.x, которые были сбросить, может появляться после события переключения ha при отказе.

Resolution

Временное решение
» Директоры и коммутаторы с риском могут отключить действие по управлению превышением лимита в Traffic Optimizer.
Выполните следующую CLI-команду
из учетной записи обслуживания, чтобы отключить поведение для управления превышением лимита в Traffic Optimizer.
обслуживание> serviceexec safoptdebug --enableosclassification 0
ПРИМЕЧАНИЕ. Команда обслуживания должна выполняться на всех логических коммутаторах в шасси.
ПРИМЕЧАНИЕ: Эта настройка будет постоянной при переключениях при отказе и циклах включения/выключения. Исправление действий Программное решение, предоставленное в FOS версии 9.1.1c и выше, предотвратит эти сбои.


Те же решения также представлены в
FOS версии 9.2.0a и более поздних версиях FOS версии 9.2.x. Модернизация до этих версий FOS
предотвратит перезапание кадров из-за управления превышением лимита, а также предотвратит ошибки «verify» в директорах X7.

Для директоров или коммутаторов 7-го поколения (X7-8, X7-4, 7730 и 7720), которые по-прежнему работают с версией FOS версии 9.0.x
и могут столкнуться с описанными неполадками, рекомендуется дождаться выпуска FOS версии 9.1.1c перед модернизацией.

Директоры и коммутаторы 7-го поколения, которые в настоящее время работают в версиях 9.1.x или 9.2.0 и находятся под угрозой,
должны внедрить временное решение. Деактивация действия по управлению превышением лимита в Traffic Optimizer
предотвратит ошибки перезаписи буфера и ошибки проверки. После модернизации до версии 9.1.1c или 9.2.0a
действие управления превышением лимита можно повторно включить с помощью следующей команды:
Выполните следующую CLI-команду из учетной записи обслуживания, чтобы снова включить поведение для управления превышением лимита в Traffic Optimizer.
обслуживание> serviceexec safoptdebug --enableosclassification 1
ПРИМЕЧАНИЕ. Команда обслуживания должна выполняться на всех логических коммутаторах в шасси.

Для полного восстановления после сбоя любого директора или коммутатора 7-го поколения, на котором уже возникла ошибка «буферного
перезапуска», необходимо выполнить «холодную» перезагрузку:
Директоров: Питание слота выключено/включено для блейд-коммутаторов затронутых
портов: Перезагрузите («холодную» перезагрузку) коммутатора.
Вариант 1. Выполните указанное выше действие перезагрузки, а затем внедрите временное решение, чтобы отключить действие управления превышением лимита из параметра Traffic Optimizer
2: Выполните модернизацию до версии FOS с помощью решения, а затем выполните действия по перезагрузке, показанные выше.

Модернизация до версии FOS
с помощью предоставленного решения предотвратит сбой «превышения буфера», но после возникновения сбоя только «холодный» перезапуск ASIC устранит состояние сбоя.
Модернизация до версии FOS с помощью предоставленного решения предотвращает и автоматически восстанавливается из состояния ошибки «verify
» без каких-либо дальнейших действий.

После модернизации до версии FOS, содержащую решение, будет выполнена проверка внутренней памяти, чтобы определить, сталкивались ли директор или коммутатор с ошибкой ранее и требует ли перезагрузка для восстановления из состояния ошибки.
После обновления FOS до версии с решением будет отображаться следующий журнал RASlog, если состояние сбоя будет обнаружено:
2023/06/01-17:07:50 (GMT), [C5-1057], 5, SLOT 2 | КОРПУС, КРИТИЧЕСКИЙ, SWITCH_3,
S10, C0: Микросхема ASIC аппаратного оборудования находится в несогласованного состоянии = 0x1002.
Если после модернизации FOS наблюдается вышеуказанный журнал RASlog, то перед модернизацией директор или коммутатор столкнулись с ошибкой «превышения
буфера», и для полного восстановления после сбоя необходимо выполнить «холодный» перезапуск:
Директоров: Питание слота выключено/включено для блейд-коммутаторов затронутых
портов: Перезагрузите («холодную» перезагрузку) коммутатора.

Article Properties


Affected Product

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B

Last Published Date

26 Oct 2023

Version

3

Article Type

Solution