Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Connectrix B-Series 交換器:FOS-849642 & FOS-847091 - Gen 7 導向器和交換器瑕疵可能會遇到故障狀況,導致 CRC 錯誤、埠故障或造成中斷重新開機

Summary: 第 7 代導向器和交換器 (X7-8、X7-4、7730 和 7720) 執行任何版本的 Fabric OS (FOS) v9.1.x 之前 v9.1.1c 或在 FOS v9.2.0 上執行可能會遇到故障狀況,導致 CRC 錯誤、埠故障或導致 針對嚴重堬塞及啟動超載管理行為而造成中斷的重新開機 流量優化工具功能 FOS-849642 & FOS-847091 瑕疵 這兩個缺陷將在 FOS v9.1.1c 和 v9.2.0a 中修正。在進行此資格鑒定之前,受影響的客戶可能會選擇實施因應措施。 ...

This article applies to   This article does not apply to 

Symptoms

受影響的產品
Brocade X7-8、X7-4、7730 和 7720 執行 FOS v9.1.x 或 FOS v9.2.0
在版本
Brocade FOS v9.1.1c、v9.2.0a 和更高版本

中修正的僅 Gen 7 產品有風險。
安裝 FC64-48 和/或 FC32-X7-48 埠刀鋒的 Gen 7 導向器 (X7-8 和 X7-4) 有發生溢出和「驗證」錯誤的風險。安裝在 Gen 7 導向器中的 FC32-64 和 FC32-48 埠刀鋒不會有發生任一故障的風險。
Gen 7 交換器 (G730 和 G720) 只有遇到緩衝區溢位故障的風險。這些交換器未暴露于或有遇到「確認」錯誤失敗狀況的風險。
若要進一步面臨風險,光纖必須遇到嚴重𷟠塞,導致流量
優化工具進行超載管理。如果遇到此等級的回應,將會觀察下列 RASlog 訊息:
[TO-1006],1011618/1002267,FID 128,資訊,Switch_100,流向導向至 dev02 裝置已移至 PG_OVER_SUBSCRIPTION_4G_16G PG., cfs_ctrlr.c, 行:1470,comp:cfsd,ltime:2023/05/17-06:15:33:923058
流量優化工具的超載管理動作僅存在於 FOS v9.1.x 韌體中。在FOS v9.0.x 上執行的 Gen 7 產品
不會受到任一故障狀況的風險。


緩衝區溢位故障風險條件
若要發生緩衝區溢位狀況,除了需要一段嚴重壅塞期外,Gen 7
導向器或交換器上的 F 埠也必須從預設值設定為更多緩衝區。依預設,FOS 最多可
指定 28 個緩衝區。
任何 Gen 7 導向器或交換器的最大 F-Port 緩衝計數高於 FOS 所使用的
預設值,都有可能面臨風險,而任何先前執行 FOS v9.0.x 的 X7-8 或 X7-4 導向器,都有可能
遭遇「驗證」錯誤。在這兩種情況下,流量優化工具也必須嘗試管理訊框的路由,以
因應在嚴重𷟠塞期間造成的超載事件。

若要判斷可能存在風險的導向器和交換器,請使用「portbuffershow」命令來檢視緩衝區使用方式
image.png
。如果相同 ASIC/晶片同時分區的埠總緩衝使用量加至大於 256 個緩衝區的值,則當嚴重壞塞事件需要流量優化工具的超載管理時,Gen 7 交換器會被視為有風險發生緩衝區超支。每個超載管理事件都不會發生故障,因為在事件發生時管理的緩衝區數量必須超過 256 個,而流量 Optimizer 正在管理超載,但設定為可能處理超過 256 個緩衝區,會使交換器面臨風險。
在上圖所示的範例輸出中,如果所有 8 個 F 埠位於一個區域中,則交換器有風險可能會遇到幀
緩衝區溢位,而流量優化程式則會管理超載狀況,因為本範例中總緩衝區使用次數為 360。
但是,在下列範例中,F 埠並未全部分區在一起,因此此交換器不會有風險,因為兩個區域 (以綠色顯示) 分別最多可達 232 個緩衝區和 128 個緩衝區。
image.png
用於超載管理的埠數量上限為 8 個埠。如果有超過 8 個埠是從相同的 ASIC/晶片區分開來,則總共 8 個具備最高緩衝使用值的埠可判斷風險。

注意:從未從預設變更 F-Port 緩衝計數的 Gen 7 導向器和交換器,不會有遇到此訊框緩衝區溢位問題的風險。用於第 7 代產品的最大/保留緩衝區預設設定的最大值為 28,但可根據交換器類型和光纖速度分配較少的緩衝區。
客戶從未從預設增加最大/保留緩衝計數,將不會遇到緩衝區溢位
問題。即使有 8 個埠一併分區,使用每個埠 28 個緩衝區的最大預設配置,最大緩衝使用量的總值
也只有 224 個訊框。

「確認」故障風險狀況
除了緩衝區溢位問題之外,如果符合下列順序條件,X7-8 和 X7-4 導向器也可能有「確認」錯誤訊息的風險:
  • X7-8 或 X7-4 導向器先前在 FOS v9.0.x 上執行
  • 接著將導向器升級到 FOX v9.1.x
  • 接著,導向器的 F 埠會在 v9.1.x 版本登出並登入
  • 接著,導向器會遇到需要流量優化工具管理的超載事件
  • 接著,導向器會執行 HA 容錯移轉 (韌體升級會導致容錯移轉)
  • 導向器會遇到另一個需要流量優化工具管理的超載事件 
符合上述所有條件的 X7-8 或 X7-4 導向器 (按照指定的順序) 可能會在流量優化器的超載管理期間遇到「確認」錯誤。
  • 只有在 FOS v9.1.x 韌體上執行過的 X7-8 或 X7-4 導向器不會面臨「確認」錯誤的風險,因為只有 v9.1 程式設計模式會用於所有埠。Gen 7 導向器必須先前使用 FOS v9.0.x 執行,才能容易受到此問題影響。
  • 在 FOS v9.1.x 韌體上執行冷開機/重新開機電源的 X7-8 或 X7-4 導向器也無風險發生「驗證」錯誤,因為所有埠都會在重新開機後使用 v9.1 程式設計

症狀
發生超載管理事件的 Gen 7 導向器和交換器會遵守下列
流量優化器 RASlog:
[TO-1006],1011618/1002267、FID 128、資訊、Switch_100、流向 b1a02 裝置已移至 PG_OVER_SUBSCRIPTION_4G_16G PG.,cfs_ctrlr.c,行:1470,comp:cfsd,ltime:2023/05/17-06:15:33:923058
可能因為這些已識別的問題而出現的其他徵兆可能是:
  • 在更換光纖/纜線時,可能會發現連結上的大量 CRC 錯誤
  • 訊框可能會捨棄,連結上的信用可能會遺失
  • 埠可能故障,ASIC 可能會停止併發生故障
  • 導向器可能會發現無預警的 HA 容錯移轉,甚至是導向器的冷重新開機
  • 交換器可能會發生冷重新開機

Cause

在特定情況下,流量優化器功能的超載管理可能會導致故障情境
,影響受管理的訊框或埠的傳輸。在嚴重𷇷塞的情況下,這些故障也可能
影響交換器上作用中的其他 Fabric OS (FOS) 精靈的效能,導致軟體監視程式逾時
,導致 HA 容錯移轉或交換器錯誤。

Gen 7 導向器和交換器 (X7-8、X7-4、7730 和 7720) 在嘗試
管理和重新路由超訂閱流量以因應嚴重圃塞事件時遇到畫面緩衝區溢位,可能會造成意外錯誤。如果
訊框數目超過用來管理超載處理的緩衝區,則在處理流量優化工具時,可能會
遺失這些多餘的訊框。如果標頭資訊遭到覆寫,這些多餘的訊框可能會被其他訊框覆寫,導致
訊框 CRC 錯誤,甚至是埠錯誤。在嚴重𷇷塞的情況下,管理這些溢出/多餘的訊框可能會阻礙其他 FOS 精針,進而造成
監視程式逾時。關鍵精准者,逾時會導致 HA 容錯移轉或中斷交換器重新開機。

除了可能的框架溢位處理之外,先前在 FOS v9.0.x 上運作,之後升級至 FOS v9.1.x 的 X7-8 和 X7-4 導向器,在 HA 容錯移轉後可能會遇到驗證錯誤 (包括韌體升級至更高版本的 v9.1.x 所造成的錯誤)。流量優化器在超載管理期間會觀察到多個「確認」錯誤訊息,因為在某些埠但並非所有埠在 v9.1.x 上重設時,偵測到埠程式設計上的衝突。在 v9.0.x 和之後的 v9.1.x 埠上重設的埠上,以及之後在 v9.1.x 重設的埠上遇到的𷟠塞管理程式之間的衝突,可能會在 HA 容錯移轉事件後出現。

Resolution

因應措施
」「處於風險」的導向器和交換器可能會停用流量優化器超載管理動作。
從維護帳戶發出下列 CLI 命令,以停用流量優化器內的超載
管理動作行為
維護> serviceexec trafoptdebug --enableosclassification 0
注意:維護命令必須在主機殼中的所有邏輯交換器上執行。
注意:此設定會持續在容錯移轉和電源週期

更正動作
之間進行。FOS 9.1.1c 版及更高版本中提供的軟體解決方案可防止這些故障發生。FOS v9.2.0a 和更高版本的 FOS v9.2.x 也提供
相同的解決方案。升級至這些版本的 FOS 可防止因為超載管理而造成訊框超載
,也會防止 X7 導向器發生「驗證」錯誤。

針對任何仍在執行 FOS v9.0.x 版的 Gen 7 導向器或交換器 (X7-8、X7-4、7730 和 7720),可能會「有風險」
的問題,建議您等待 FOS v9.1.1c 版本後再升級。

Gen 7 導向器和交換器目前在 v9.1.x 或 v9.2.0 版本上運作,且判斷有風險時,
應執行因應措施。停用流量優化器超載管理動作可防止
緩衝區超載和「確認」錯誤發生。升級至 v9.1.1c 或 v9.2.0a 後,可透過下列命令重新啟用超載
管理動作:
從維護帳戶發出下列 CLI 命令,以重新啟用流量優化工具內的超載管理動作行為
維護> serviceexec trafoptdebug --enableosclassification 1
注意:維護命令必須在主機殼中的所有邏輯交換器上執行。

任何已發生「緩衝區溢位」故障的 Gen 7 導向器或交換器,都需要執行冷重新開機
,才能完全從故障狀況復原:
董事:插槽電源關閉/在受影響的埠刀鋒
交換器上:交換器重新開機 (冷重新開機)
選項 1:執行上述重新開機動作,然後實作解決方法,以停用流量優化工具
選項 2 內的超載管理動作:使用解決方案升級至 FOS 版本,然後執行上述重新開機動作。

使用提供的解決方案升級至 FOS 版本可防止發生「緩衝區溢位」失敗,但
一旦遇到故障狀況,ASIC 僅冷重新開機即可解決故障狀況。
使用提供的解決方案升級至 FOS 版本,將可防止並自動從「驗證」錯誤
狀況復原,無須採取任何進一步動作。

升級至包含解決方案的 FOS 版本後,系統會執行內部記憶體檢查,以判斷導向器或交換器先前是否遇到故障,並需要重新開機才能從錯誤狀況復原。
如果在將 FOS 升級至解決方案的版本後偵測到故障狀況,將會顯示下列 RASlog:
2023/06/01-17:07:50 (GMT)、[C5-1057]、5、插槽 2 |主機殼,嚴重,Switch_3,S10,C0
:硬體 ASIC 晶片處於不一致的狀態 = 0x1002。
如果在升級 FOS 後發現上述 RASlog,則導向器或交換器先前在升級前曾遭遇「緩衝
區溢位」故障,且需要執行冷重新開機,才能完全從故障狀況復原:
董事:插槽電源關閉/在受影響的埠刀鋒
交換器上:交換器重新開機 (冷重新開機)

Affected Products

Connectrix DS-7720B, Connectrix DS-7730B, Connectrix ED-DCX7-4B, Connectrix ED-DCX7-8B