Connectrix B-серії: Як інтерпретувати вихід Brocade porterrshow, і що означають лічильники. Самодопомоги
Summary:Пояснення лічильників у команді porterrshow
Please select a product to check article relevancy
This article applies to This article does not apply toThis article is not tied to any specific product.Not all product versions are identified in this article.
Як інтерпретувати вихідні дані
Brocade porterrshow Що означають лічильники porterrshow?
Інтерпретує та пояснює вихідні дані porterrshow (помилки портів) комутаторів Brocade SAN та можливі причини помилок.
Ця команда виводить підсумок помилок для всіх портів.
На порт виводиться один вихідний рядок, який показує лічильники помилок в одиницях, тисячах (за числом слідує k) або мільйонах (за числом слідує m)..
Cause
Н/Д
Resolution
Кадри tx Передані кадри: Кількість кадрів, що передаються портом. Це число є статистикою, яка є базою для лічильників помилок.
Кадри rx Отримані кадри: Кількість кадрів, що передаються портом. Це число є статистикою, яка є базою для лічильників помилок.
Енк в Помилки кодування всередині кадрів: (РХ). Кількість помилок кодування 8b/10b, що сталися всередині меж кадру. Цей лічильник, як правило, має нульове значення, хоча на звичайному посиланні можуть виникати випадкові помилки, які дають ненульовий результат. Мінімальне дотримання специфікації частоти помилок зв'язку для каналу, що безперервно приймає кадри, допускає приблизно одну помилку кожні 20 хвилин протягом 1 Гбіт/с. Повторна ініціалізація і перезавантаження пов'язаного з ним Nx-порту також можуть викликати ці помилки. Ці помилки є сумою помилок LLI.
Crc err Помилки перевірки кадрів із циклічним резервуванням: (RX) Кількість кадрів, які не пройшли перевірку циклічної надмірності. Циклічна перевірка надмірності (CRC) — це чотирибайтове поле, яке має слідувати безпосередньо за полем даних і використовується для перевірки цілісності даних заголовка кадру та поля даних. Роздільники SOF (= Start-Of-Frame) і EOF (= End-Of-Frame) не повинні бути в перевірці CRC. Поле CRC обчислюється на заголовку кадру та полі даних перед кодуванням для передачі та після декодування під час прийому. Поле CRC має бути вирівняно по межі слова. Для обчислень CRC біт чотирибайтового поля, вирівняного за словами, який відповідає першому біту, що передається, є бітом найвищого порядку. Кадри, які не відповідають CRC, відзначаються, але не змінюються, і цільовий пристрій несе відповідальність за відхилення та/або повторний запит кадру. За статистикою, помилки enc out самі по собі мають на увазі проблеми з кабелем, enc out і crc err в поєднанні мають на увазі проблеми з GBIC або SFP. Ці помилки є сумою помилок LLI
crc g_eof CRC з хорошим отриманим EOF (End Of Frame). (Рх). При виявленні CRC з хорошим EOF комутатор збільшує лічильник crc g_eof, він позначає кадр, щоб жоден інший порт не враховував цей кадр CRC і не перенаправляв кадр далі.
Це дозволяє швидко відстежити кадри CRC з хорошим EOF до вихідного порту.
Занадто короткий "Занадто короткий" лічильник - це лічильник статистики помилок, який збільшується щоразу, коли надходить кадр, обмежений SOF (Початок кадру) та EOF (Кінець кадру), а кількість слів між SOF та EOF становить менше 7 слів (6 слів заголовок плюс 1 слово CRC), тобто 38 байт (а не 48), включаючи SOF та EOF. Це може бути спричинено передавачем або ненадійним з'єднанням. Розмір кадру даних є змінною від 0 до 2112. Ці помилки є сумою помилок LLI
Занадто довгі кадри довші за максимальні: Кількість кадрів, які перевищують максимальний розмір кадру (36 байт + розмір кадру даних). Розмір кадру даних є змінною від 0 до 2112. Ці помилки є сумою помилок LLI. Максимальна тривалість кадрів FC становить 2148 бай. Якщо EOF пошкоджений або генерація даних неправильна, генерується занадто довга помилка.
Поганий еоф Кадри з поганими роздільниками кінця кадру: Роздільник кінця кадру (EOF) — це впорядкована множина, яка слідує за CRC. Після помилки втрати синхронізації безперервне вирівнювання дозволяє приймачу відновити вирівнювання слів у будь-якій точці вхідного бітового потоку, поки приймач працює. Така перебудова може (але не гарантована) призвести до порушень коду та подальшої втрати синхронізації. За певних умов можна переналаштувати вхідний бітовий потік без втрати синхронізації. Якщо таке перегрупування відбувається в межах отриманого кадру, виявлення результуючої умови помилки залежить від функції вищого рівня (наприклад, невірний CRC, відсутній розділювач EOF).
Розділювач EOF позначає кінець вмісту кадру, за яким слідують холості. Існує три категорії роздільників EOF. Одна категорія роздільника повинна вказувати на те, що кадр є дійсним з точки зору відправника і потенційно дійсним з точки зору одержувача. Друга категорія вказує на те, що зміст кадру є дійсним. Ця категорія повинна використовуватися тільки F-портом, який отримує повний кадр і декодує його перед тим, як переслати цей кадр на інший пункт призначення. Третя категорія вказує на те, що вміст кадру пошкоджено, а кадр було обрізано під час передачі. Третя категорія використовується як N-портами, так і F-портами для позначення внутрішньої несправності, наприклад, несправності передавача, яка не дозволяє нормально передавати весь кадр. Ці помилки є сумою помилок LLI.
enc вихід Помилки кодування 8 біт/10 біт виникали в словах (впорядкованих наборах) поза кадром FC. Слова поза кадрами кодуються, якщо це кодування пошкоджено або виявлено помилку, генерується enc out.
Помилка кодування поза кадрами: Кількість помилок кодування 8b/10b, що виникли за межами кадру. Цей лічильник може стати ненульовим значенням під час ініціалізації зв'язку, але вказує на проблему, якщо він збільшується швидше, ніж дозволяє частота помилок зв'язку (один раз на 20 хвилин протягом 1 Гбіт/с). Це викликано пошкодженими примітивними послідовностями, тобто: LIP f7,f7.
ПРИМІТКА: Помилки втрати sig, синхронізації втрат та enc out очікуються щоразу, коли користувач опускає та піднімає порт шляхом перезавантаження хоста, вмикає підсистему сховища, від'єднує та/або повторно підключає кабель або викликає команду portDisable/portEnable. Також важливим є той факт, що ці помилки також збільшуються, в той час як комутатор на 2 Гб домовляється про швидкість з'єднання зі своїм підключеним пристроєм - майте це на увазі. За статистикою, помилки enc out самі по собі мають на увазі проблеми з кабелем, enc out і crc err в поєднанні мають на увазі проблеми з SFP. Ці помилки є сумою помилок LLI.
Диск c3 Кількість відкинутих кадрів класу 3 (Rx). Лічильник включає в себе суму наступних лічильників відкидання C3, повідомлених командою portstatshow:
er_rx_c3_timeout, er_tx_c2_timeout, er_c2_dest_unreach і er_other_disc
Помилки класу 3 відкидання можуть бути згенеровані перемикачем, коли пристрої надсилають кадри без FLOGI's first або з недійсним місцем призначення. Ця помилка повідомляє про те, що таке відкидання відбулося.
Кадри класу 3 можуть бути відкинуті через тайм-аути або недійсні чи недосяжні місця призначення. Цей приріст лічильника при нормальній роботі. Він також може бути використаний для демонстрації ефекту перевантаження портів, що означає, що хороші кадри з послідовних S-ID та D-ID не спрямовуються безпосередньо від порту до порту, а замість цього кадр винятку маршрутизується через внутрішній порт (зазвичай це не повинно відбуватися з маршрутизацією порт-порт на ASIC, але це відбувається, коли порт D-ID страждає від стану повного буфера і не може приймати більше кадрів). Крім того, якщо пункт призначення заблокований через високе робоче навантаження ISL (тобто: тривалий час з BB Credit Buffer = 0), це може спричинити повні умови буфера, тому порт S-ID може (у крайніх випадках) відповідати умові тайм-ауту і, отже, лічильник c3 диска збільшиться. Ці помилки є сумою помилок LLI.
Додаткова інформація: Порт може приймати лише один кадр за раз (за межами з'єднань xWDM неможливо одночасно спрямувати 2 світлові імпульси вниз по оптичному кабелю). Тому, якщо два джерела світла намагаються спільно використовувати порт, їм доводиться використовувати арбітражний алгоритм, коли одне джерело світла проходить наскрізь, а друге чекає своєї черги. Коли перше джерело завершено, друге джерело відпускається. Це означає, що вихідні коди можуть працювати лише при 50% завантаженості (або рівному часу завантаженості та готовності). Якщо джерело здатне передавати потокові дані зі швидкістю D-ID (а це багато HBA в наші дні), будь-яка спроба іншого такого ж швидкого HBA призводить до зниження
продуктивності на 50%.er_unreachable відкидаються через те, що не вдалося дістатися до пункту призначення або через офлайн чи онлайн пристроїв на місці призначення.
er_other_disc є фактичними відкиданнями, які не підпадають під жодну з інших визначених категорій фреймів відкидання. За словами Парча, вони незначні і не впливають на продуктивність.
Помилка
зв'язкуНесправності зв'язку (стани LF1 або LF2): Кількість досягнень портом станів Link fail1 і Link fail 2. Отримано (Rx). Якщо порт залишається в стані прийому LR протягом часу, що перевищує період тайм-ауту (R_T_TOV), буде виявлено тайм-аут протоколу скидання каналу, що призводить до стану відмови каналу зв'язку (введіть стан передачі NOS).
Помилка з'єднання також вказує на те, що втрата сигналу або втрата синхронізації, яка тривала довше за значення R_T_TOV, була виявлена, коли вона не перебуває в автономному стані
Втрата синхронізаціїВтрата синхронізації : Кількість разів було втрачено синхронізацію. Помилки синхронізації на межах бітових або передавальних слів не можна ідентифікувати окремо та спричинити втрату помилок синхронізації.
ПРИМІТКА: Помилки "loss sig", "loss sync" та "enc out" очікуються щоразу, коли користувач опускає та піднімає порт (перезавантажуючи хост, вмикає підсистему сховища, від'єднує та/або повторно підключає кабель або викликає команду portDisable або portEnable) loss sig = Втрата сигналу: Кількість втрат сигналу. Коли робочий приймач розпізнає стан втрати сигналу, вводиться стан втрати синхронізації (якщо приймач не перебуває в цьому стані). Одержувач залишається в такому стані до тих пір, поки не настане одна з наступних умов: Стан втрати сигналу виправляється, і відновлюється синхронізація - або - приймач скидається.
Сиг втратКількість отриманих втрат сигналу відбувається, коли сигнал передається, але сигнал не надходить на той самий порт.
frjt Кадри, відхилені за допомогою F_RJT: Кількість рамок Fabric Port, що відхиляють. Вони свідчать про те, що в доставці кадру відмовляють. Деякі підстави для видачі F_RJT включають: Клас не підтримується; неприпустимі поля заголовка; і N-Port недоступний.
ФБСІ Якщо тканина не може доставити раму класу 2 в межах E_D_TOV рама буде відкинута, а F_BSY повернено. (Тх.) Кадри, зайняті F_BSY: Тканинний порт зайнятий рамою. Цей кадр видається Fabric, щоб позначити, що конкретний порт не може бути доставлений, оскільки Fabric або N-Port призначення зайняті.
C3-тайм-аут TX Кількість кадрів класу передачі 3, відкинутих на порту передачі через тайм-аут (залежно від платформи та порту).
C3-тайм-аут RX Кількість кадрів класу прийому 3, отриманих у цьому порту та відкинутих у порту передачі через тайм-аут (залежно від платформи та порту).
PCS помиляються Кількість помилок блоку Physical Coding Sublayer (PCS). Цей лічильник фіксує порушення кодування на портах 10 Гбіт/с або 16 Гбіт/с.
У лічильнику porterrshow ER_PCS_BLK це стосується лише платформ, які підтримують порти 10 Гбіт/с або 16 Гбіт/с (6505/6510/6520/DCX-8510) і він був представлений разом із Condor3 ASIC, платформою GEN5. Цей лічильник еквівалентний enc_out для зв'язку 8 ГБ і або 4 ГБ і використовується тільки для швидкості 10 ГБ і 16 ГБ.
Канали зв'язку 10 ГБ і 16 ГБ використовують кодування 64 B або 66 B замість 8 B або 10 B для передачі даних, а «pcs err» (=er_pcs_blk) зустрічні записи про порушення кодування на портах 10 Гбіт/с або 16 Гбіт/с, виявлені під час декодування.
uncor err Кількість невиправних поправок прямих помилок (FEC).
Additional Information
Будь ласка, зверніться до цього відео:
ПАРЧЕВІ ПРИКЛАДИ найпоширеніших лічильників.
Приклад 1 ENC OUT з LINK FAIL і LOSS SYNC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 4 6 0 0 0 0 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
З помилок ми бачимо помилку зв'язку та втрату помилок синхронізації PLUS enc out, вони також можуть включати помилку втрати sig.
Ці комбінації помилок зазвичай вказують на перезавантаження хоста або скидання посилань за межами комутатора. Помилки enc out виникають під час узгодження швидкості в рамках ініціалізації зв'язку.
Очікувані дії: Переконайтеся, що пристрій, підключений до порту, мав законну причину для переходу в автономний режим/онлайн, тобто перезавантаження хоста. Якщо ні, підніміть СР.
Приклад 2 ENC OUT:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 2.3m 0 0 0 0 0 0 0 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Помилки enc out без будь-яких пов'язаних з цим помилок вказують на забруднення кабелю.
Очікувані дії: Огляньте та очистіть усі оптичні грані на кабелі та SFP, підключених до цього порту та підключених пристроїв.
Приклад 3 CRC та CRC G_EOF:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Рамка входить у порт комутатора з поганим CRC, але з кінцем кадру, який все ще позначений як хороший.
Це вказує на те, що це перший порт, який реєструє пошкоджений кадр, тому проблема полягає або в інтерфейсі SFP / Cable / Attached device на цьому конкретному порту.
Очікувані дії: Перегляньте дію за замовчуванням у роздільній здатності.
Для порту ISL очистіть статистику за допомогою команд statsclear і slotstatsclear , зачекайте 4-6 годин і зберіть збереження підтримки з обох комутаторів і відкрийте SR для нормального усунення несправностей.
Приклад 4 CRC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 1.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Порт записує кадр, що надходить на комутатор з поганим кадром CRC, але з уже позначеним кадром як поганий. Зазвичай це можна побачити на F-портах ISL та NPIV.
Очікувані дії: Якщо помилки CRC реєструються на порту NPIV, перевірте пристрій, підтримуючи постачальника !
Для порту ISL перевірте всі порти в тканині на наявність g_oef crc журналювання портів і дії, як у прикладі 3.
Приклад помилки 5 шт з LINK FAIL і LOSS SYNC:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 4 4 0 0 0 0 0 466
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Це стосується лише платформ, які підтримують порти 10 Гбіт/с або 16 Гбіт/с (6505/6510/6520/DCX-8510) і було представлено разом із Condor3 ASIC, платформою GEN5. ER_PCS_BLK показує кількість помилок блоку Physical Coding Sublayer (PCS). Цей лічильник еквівалентний enc_out для зв'язку 8 ГБ або 4 ГБ і використовується тільки для швидкості 10 ГБ і 16 ГБ.
З помилок ми можемо побачити помилку з'єднання та втрату синхронізації, а також помилки помилки pcs, вони також можуть включати помилку втрати sig.
Ці комбінації помилок зазвичай вказують на перезавантаження хоста або скидання посилань за межами комутатора.
Помилки pcs err виникають під час узгодження швидкості в рамках ініціалізації зв'язку.
Очікувані дії: Переконайтеся, що пристрій, підключений до порту, мав законну причину для переходу в автономний режим/онлайн, тобто перезавантаження хоста. Якщо ні, підніміть СР.
Приклад помилки 6 шт.:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 466
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Помилки PCS ERR без будь-яких супутніх помилок вказують на забруднення кабелю.
Очікувані дії: Огляньте та очистіть усі оптичні грані на кабелі та SFP, підключених до цього порту та підключених пристроїв.
Приклад 7 C3timout PLUS Диск c3:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 2.4k 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
C3TIMEOUT відкидає, показуючи, що кадри відкидаються на цьому порту при типовому тайм-ауті 500 мс.
TX - Кадри не можна надсилати з цього порту комутатора.
RX - Кадри не приймаються портом комутатора і відкидаються при тайм-ауті за замовчуванням 500 мс.
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err
xx: 849.1k 493.2k 0 0 0 0 0 0 0 2.4k 0 0 0 0 0 0 0 0
Загальна причина: Дійсний лише в тому випадку, якщо статистика порту була очищена протягом останніх 24 годин. В іншому випадку класифікують ці лічильники як історичні. Очистіть статистику портів (https://support.emc.com/kb/304525) і перездайте дані через 4-6 годин.
Накопичення «недосяжних», «інших» або «немаршрутизованих» кадрів, які відкидаються. (Див. команду portstatsshow виведення, щоб дізнатися більше про відкидання.)
Очікувані дії: Відкидає С3 самостійно, взагалі ніяк не впливає на SAN.
Приклад 9 Uncorr err:
porterrshow :
CURRENT CONTEXT -- 3 , 111
frames enc crc crc too too bad enc disc link loss loss frjt fbsy c3timeout pcs uncor
tx rx in err g_eof shrt long eof out c3 fail sync sig tx rx err err
xx: 1.1g 468.4m 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 48
Кількість блоків, які були залишені невиправленими FEC
Якщо є супутні помилки CRC, enc_out, bad eof (pcs err), які можуть вплинути на фрейми даних і впорядковані набори відповідно (тому r_rdy можуть бути втрачені, що призведе до виснаження кредитів). Дотримуйтесь вказівок на випадок цих помилок.
Якщо жодна з цих помилок не збільшується, невиправлені помилки мають мінімальний ефект, але є ознакою того, що посилання не є безпомилковим, тому може виникнути проблема з кабелем або SFP.
Якщо тільки не помиляється, то в якості першого кроку слід перевірити кабель і почистити роз'єми.