Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Metro Node:如何從 Metro Node 收集記錄

Summary: 本文概述了如何從 Metro Node 收集記錄的步驟,也涵蓋發生效能問題可能需要哪些記錄/資料。

This article applies to   This article does not apply to 

Instructions

有關如何完成以下任務的步驟: 

  1. 偵錯大都會節點問題需要哪些記錄? 
  2. 如何在 Metro Node 叢集上擷取收集診斷? 
  3. 如何在管理伺服器上驗證現有的收集診斷套件。  
  4. 如何中止並清理 Metro Node 中的持續收集診斷?  


注意:如果需要 SupportAssist 記錄,請參閱 KBA 000135669:「如何從 SupportAssist 企業版匯出 SupportAssist 記錄集合?連線或中斷連線


 A. 偵錯 Metro Node 問題需要哪些記錄? 

  1. 從 Metro Node 收集記錄所需的命令稱為「collect-diagnostics」,可從 Metro Node 設定中的任何 [1] 節點執行。在 Metro Node 叢集的一個導向器上執行此命令時,應具有來自叢集所有節點的所有導向器的所有資料。請勿 同時在多個節點上執行此命令。

 

[1] 注意:僅從一個導向器執行「collect-diagnostics」命令,如果是 Metro 組態,請僅在一個叢集上執行,並等待其完整完成,再視需要從另一個導向器或對等叢集收集 CD。 
 
  1. collect-diagnostics」命令會產生含有組態和記錄檔的壓縮 tar.gz 記錄檔。collect-diagnostics 檔案會放置在執行該檔案的節點上的 /diag/collect-diagnostics-out/ 目錄中。命令完成後,請使用 WINSCP 或相等的 SCP 公用程式,將檔案從節點複製,然後提供該檔案以支援分析。有關使用此命令的詳細資訊,請參閱下面的 B 部分。

 

注意: 

  • 如果在沒有選項的情況下執行「collect-diagnostics」命令,則會產生兩個檔案:一個基本檔案和一個延伸檔案。在擴展系統上,這可能需要相當長的時間。 
  • Metro Node 支援通常只需要基本檔案,但在部分情況下,他們可能也會要求提供擴充檔案。 
  • 執行收集診斷時可能會要求使用的標準選項包括: 

 

    「--noextended」,此選項會省略延伸診斷的集合。 
    「--last-logs」,此選項會擷取回 x 小時或天數的記錄。 

 

  • 如需更多有關命令的詳細資料,您可以輸入「collect-diagnostics -h」。 

 

以下是這兩個檔名的範例,日期和時間(顯示為 YYYY-MM-DD-HH.MM.SS)將從收集這些檔名的日期和時間開始: 

 

  • 基本檔案 - <序號>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz 
  • 擴充檔案 - <序號>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz 

        

  1. 效能問題十分複雜,需要收集大量特定資訊。因此,我們會要求客戶填寫績效問卷,以加快此流程。您可以在結尾的附件區段中找到本知識文章隨附的調查問卷。 

 

  1. 在某些類型的性能問題中,捕獲名為“fe_perf_stats”的其他日誌會很有説明。記錄會持續產生,但不會由收集診斷擷取。若要擷取此記錄,請在每個叢集節點上 cd (變更目錄) 至 /var/log/VPlex/cli,然後執行命令「tar cvzf fe-perf-stats.tar.gz fe_perf_stats*」,將檔案資料壓縮為 tar 檔案。使用 WINSCP 或同等的 SCP 公用程式連線至節點,然後導覽至 /var/log/VPlex/cli。將「fe-perf-stats.tar.gz」檔案複製到您的系統如果支援部門要求,將 tar 檔案連同收集診斷檔案一起上傳至 SR,否則支援會在 SR 和電子郵件中為您提供 ftp 連結。 

  

  1. 除了收集診斷資訊外,捕獲以下資訊可能會有所説明;
  • 打開 PuTTY 會話的記錄,
  • 然後運行以下命令,
  • 然後收集 Putty 日誌並下載到您的系統,
  • 然後附加 PuTTY 記錄、收集診斷和
    任何其他要求至 SR 的資料。

 

下列命令將從 VPlexcli 提示中執行。  

 

  1. 叢集狀態 
  2. ll 叢集/**/storage-views/* --full 
  3. LL ~連接埠 
  4. show-use-hierarchy /clusters/**/virtual-volumes/* 
  5. ll ~系統磁碟區 
  6. ls -t /clusters/*/directors/*::serial-number [此命令會列出每個節點的所有 DST]
  7. ls -t /clusters/**/director-*/::hostname [顯示的主機名稱將是 IP 位址,這是預期中的數目]

  

二. 如何在 Metro Node 叢集上擷取收集診斷? 
 
注意:涵蓋過去 30 天的基本檔案足以調查並解決大部分問題。除非支援部門另有指示,否則應使用這些選項。
若要擷取此資料,請使用下列旗標執行 collect-diagnostics 命令:「--noextended」和「--last-logs 30d」。

 

  1. 在導向器節點 Linux 提示字元 (例如 service@director-1-1-a) 建立 SSH 工作階段,然後登入 vplexcli。 

 

範例輸出:

login as: service 
Keyboard-interactive authentication prompts from server: 
| Password: 
End of keyboard-interactive prompts from server 
Last login: <date and timestamp data> from x.x.x.x
service@director-1-1-a:~> 
service@director-1-1-a:~> vplexcli 
Trying ::1... 
Connected to localhost. 
Escape character is '^]'. 
 
VPlexcli:/> 

 

  1. 若要啟動 collect-diagnostics,請從 vplexcli 提示執行「collect-diagnostics」命令,其導向選項如下範例所示。 

 

範例輸出: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2024-02-09 19:55:13 UTC: No cluster-witness server found. 
2024-02-09 19:55:13 UTC: Free space = 88G 
2024-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection .. 

 

C. 如何驗證導向器/節點上現有的收集診斷套裝。 

 

  1. 當 collect-diagnostics 命令完成並返回到 vplexcli 提示時,請連線至使用 winscp [或同等 SCP 公用程式] 執行命令的導向器,並導覽至資料夾 /diag/collect-diagnostics-out/ 

 

  1. 識別具有正確時間戳的日誌檔,並將其下載到本地工作站。 

 

D. 如何中止正在進行的收集診斷

注意:  這是非破壞性活動。由於沒有中止收集程序的直接命令,您必須重新啟動管理主控台。不過,在中止執行中的收集診斷程式之前,請先聯絡支援部門,說明您為何要中止執行收集診斷程式,以確保其正常運作,因為可能會遺失資料。中止動作後重新執行收集診斷時,將無法再次收集遺失的資料。

 

  1. 如果您仍在啟動收集診斷的 PuTTY 工作階段中,您應該會看到收集診斷輸出串流,顯示它仍在執行中。 

 

範例輸出: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2022-02-09 19:55:13 UTC: No cluster-witness server found. 
2022-02-09 19:55:13 UTC: Free space = 88G 
2022-02-09 19:55:13 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection .. 

  

  1. 開啟重複的 PuTTY 工作階段,然後使用服務帳戶登入您啟動收集診斷的導向器。 

 

  範例輸出: 

login as: service 
Using keyboard-interactive authentication. 
Password: 
Last login: <date and time stamp data> from x.x.x.x 
service@director-1-1-b:~>

 

  1. 進入導向器後,使用下列命令重新開機管理主控台,中止執行中的收集診斷。  

 

範例輸出: 

   service@director-1-1-b:~> sudo systemctl restart VPlexManagementConsole.service 
 

  1. 回顧第一個執行收集診斷的 PuTTY 工作階段,當您重新啟動管理主控台時,您應該會看到收集診斷報告以下內容作為最後記錄的輸出: 

 

"Connection closed by foreign host."

 

範例輸出 (檢查輸出的最後一行):

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
2022-02-09 20:02:04 UTC: No cluster-witness server found. 
2022-02-09 20:02:04 UTC: Free space = 88G 
2022-02-09 20:02:04 UTC: Total space needed = 1907M 

================================================================================ 

Starting collect-diagnostics, this operation might take a while... 

================================================================================ 

Executing cluster collection ..                               ERROR 
Executing SMS log collection ..                               Connection closed by foreign host. <<<

 

  1. 看到收集診斷停止後,上述步驟 3,返回第二個 PuTTY 工作階段並「cd」至 /diag 目錄,然後執行「 ll 」,您應該會看到一些額外的目錄, 

 

  • 收集-診斷-TMP
  • 收集-診斷-工作 
  • collect-diagnostics-tmp-ext*

      *如果未省略擴展檔

 

範例輸出: 

service@director-1-1-b:/diag> ll 
total 32 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag> 

 

  1. 如果您查看這些目錄內部,您會看到具有您開始現在取消的收集診斷的日期和時間的檔。這些檔案會佔用 /diag 磁碟分割中的空間,應將其移除。 

 

  1. 若要從 /diag 目錄中移除/刪除檔案,請輸入「rm -r collect-diagnostics-jobs」和「rm -r collect-diagnostics-tmp」,然後再次輸入「 ll 」,以確保目錄已刪除/移除。 

 

範例輸出: 

service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 

service@director-1-1-b:/diag> ll 
total 24 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 
service@director-1-1-b:/diag> 

 

  1. 如果不存在「collect-diagnostics-tmp-ext」目錄,請將其移除,請執行「rm -r collect-diagnostics-tmp-ext」  

 

注意:擴展檔通常用於調查節點崩潰。如果正在調查節點當機,且支援部門尚未擷取所有必要的記錄,請先諮詢支援部門,再清理 collect-diagnostics-tmp-ext 目錄,因為這樣做可能會刪除必要的核心檔案。 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 03 Apr 2024
Version:  6
Find answers to your questions from other Dell users
Support Services
Check if your device is covered by Support Services.