메트로 노드: 메트로 노드에서 로그를 수집하는 방법

Summary: 이 문서에서는 Metro Node에서 로그를 수집하는 방법에 대한 단계를 간략하게 설명하고 성능 문제에 필요할 수 있는 로그/데이터에 대해서도 설명합니다.

다음 작업을 수행하는 방법에 대한 단계: 

  1. Metro Node 문제를 디버깅하는 데 필요한 로그는 무엇입니까? 
  2. Metro Node 클러스터에서 collect-diagnostics를 캡처하려면 어떻게 해야 합니까? 
  3. 관리 서버에서 기존 collect-diagnostics 패키지를 검증하는 방법  
  4. Metro Node에서 진행 중인 수집 진단을 중단하고 정리하는 방법  

참고: SupportAssist 로그가 필요한 경우 고객에게 KBA 000135669, "SupportAssist Enterprise에서 SupportAssist 로그 수집을 내보내는 방법"을 참조하도록 안내합니다. 연결됨 또는 연결 끊김 "

 A. Metro Node 문제를 디버깅하는 데 필요한 로그는 무엇입니까? 

  1. Metro Node에서 로그를 수집하는 데 필요한 명령을 "collect-diagnostics"라고 하며 Metro Node 설정의 임의[1] 노드에서 실행할 수 있습니다. Metro Node 클러스터의 한 디렉터에서 이 명령을 실행하려면 클러스터의 모든 노드에 있는 모든 디렉터의 모든 데이터가 있어야 합니다. 한 번에 둘 이상의 노드에서 이 명령을 실행하지 마십시오.


[1] 참고: Metro 구성의 경우 하나의 클러스터에서만 하나의 디렉터에서만 'collect-diagnostics' 명령을 실행하고 완전히 완료될 때까지 기다린 후 다른 디렉터 또는 피어 클러스터에서 필요한 경우 피어 클러스터에서 CD를 수집합니다. 
  1. 'collect-diagnostics' 명령은 구성 및 로그 파일을 포함하는 압축된 tar.gz 로그 파일을 생성합니다. collect-diagnostics 파일은 실행된 노드의 /diag/collect-diagnostics-out/ 디렉토리에 있습니다. 명령이 완료되면 WINSCP 또는 이와 동등한 SCP 유틸리티를 사용하여 노드에서 파일을 복사한 다음 분석을 지원하기 위해 제공할 수 있습니다. 이 명령의 사용에 대한 자세한 내용은 아래 섹션 B에 나와 있습니다.



  • 'collect-diagnostics' 명령이 옵션 없이 실행되면 기본 파일과 확장 파일의 두 파일이 생성됩니다. 확장된 시스템에서는 시간이 오래 걸릴 수 있습니다. 
  • 메트로 노드 지원에는 일반적으로 기본 파일만 필요하지만, 경우에 따라 확장 파일에 대한 성능 문제도 발생할 수 있습니다. 
  • collect-diagnostics를 실행할 때 사용하도록 요청될 수 있는 표준 옵션은 다음과 같습니다. 


    "--noextended", 이 옵션은 확장 진단 컬렉션을 생략합니다. 
    "--last-logs," 이 옵션은 x시간 또는 일 단위로 로그를 캡처합니다. 


  • 명령에 대한 자세한 내용을 보려면 "collect-diagnostics -h"를 입력합니다. 


다음은 이 두 파일 이름의 샘플입니다. YYYY-MM-DD-HH.MM.SS 으로 표시된 날짜와 시간은 수집된 날짜와 시간을 기준으로 합니다. 


  • 기본 파일 - <일련 번호>-c1-diag-YYYY-MM-DD-HH.MM.SS.tar.gz 
  • 확장 파일 - <일련 번호>-c1-diag-ext-YYYY-MM-DD-HH.MM.SS.tar.gz 


  1. 성능 문제는 복잡하며 많은 특정 정보를 수집해야 합니다. 따라서 이 프로세스를 신속하게 진행하기 위해 고객이 작성해야 하는 성능 설문지를 준비했습니다. 설문지는 끝부분의 첨부 섹션에 있는 이 기술 자료 문서에 첨부되어 있습니다. 


  1. 일부 유형의 성능 문제에서는 "fe_perf_stats"라는 추가 로그를 캡처하는 것이 유용합니다. 로그는 지속적으로 생성되지만 collect-diagnostics에 의해 캡처되지 않습니다. 이 로그를 캡처하려면 각 클러스터의 노드에서 cd(디렉토리 변경)를 /var/log/VPlex/cli로 이동하고 "tar cvzf fe-perf-stats.tar.gz fe_perf_stats*" 명령을 실행하여 파일 데이터를 tar 파일로 압축합니다. WINSCP 또는 이와 동등한 SCP 유틸리티를 사용하여 노드에 연결하고 /var/log/VPlex/cli로 이동합니다. "fe-perf-stats.tar.gz" 파일을 시스템에 복사합니다. 지원 팀에서 요청할 경우 tar 파일을 collect-diagnostics 파일과 함께 SR에 업로드하거나 지원 부서에서 SR과 이메일로 제공하는 FTP 링크를 업로드합니다. 


  1. 진단 정보를 수집하는 것 외에도 다음 정보를 캡처하는 것이 도움이 될 수 있습니다.
  • PuTTY 세션에 대한 Open Logging,
  • 그런 다음 아래 명령을 실행합니다.
  • 그런 다음 Putty 로그를 수집하고 시스템에 다운로드하십시오.
  • 그런 다음 PuTTY 로그, 진단 수집 및
    SR에 요청된 기타 데이터를 첨부합니다.


다음 명령은 VPlexcli 프롬프트에서 실행됩니다.  


  1. 클러스터 상태 
  2. ll clusters/**/storage-views/* --full 
  3. ll ~포트 
  4. show-use-hierarchy /clusters/**/virtual-volumes/* 
  5. ll ~system-volumes 
  6. ls -t /clusters/*/directors/*::serial-number [이 명령은 각 노드에 대한 모든 DST를 나열합니다.]
  7. ls -t /clusters/**/director-*/::hostname [표시되는 호스트 이름은 IP 주소입니다. 예상된 동작입니다.]


B. Metro Node 클러스터에서 collect-diagnostics를 캡처하려면 어떻게 해야 합니까? 
참고: 지난 30일에 대한 기본 파일만으로도 대부분의 문제를 조사하고 해결할 수 있습니다. 이러한 옵션은 지원 부서에서 달리 지시하지 않는 한 사용해야 합니다.
이 데이터를 캡처하려면 "--noextended" 및 "--last-logs 30d" 플래그를 사용하여 collect-diagnostics 명령을 실행합니다.


  1. 디렉터 노드 Linux 프롬프트(예: service@director-1-1-a)에서 SSH 세션을 설정한 다음 vplexcli에 로그인합니다. 


샘플 출력:

login as: service 
Keyboard-interactive authentication prompts from server: 
| Password: 
End of keyboard-interactive prompts from server 
Last login: <date and timestamp data> from x.x.x.x
service@director-1-1-a:~> vplexcli 
Trying ::1... 
Connected to localhost. 
Escape character is '^]'. 


  1. collect-diagnostics를 시작하려면 vplexcli 프롬프트에서 아래 예와 같이 직접 옵션을 사용하여 "collect-diagnostics" 명령을 실행합니다. 


예제 출력: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2024-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2024-02-09 19:55:13 UTC: No cluster-witness server found. 
2024-02-09 19:55:13 UTC: Free space = 88G 
2024-02-09 19:55:13 UTC: Total space needed = 1907M 


Starting collect-diagnostics, this operation might take a while... 


Executing cluster collection .. 


C. 디렉터/노드에서 기존 collect-diagnostics 패키지를 검증하는 방법 


  1. collect-diagnostics 명령이 완료되고 vplexcli 프롬프트로 돌아가면 winscp[또는 동등한 SCP 유틸리티]를 사용하여 명령을 실행한 디렉터에 연결하고 /diag/collect-diagnostics-out/ 폴더로 이동합니다. 


  1. 올바른 타임스탬프로 로그 파일을 찾아 로컬 워크스테이션에 다운로드합니다. 


D. 진행 중인 Collect-Diagnostics

를 중단하는 방법참고:  이 작업은 무중단 작업입니다. 수집 프로세스를 중단하는 직접 명령이 없으므로 관리 콘솔을 재시작해야 합니다. 그러나 실행 중인 collect-diagnostics를 중단하기 전에 지원 부서에 연락하여 데이터가 손실될 수 있으므로 collect-diagnostics 실행을 중단하려는 이유를 설명하여 정상인지 확인하십시오. 이 손실된 데이터는 중단 작업 후 collect-diagnostics를 다시 실행할 때 다시 수집에 사용할 수 없습니다.


  1. collect-diagnostics를 시작한 PuTTY 세션에 있는 경우 collect-diagnostics 출력 스트리밍이 표시되어야 합니다. 이는 여전히 실행 중임을 보여 줍니다. 


샘플 출력: 

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 19:55:12 UTC: ****Initializing collect-diagnostics... 
2022-02-09 19:55:13 UTC: No cluster-witness server found. 
2022-02-09 19:55:13 UTC: Free space = 88G 
2022-02-09 19:55:13 UTC: Total space needed = 1907M 


Starting collect-diagnostics, this operation might take a while... 


Executing cluster collection .. 


  1. 중복된 PuTTY 세션을 열고 서비스 계정을 사용하여 collect-diagnostics를 시작한 디렉터에 로그인합니다. 


  샘플 출력: 

login as: service 
Using keyboard-interactive authentication. 
Last login: <date and time stamp data> from x.x.x.x 


  1. 디렉터에서 다음 명령을 사용하여 관리 콘솔을 재시작하여 실행 중인 collect-diagnostics를 중단합니다.  


샘플 출력: 

   service@director-1-1-b:~> sudo systemctl 재시작 VPlexManagementConsole.service 

  1. collect-diagnostics가 실행 중인 첫 번째 PuTTY 세션을 다시 살펴보면 관리 콘솔을 다시 시작하면 collect-diagnostics 보고서가 마지막으로 기록된 출력으로 표시됩니다. 


"Connection closed by foreign host."


샘플 출력(출력의 마지막 줄 확인):

VPlexcli:/> collect-diagnostics --noextended --last-logs 30d 

('WARNING:The collect-diagnostics command was issued with option --noextended.\n',) 

The following file(s) will NOT be collected: 

        core files 
        fast trace dump files 
        slow trace dump files 
        udcom trace dump files 
        udcom legacy trace files 
        user-defined performance sink files 
        the management console's heap 

('WARNING:Only the logs that are generated in the last 30 days are collected.') 

2022-02-09 20:02:03 UTC: ****Initializing collect-diagnostics... 
2022-02-09 20:02:04 UTC: No cluster-witness server found. 
2022-02-09 20:02:04 UTC: Free space = 88G 
2022-02-09 20:02:04 UTC: Total space needed = 1907M 


Starting collect-diagnostics, this operation might take a while... 


Executing cluster collection ..                               ERROR 
Executing SMS log collection ..                               Connection closed by foreign host. <<<


  1. collect-diagnostics가 중지된 것으로 보이면 위의 3단계에서 두 번째 PuTTY 세션으로 돌아가서 /diag 디렉토리로 'cd'한 다음 ' ll '을 실행하면 몇 가지 추가 디렉토리가 표시됩니다. 


  • 수집 진단 tmp
  • 수집 진단 작업 
  • 수집 진단 tmp-ext*

      *확장 파일을 생략하지 않은 경우


샘플 출력: 

service@director-1-1-b:/diag> ll 
total 32 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-tmp-ext
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:03 collect-diagnostics-jobs 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwxr-xr-x 3 service groupSvc  4096 Feb  9 20:02 collect-diagnostics-tmp 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 


  1. 이러한 각 디렉토리를 살펴보면 현재 취소된 collect-diagnostics를 시작한 날짜와 시간이 포함된 파일을 볼 수 있습니다. 이러한 파일은 /diag 파티션의 공간을 차지하므로 제거해야 합니다. 


  1. /diag 디렉토리에서 파일을 제거/삭제하려면 "rm -r collect-diagnostics-jobs" 및 "rm -r collect-diagnostics-tmp"를 입력한 다음 ' ll '을 다시 입력하여 디렉토리가 삭제/제거되었는지 확인합니다. 


샘플 출력: 

service@director-1-1-b:/diag> rm -r collect-diagnostics-jobs 
service@director-1-1-b:/diag> rm -r collect-diagnostics-tmp 

service@director-1-1-b:/diag> ll 
total 24 
drwxr-xr-x 2 service groupSvc  4096 Feb  9 20:04 collect-diagnostics-out 
drwx------ 2 root    root     16384 Jan 27 16:54 lost+found 
drwx--x--x 3 service groupSvc  4096 Dec 17 03:08 share 


  1. 'collect-diagnostics-tmp-ext' 디렉토리가 있으면 "rm -r collect-diagnostics-tmp-ext"를 실행하여 제거합니다.  


참고: 확장 파일은 일반적으로 노드 충돌을 조사하는 데 사용됩니다. 노드 충돌에 대한 조사가 진행 중이고 지원 부서에서 필요한 로그를 모두 캡처하지 못한 경우 collect-diagnostics-tmp-ext 디렉토리를 정리하기 전에 지원 부서에 확인하십시오. 정리하면 필요한 코어 파일이 삭제될 수 있습니다. 

Affected Products

metro node mn-114, metro node mn-215
Article Properties
Article Number: 000197436
Article Type: How To
Last Modified: 03 Apr 2024
Version:  6
