Feilsøkingsveiledning for NetWorker: Prosesskrasj og kjernedumper
Skjerm: Omfattende Dell NetWorker-veiledning for feilsøking av prosesskrasj og kjernedumper
Se på YouTube
Det kan være mange grunner til at en NetWorker-prosess ikke reagerer. Denne artikkelen beskriver den anbefalte metoden for å isolere og løse et NetWorker-problem som ikke svarer.
Kontroller at hvert feilsøkingstrinn nedenfor gjelder for miljøet ditt. Hvert trinn inneholder instruksjoner eller en kobling til et dokument for å eliminere mulige årsaker og iverksette korrigerende tiltak etter behov. Trinnene er ordnet i den mest hensiktsmessige rekkefølgen for å isolere problemet og identifisere riktig løsning. Ikke hopp over et trinn.
Trinn 1: Innsamling av informasjon - Problembeskrivelse
For å generere en fullstendig problembeskrivelse, ta opp følgende spørsmål:
- Under hvilke omstendigheter krasjer prosessen. Er denne oppførselen konsekvent?
- Fungerte dette bedre før.
- Tider for forekomster og observert atferdstrender
- Oppstår problemet bare ved tider med stor belastning på backup-miljøet eller sikkerhetskopier eller en bestemt type backup-gruppe.
- Når oppsto problemet første gang. Hva endret seg da?
- Hva er omfanget av problemet (alle klienter/noen klienter, alle backup-mål eller noen)
- Hva har blitt forsøkt så langt å fikse og hvilke konklusjoner er trukket fra dette.
Trinn 2: Samle informasjon - Miljø
- Hvilken NetWorker-prosess som ikke svarer og på hvilken maskin (server, lagringsnode eller klient).
- NetWorker serverversjon og plattform
- Oversikt over størrelsen og arten av backup datazone - Målmedier for disse sikkerhetskopiene
Trinn 3: Støtte
- Bruk den elektroniske NetWorker Compatibility Guide til å kontrollere at alle komponenter (NetWorker-server, filsystemversjon, proxy, lagringsnoder, klienter, mål) støttes.
- Kontroller at det ikke er noen underliggende operativsystem- eller maskinvaremangel som kan forklare prosesskrasjene (diskfeil, full disk, nettverksfeil og så videre).
Trinn 4: Beste framgangsmåte
NetWorker Performance Optimization Planning Guide inneholder flere forslag til programvare- og maskinvarekrav og anbefalinger som bør implementeres for å få et optimalt tilpasset NetWorker-miljø. Dette bør gjennomgås for å sikre at de anbefalte fremgangsmåtene følges for denne datasonen. Dette er relevant hvis prosessen ikke reagerer, skjer på tider med tyngste belastning.
Trinn 5: Komponentisolering
Hvordan vi går frem for å finne årsaken til at prosessen ikke svarer på problemet, avhenger av virkemåten som definert i trinn 1. Hvis utløseren er ukjent, kan tester utføres for å prøve å fastslå hva som utløser krasjet:
- Overvåk systemytelsen under tung belastning
- Undersøk operativsystemets loggfiler rundt tidspunktet for krasj for fellestrekk i atferd
- Les NetWorker-tidsplanen for å finne ut om det er en sammenheng mellom forekomsttider og en bestemt NetWorker-planlagt aktivitet.
- Finn ut hvilke ikke-NetWorker-operasjoner som kjører på denne maskinen som kan påvirke oppførselen, og om tidsplanen deres korrelerer med krasjtidspunktene.
- Hvis krasjet skjer konsekvent, endre noen parametere for å prøve å begrense årsaken. For eksempel sikkerhetskopiering til et annet målmedium eller sikkerhetskopiering av ulike typer data fra samme NetWorker-klient
Trinn 6: Resolution (oppløsning)
En coredump er en spesiell fil som representerer en dump av arbeidsminnet til en prosess på et bestemt tidspunkt, vanligvis når programmet er avsluttet unormalt. Kjernedumpfiler kan brukes til å diagnostisere årsaken til at prosessen ikke reagerer, ved å analysere hvilke funksjoner i prosessen som kjørte da krasjet skjedde, og hvilke data som ble åpnet.
De fleste operativsystemer genererer ikke kjernedumpfiler automatisk. Operativsystemparameterne må endres slik at det genereres en kjernedumpfil når en prosesskrasj oppstår. Denne modifikasjonen må gjøres før krasjet.
1) Se katalogen /nsr/cores for nylige kjernedumper av NetWorker-prosesser i Unix eller Linux, eller kontroller krasjkatalogen som definert i Windows-registeret (se trinn 2).
2) Hvis det ikke finnes noen, kontrollerer du at operativsystemet er konfigurert til å generere kjernedumpfiler hvis det oppstår et prosesskrasj. Se dokumentasjon for operativsystem for alle detaljer, men kort fortalt vil dette trolig innebære å endre ulimit -c- og -f-verdier i linux eller unix og gjøre en registerendring i Windows.
For windows 2008R2:
- Oppdater registeret med den nye nøkkelen oppgitt på http://msdn.microsoft.com/en-us/library/bb787181(VS.85).aspx.
- Ved hjelp av de anbefalte verdiene, blir dumpfilen opprettet i C: \ Users \ Administrator \ AppData \ Local \ CrashDumps
- Aktiver full krasjdumper.
3) Kjernefilen kan undersøkes på selve vertsmaskinen eller kan pakkes for analyse på en annen maskin. Detaljer om hvordan du pakker disse kjernefilene er tilgjengelig her:
UNIX og Linux kjernefil emballasje:
489272: Slik samler du inn kjerne-/krasjdumpinformasjon og relaterte logger
4) Analyser tilgjengelige data:
– Loggfiler
for operativsystem – NetWorker-bakgrunnsprosessen fra NetWorker-serveren og relevant lagringsnode.
- Kjernefil eller krasjfil
Detaljert analyse av en kjernefil krever avansert kunnskap om NetWorkers interne operasjoner, og bør utføres av EMC NetWorker Support. En første lesing av kjernefilen kan imidlertid gjøres for å sammenligne innholdet i kjernefilen med kjente problemer.
Linux og HP-UX
gdb [full bane til prosess] [kjernefil]
(gdb) der
AIX
dbx [full bane til prosess] [kjernefil]
(dbx) der
Solaris
pstack [kjernefil]
dbx [full bane til prosess] [kjernefil]
(dbx) der
Windows
- Start windbg windows debugger program-Klikk
på File og Open Dump File i windbg.
- Skriv analyser --v i det nederste kommandovinduet for å hente full informasjon.
5) Basert på analysen ovenfor og kunnskap om systematferden kan du sammenligne hendelsen med listen over kjente problemer som er beskrevet i produktmerknadene for NetWorker for den nyeste versjonen.
Trinn 7: Avansert feilsøking (om nødvendig)
Hvis du har mistanke om at det er en feil i NetWorker-programvaren som er årsaken til at prosessen ikke svarer, må du pakke krasjfilen (se trinn 3) og gi den en fullstendig beskrivelse av den observerte atferden, til Dell Technologies NetWorker Support for en detaljert analyse av problemet.