Felsökningsguide för NetWorker: Bearbeta krascher och kärndumpar
Video: Dell NetWorker: Omfattande manual för felsökning av processkrascher och kärndumpar
Titta på YouTube
Det finns många olika orsaker till att en NetWorker-process inte svarar. I den här artikeln beskrivs den rekommenderade metoden för att isolera och lösa problem med att NetWorker-process inte svarar.
Kontrollera att varje felsökningssteg nedan gäller för din miljö. Varje steg innehåller instruktioner eller en länk till ett dokument för att eliminera möjliga orsaker och vidta korrigerande åtgärder vid behov. Stegen ordnas i den lämpligaste ordningen för att isolera problemet och identifiera rätt lösning. Hoppa inte över ett steg.
Steg 1: Samla in information – problembeskrivning
För att generera en fullständig problembeskrivning, adressera följande frågor:
- Under vilka omständigheter kraschar processen. Är det här beteendet konsekvent?
- Fungerade detta bättre tidigare.
- Tider för förekomster och observerad beteendetrend
– Uppstår problemet endast vid hög belastning på säkerhetskopieringsmiljön eller säkerhetskopior eller en viss typ av säkerhetskopieringsgrupp.
- När uppstod problemet först. Vad förändrades då?
- Vad är problemets omfattning (alla klienter/vissa klienter, alla säkerhetskopieringsmål eller vissa)
- Vad har man hittills försökt åtgärda och vilka slutsatser har dragits av detta.
Steg 2: Insamling av information - Miljö
- Vilken NetWorker-process som inte svarar och på vilken dator (server, lagringsnod eller klient).
- NetWorker-serverversion och plattform
- Översikt över storleken och typen av säkerhetskopieringsdatazon
- Målmedia för dessa säkerhetskopior
Steg 3: Supportmöjligheter
- Använd NetWorker-kompatibilitetsguiden online för att kontrollera att alla komponenter (NetWorker-server, filsystemversion, proxy, lagringsnoder, klienter, mål) stöds.
- Kontrollera att det inte finns några underliggande operativsystems- eller maskinvarubrister som kan förklara processkrascherna (diskfel, full disk, nätverksfel och så vidare).
Steg 4: Bästa praxis
NetWorker Performance Optimization Planning Guide innehåller flera förslag på program- och maskinvarukrav och rekommendationer som bör implementeras för att få en optimalt avstämd NetWorker-miljö. Detta bör granskas för att vara säker på att bästa praxis följs för den här datazonen. Detta är relevant om processen som inte svarar sker vid tidpunkter med tyngst belastning.
Steg 5: Komponentisolering
Hur vi går tillväga för att hitta rotorsaken till att processen inte svarar beror på beteendet enligt definitionen i steg 1. Om den utlösande faktorn är okänd kan tester utföras för att försöka fastställa vad som utlöser kraschen:
- Övervaka systemets prestanda under hög belastning
- Undersök operativsystemets loggfiler runt tidpunkten för krascherna för att se om beteendet är gemensamt -
Läs NetWorker-schemat för att avgöra om det finns ett samband mellan tidpunkter för en viss schemalagd NetWorker-aktivitet.
- Ta reda på vilka icke-NetWorker-åtgärder som körs på den här datorn och som kan påverka dess beteende och om deras schema korrelerar med tidpunkten för krascher.
- Om kraschen inträffar konsekvent ändrar du några parametrar för att försöka begränsa orsaken. Du kan till exempel säkerhetskopiera till ett annat målmedia eller säkerhetskopiera olika typer av data från samma NetWorker-klient
Steg 6: Upplösning
En kärndump är en speciell fil som representerar en dump av arbetsminnet för en process vid en viss tidpunkt, vanligtvis när programmet har avslutats onormalt. Kärndumpfiler kan användas för att diagnostisera orsaken till att en process inte svarar genom att analysera vilka funktioner i processen som kördes vid tidpunkten för kraschen och vilka data som användes.
De flesta operativsystem genererar inte kärndumpfiler automatiskt. Operativsystemets parametrar måste ändras så att en kärndumpfil genereras när en process kraschar. Den här ändringen måste göras före kraschen.
1) Kontrollera katalogen /nsr/cores för de senaste kärndumparna av NetWorker-processer i unix eller linux eller kontrollera kraschkatalogen enligt definitionen i Windows-registret (se steg 2).
2) Om det inte finns några, kontrollera att operativsystemet är konfigurerat för att generera kärndumpfiler om det sker en processkrasch. Se dokumentationen till operativsystemet för fullständig information, men i korthet kommer detta sannolikt att innebära att ändra ulimit -c- och -f-värden i linux eller unix och göra en registerändring i Windows.
För Windows 2008R2:
- Uppdatera registret med den nya nyckeln som finns i http://msdn.microsoft.com/en-us/library/bb787181(VS.85).aspx.
- Med hjälp av de rekommenderade värdena skapas dumpfilen i C:\Users\Administrator\AppData\Local\CrashDumps
– Aktivera fullständiga kraschdumpar.
3) Kärnfilen kan undersökas på själva värddatorn eller paketeras för analys på en annan maskin. Detaljer om hur du paketerar dessa kärnfiler finns här:
Förpackning av UNIX- och Linux-kärnfiler:
489272: Så här samlar du in information om kärn-/kraschdumpar och relaterade loggar
För Windows följer du anvisningarna häri:
198564: Så här samlar du in kernel- och användardumpen för hängda processer i Windows
4) Analysera tillgängliga data:
– Operativsystemets loggfiler
– NetWorker-daemonloggfil från NetWorker-servern och relevant lagringsnod.
- Kärnfil eller kraschfil
Detaljerad analys av en kärnfil kräver avancerad kunskap om NetWorkers interna funktioner och bör utföras av EMC NetWorker-supporten. En första läsning av kärnfilen kan dock göras för att jämföra innehållet i kärnfilen med kända problem.
Linux och HP-UX
gdb [fullständig sökväg till process] [kärnfil]
(gdb) där
AIX
dbx [fullständig sökväg till process] [kärnfil]
(dbx) där
Solaris
pstack [ kärnfil ]
dbx [fullständig sökväg till processen] [kärnfil]
(dbx) där
Windows
- Starta windbg windows debugger-programmet
- Klicka på Arkiv och öppna dumpfil i windbg.
- Skriv analyze --v i det nedre kommandofönstret för att hämta fullständig information.
5) Baserat på ovanstående analys och kunskap om systemets beteende kan du jämföra incidenten med listan över kända problem som beskrivs i NetWorker-versionskommentarerna för den senaste versionen.
Steg 7: Avancerad felsökning (om det behövs)
Om du misstänker att det finns ett fel i NetWorker-mjukvaran som är orsaken till att processen inte svarar måste du paketera kraschfilen (se steg 3) och skicka denna med en fullständig beskrivning av det observerade beteendet till Dell Technologies NetWorker-support för en detaljerad analys av problemet.