Skip to main content
  • Place orders quickly and easily
  • View orders and track your shipping status
  • Enjoy members-only rewards and discounts
  • Create and access a list of your products

Avamar:如何理解“status.dpn”命令生成的输出

Summary: Avamar:如何理解“status.dpn”命令生成的输出

This article applies to   This article does not apply to 

Symptoms

本知识库文章与运行版本 7.x + 的 Avamar 系统相关。本文介绍 status.dpn 命令,并说明其输出的每个部分。

Cause

请参阅“解决方案”部分中的信息

Resolution

status.dpn 命令是什么?   
Status.dpn 命令是一个 perl 脚本,它将一系列 avmaint nodelist 和 Linux OS 命令格式化为用户可读的格式,以便查看 Avamar 网格的当前状态。与其他 Avamar 命令和工具类似,status.dpn 位于 /usr/local/avamar/bin/ 目录中。Status.dpn 依赖于 GSAN 联机运行,因为 avmaint 与 GSAN 交互以运行其命令。如果 GSAN 未在数据节点上运行,则不会显示有关该数据节点的任何信息(节点编号和脱机状态除外)。

status.dpn 输出的示例:    
Mon Jan 24 12:00:52 EST 2013 [AVAMAR1] Mon Jan 24 16:00:52 2013 UTC (initialized Thu Nov 24 10:35:01 2011 UTC)
Node IP Address Version State Runlevel Srvr+Root+User Dis Suspend Load UsedMB Errlen %Full Percent Full and Stripe Status by Disk
0.0 10.20.30.41 6.1.0-402 ONLINE FullAccess MHPU+0HPU+0HPU 1 False 0.01 15967 1457401 9.1% 9%(ONL:403) 9%(ONL:388) 9%(ONL:387)
0.1 10.20.30.42 6.1.0-402 ONLINE fullaccess mhpu+0hpu+0hpu 0 false 0.05 15967 1432248 9.1% 9%(ONL:389) 9%(ONL:395) 9%(ONL:394)
0.2 10.20.30.43 6.1.0-402 ONLINE fullaccess MHPU+0HPU+0HPU 0 FALSE 0.05 15976 1345864 9.1% 9%(ONL:377) 9%(ONL:399) 9%(ONL:401)
0.3 10.20.30.44 6.1.0-402 ONLINE fullaccess MHPU+0HPU+0HPU 0 FALSE 0.00 15969 1608943 9.1% 9%(ONL:388) 9%(ONL:406) 9%(ONL:383)
Srvr+Root+User Modes = migrate + hfswriteable + persistwriteable + useraccntwriteable All reported states=(ONLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0hpu)
System-Status: ok
Access-Status: full

Last checkpoint: cp.20121223181633 finished Sun Jan 23 18:17:00 after 00m 27s (OK)
Last GC: finished Sun Jan 23 17:07:26 2013 after 01m 25s>>recovered 342.02 MB (OK)
Last hfscheck: finished Sun Jan 23 18:16:19 2013 after 12m 05s >>

已检查 2132 条带中的第 2132 条(正常)

维护时段计划程序容量配置文件处于活动状态。   
  维护窗口当前正在运行。
  下一个备份窗口开始时间:Mon Jan 24 02:00:00 2013 EST
下一个维护窗口开始时间:Mon Jan 24 10:00:00 2013 EST
 
status.dpn 命令的第一行显示本地时区的时间和日期、Avamar Utility Node 的主机名、UTC 时间和日期以及 UTC 初始化(安装)Avamar 网格的时间和日期。显示 UTC,因为数据节点以 UTC 时间运行。
 
节点:   
显示每个数据节点的逻辑节点编号。status.dpn 命令不会显示实用程序节点的任何状态信息,因为 GSAN 不会在实用程序节点上运行。

IP 地址:    
显示数据节点的 IP 地址。对于第 4 代和第 4 代,这将显示内部备份网络的 IP 地址。所有以前的硬件代系都只包含一个网络。

版本:    
显示 Avamar 数据节点上 GSAN 二进制文件的版本。如果安装了 GSAN 热修复程序,则 GSAN 二进制文件可能会附加热修复程序编号。Avamar 网格上所有 Avamar 数据节点的版本号应匹配。

状态:   
显示 Avamar 数据节点的当前状态代码。
  • 联机 — GSAN 当前在此数据节点上运行。正常功能。
  • 离线 — GSAN 当前未在此数据节点上运行。需要进行故障处理。
Runlevel:    
显示每个 Avamar 数据节点的 GSAN 进程的运行级别状态。GSAN 有 10 个运行级别。
  • 关闭 — 关闭 GSAN 进程。
  • 启动 - 联机启动 GSAN 进程。
  • 连接 — 连接到每个数据节点的 GSAN 的 GSAN。
  • 验证 — 验证每个 Avamar 数据节点的条带 DNS 表。
  • 启动 - 使条带联机。
  • Sync — 通过重建或使用事务日志确定需要更新的条带(如果有)。
  • 升级— 在 GSAN 二进制文件更新到较新版本时使用。
  • 正在运行— GSAN 已启动。所有条带都联机,但不可用于接受备份。
  • Fullaccess — 网格可用于接受备份。
Srvr+Root+User:    
显示 Avamar 数据节点的活动访问模式。
  • Srvr - Avamar GSAN 权限。
  • Root — Avamar dpn root 用户权限。
  • 用户 — 所有其他用户权限
  活动访问模式
  • MHPU + 0HPU + 0HPU - 完全访问权限 - 正常操作。
  • mhpu+0hpu+0000 — Admin Mode — 当 waitcgsan 由于 hfscheck 而启动时,GSAN 容量等于或大于 diskreadonly 限制,并且操作系统容量利用率的差异超过 avmaint 配置中列出的 freespaceunbalance 值。
  • mhpu+0000+0000— Sync Mode — 在 GSAN 重新启动期间,同步条带时以及 testintegrity 正在运行或条带正在重建时。
  • m000+0000+0000— 只读模式— 在垃圾收集和检查点期间。也可能显示为 0000+0000+0000。 
提醒:在 Avamar 版本 7.x 及更高版本中,垃圾收集在完全访问模式下运行,并且不会将 Avamar 网格置于只读模式
 
如果正在运行的两个活动影响活动访问模式,则启用限制性最强的模式。
 
有关影响活动访问模式的流程,请参阅 附录 #1
 
mhpu 位的定义。
  • m=Migrate — 系统是否能够迁移条带?
  • h=HFS Data Store — 系统是否能够写入 HFS 数据存储?
  • p=持久存储 - 系统是否能够写入持久存储?
  • u=User Accounting System - 系统是否能够写入用户会计系统?
Dis:    
Avamar 数据节点上使用的调度程序数。调度程序连接是到 Avamar 数据节点上的 GSAN 进程的连接。每个 GSAN 连接或 GSAN 交互命令一个调度程序连接。GSAN 连接的示例是使用 avtar 进程的备份会话。GSAN 交互命令的示例是 avmaint。请参阅知识库文章 63548:可以同时与 Avamar Server 建立多少个客户端会话?(从 v6.1 开始), 了解有关每个软件版本的每个 Avamar 数据节点可以运行的调度程序连接数的信息。

暂停:   
显示调度程序是否已暂停。如果挂起,Avamar 网格会阻止激活新的调度程序以用于备份、还原和复制。

负荷:    
Avamar 数据节点上的瞬时总负载平均值。通过 Linux 操作系统“uptime”命令获得类似指标。

已用MB:    
所有进程当前使用的 Avamar 数据节点的 RAM 总量。通过 Linux 操作系统“free -m”命令获得类似指标。

错误:    
Avamar 数据节点上 /data01/cur/err.log 的长度(以字节为单位)。

%Full:    
Avamar 数据节点的总 GSAN 容量的已用百分比。百分比四舍五入到整数,例如47%

Percent Full and Stripe Status by Disk:    
显示每个分区的条带数及其在 Avamar 数据节点上的状态。有关条带状态的更多信息,请参阅 附录 #2

根据 GSAN 容量显示分区已用的百分比。百分比四舍五入到小数点后第一位,例如 46.8%

所有报告的状态:    
提供网格状态的摘要。列出节点状态、运行级别和模式。如果一个项目有多个状态,它会列出每个状态。例如,如果节点处于离线状态,我们会看到以下内容:    
所有报告的状态=(ONLINE, OFFLINE), runlevels=(fullaccess), modes=(mhpu+0hpu+0hpu)

系统状态:   
显示 OK或 degraded。如果节点处于离线状态,则会出现降级状态。

访问状态:    
显示网格是否由于活动访问模式而具有限制。如果实施了限制,则会显示“admin”。如果没有限制,则显示“full”。此部分还会显示是否有任何条带离线或处于OFFLINE_MEDIA_ERROR状态。


维护活动、任务和计划:    
第一个部分显示自 GSAN 联机以来的维护活动状态。它显示维护活动的进度及其正在进行、已完成或失败并显示错误的状态。

如果最近启动了 GSAN,则维护活动的状态将被清除。有关示例,请参阅 附录 #3

第二个部分显示当前正在进行的计划、当前正在进行的维护任务以及维护和备份计划信息。 
 
维护任务的定义:    
  • 脚本在每个窗口开始时运行 GSAN 维护脚本。  默认情况下,最多不间断运行长达 15 分钟,之后与其他任务并行运行,直至完成。这些脚本位于 /usr/local/avamar/etc/gsan-maint-scripts/ 目录中。
  • IndexCacheLoader - 在备份窗口和维护窗口开始时(如果需要)加载索引高速缓存,并在维护窗口开始时卸载索引高速缓存。在 7.x 中,有一个 indexcacheunloader 任务来显示 indexcaches 正在卸载。
  • 取消- 在垃圾数据收集之前取消/终止备份。默认情况下,运行 15 分钟。持续时间是可配置的。
  • gc/cp/hfscheck - 相应的维护任务当前正在运行。
  • 自动修复 -在 hfscheck 完成后执行自动修复(如果需要)。
  • 转换- 在维护时段结束时转换条带(如果需要)。
  • PoolCheck -如果需要,在维护窗口结束时运行文件池检查。它在具有文件池的第 3 代 3.3 TB 节点上运行。
  • balance(6.1.0 及更高版本)如果维护活动完成后还有时间,则在维护时段结束时平衡条带。默认情况下,暂时将 balancemin 设置为 10(可在 avmaint 计划中配置),除非已使用 avmaint config 显式设置 balancemin”。
计划 Avamar 维护(垃圾收集、检查点和 hfscheck)和备份计划启动的时间设置了计划信息。此部分还显示是否有任何计划或个别维护活动已停止或暂停。有关示例,请参阅 附录 #4

Additional Information

附录 #1
活动访问模式 — 以下是可以更改 Avamar 网格访问模式的项目。运行以下命令以确定哪个进程更改了 Avamar 网格的活动访问模式。

avmaint nodelist --xmlperline=99 | grep activityaccessmodes

输出示例:   

<ActivityAccessModes AdminUser=“MHPU+0HPU+0HPU” checkpoint=“MHPU+0HPU+0HPU” conversion=“MHPU+0HPU+0HPU” diskbeat=“MHPU+0HPU+0HPU” GARBAGECOLLECT=“MHPU+0HPU+0HPU” HEARTBEAT=“MHPU+0HPU+0HPU” HFSCHECKSERVER=“MHPU+0HPU+0HPU” HFSCHECKEXECUTE=“MHPU+0HPU+0HPU” nodebeat=“MHPU+0HPU+0HPU” runLevel=“MHPU+0HPU+0HPU” testIntegrity=“MHPU+0HPU+0HPU” removehashes=“MHPU+0HPU+0HPU” rebuildstripe=“MHPU+0HPU+0HPU” DISKFULL=“MHPU+0HPU+0HPU”/>


附录 #2
条带状态 — 有六种条带状态。
ONL - 在线 - (onl:2961) - Stripe 在线,没有问题。  正常条带状态。
OFF - Offline - (onl:2960,OFF:1) - 条带离线。  这可能是由于正在重建条带或条带因错误而离线。
ERR - 错误 - (onl:2959,ERR:2) — 条带处于OFFLINE_MEDIA_ERROR状态。  请参阅知识库文章 163584:Avamar — 对出现 OFFLINE_MEDIA_ERROR 错误的条带离线进行故障处理(解决方案路径), 以了解更多信息。
SUS — 挂起 — (onl:1,SUS:2960) — 条带因磁盘 I/O 性能而挂起,并导致 Avamar 挂起数据分区。请参阅 KB 61342:Avamar 上挂起的分区、条带和 hfscheck 故障(症状代码 22632)(仅限 EMC 内部),以了解更多信息。
MIG — 迁移 — (onl:2960,MIG:1) — 条带正在移动/迁移到不同的 Avamar 数据节点。
RES — 重新启动 — (onl:2040,RES:920) = 条带正在从之前的离线状态重新启动。


附录 #3
已在 Avamar 网格上运行的维护活动的示例输出。

Last checkpoint: cp.20121223181633 finished Sun Jan 23 18:17:00 2013 after 00m 27s (OK)
Last GC: finished Sun Jan 23 17:07:26 2013 after 01m 25s >> recovered 342.02 MB (OK)
Last hfscheck: finished Sun Jan 23 18:16:19 2013 after 12m 05s >> checked 2132 of 2132 stripes (OK)


gsan restart后维护活动的示例输出。


无检查点尚未
GC 尚未



hfscheck附录 #4
维护计划、检查点、垃圾收集和 hfscheck 被暂停的输出示例:

维护窗口计划程序容量配置文件处于活动状态。
  警告:计划程序已停止。
  警告:cp 暂时暂停。
  警告:gc 暂时暂停。
  警告:hfscheck 已暂时挂起。
  下一个备份窗口开始时间:Tue Jan 25 15:00:00 2013 EST
下一个维护窗口开始时间:Mon Jan 24 10:00:00 2013 EST



附录 #5
status.dpn command options
status.dpn <interval in seconds> — 在指定的秒数内循环运行 status.dpn 命令。  值 10(十)每 10 秒返回一次 status.dpn 输出,直到手动退出该命令。  值 0(零)返回单个 status.dpn 输出,不循环。
--help - 显示 status.dpn 帮助菜单。
--short - 在 status.dpn 中显示较少的详细信息。删除主机名、版本、负载、UsedMB %Full 和 Percent Full 以及按磁盘划分的条带状态信息。用于更快地显示 status.dpn 输出和故障排除目的。
--sort - 按不同的变量选项对节点进行排序。
          =node - 按逻辑节点编号对数据节点进行排序。默认排序设置。
          =ipaddr - 按 IP 地址对数据节点进行排序。
          =dispatcher - 按正在使用的调度程序数量对数据节点进行排序。排序后,正在使用的调度员数量最低的是列表的顶部。
          =load - 按负载值对数据节点进行排序。  排序的最小负载值位于列表顶部。
          =used - 按 UsedMB 值对数据节点进行排序。排序后的 UsedMB 最小值位于列表顶部。
          =full - 按 %Full 值对数据节点进行排序。排序后的最小值 %Full 位于列表顶部。

Affected Products

Avamar

Products

Avamar