开始新对话

未解决

此帖子已超过 5 年

13813

2016年11月18日 00:00

【专家问答】老司机带您玩转Data Domain

​好消息,新一期的“专家问答”活动正在进行中。本期专家问答将讨论Data Domain相关的技术话题。​


​坐镇专家均为从事多年Data Domain技术问题的高级资深技术工程师们,将全面和大家一起讨论和分享上述话题。不论您有任何关于此题目相关问题,或是想更多的了解其方方面面,请抓住这个与专家直接对话的机会,以回帖的方式来参与在线提问吧。​

​以往所有已完成的“专家问答”活动可参考这个​​汇总贴​​。​

​本期讨论主题:老司机带您玩转Data Domain​

​本期持续时间:2016年11月21日–12月4日,为期两周。​

​我们邀请到的专家有:​


​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​
Dennis Tong_副本.jpg


​Dennis Tong ​​童嘉灏​

​Dennis Tong于2014年加入EMC Data Domain技术支持团队,专注IP网络协议方面的优化及排错,并且熟悉各种备份软件和Data Domain的集成和应用。​



​ ​​ ​
​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​
July Zhang_副本.jpg


​July Zhang 张烨蔚​

​July Zhang于2014年加入EMC Data Domain 技术支持团队,“急诊室”技术支持工程师,负责处理抢救一些紧急的案例以及预诊各种疑难杂症,对于Data Domain硬件,文件系统,网络等方面都有一定了解。​






​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​

​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​
Leon Zhao_副本.jpg


​Leon Zhao 赵靓​

​Leon Zhao高级技术工程师,从事客户技术支持工作近10年,于2013年加入EMC Data Domain技术支持团队,主要负责DataDomain硬件和数据恢复以及网络联通和性能方面的支持工作。​




​ ​​ ​​ ​​ ​​ ​​ ​​ ​​ ​
Matt Song_副本.jpg


​Matt Song 宋晓波​

​高级技术支持工程师。于2014年加入EMC Data Domain技术支持团队,之前曾有多年服务器系统运维经验, 熟悉Linux系统及多种编程语言。在Data Domain技术支持团队中专注于处理文件系统相关的各类疑难杂症。​




​和专家交流,与同行畅谈。欢迎大家以回帖的方式就本次主题相关问题,来积极提问和踊跃发表自己的意见。期待您的参与!​

402 消息

2016年11月20日 18:00

活动正式开启,欢迎大家积极参与哦!

28 消息

2016年11月21日 16:00

请教前辈们,现在购买的DD一般是机头+硬盘这种方式的吧。我在机房看过只有机头没有自带硬盘的DD,这两种有啥不一样的么?

177 消息

2016年11月21日 17:00

前辈们,我想问下,

目前DDboost  支持vmware的FC 链路了么(Networker VBA)?

同样不知道VTL是否可以支持vmware 了呢?

如果支持,需要达到什么样的环境条件呢?

177 消息

2016年11月21日 19:00

谢谢前辈们的解答!

另外我想问下DD关于源端和目标端消重是怎么个设置和定义呢呢,

如何去判断我的备份对象是否支持源端消重?

28 消息

2016年11月21日 21:00

DD的HA的active node和passive node就是两个控制器一组磁盘呀,我以为两个node各自有自己管理的磁盘呢,这样的话咱们的备份的DR就简单多啦。

14 消息

2016年11月22日 04:00

各位前辈你们好, 我在项目中遇到了问题想咨询下。

1客户环境: 主备机房万兆以太网可通,两机房FC不通。 两台Datadomian ,DDboost&VTL 许可,万兆网卡。

2当前配置:主机房Datadomian 通过VTL+Networker 备份生产数据,通过replicator+千兆网卡复制到备机房Datadomain。

3疑问:a,当前环境采用VTL和DDBOOST哪个较好,为啥?b,如果要把当前配置改成DDBOOST,原备份数据如何处理?c,千兆replicator需要改成万兆吗?

望解答!(本人经验稀松)

6 消息

2016年11月22日 17:00

Hi, 大家好.

今天我们来聊一下关于文件系统清理(File system cleaning)的小知识

    1. 什么是文件系统清理

当您的备份应用程序(如NetBackup或NetWorker)过期数据时,DD上的数据由文件系统标记为删除。但是,数据并不会立即被删除,而是在文件系统清理期间被删除.

    • 在清洁操作期间,文件系统可用于所有正常操作, 包括备份(写)和恢复(读)。
    • 虽然文件系统清理会使用一定的系统资源,但是该进程所占用的资源是可以通过设置阈值来控制的。
    • Data Domain建议在第一次完全备份之后运行file system cleaning。
    • 当清洁操作完成时,会向系统日志发送一条消息记录回收的存储空间百分比。

默认计划在每个星期二上午6点(06:00时)运行清洁操作。您可以更改计划,或者您可以手动执行清理操作。(Data Domain建议每周运行一次清洁操作。)

在文件系统被禁用(disable)或者Data Domain被关闭(例如系统电源关闭或重新启动)的情况下,清洁操作将被终止。系统重新启动时,清理操作不会立即重新启动。您可以手动重新开始清洁操作或等待下一次计划清洁操作。

    2. 文件系统清理的各个阶段:

下面各阶段的说明, 本案例基于DDOS 5.5 之后的DDOS版本。从DDOS 5.5开始,新的清理过程(物理清理)将不再逻辑地枚举命名空间(Name Space)中的文件。在之前版本的cleaning中,枚举阶段以文件为单位遍历每个文件的BTREE结构,因此重复的metadata可能会被多次遍历。而在物理清理中,枚举阶段通过扫描容器集(CSET)来并行地遍历所有文件树(BTREE),在多个文件之间共享的每个元数据段将只扫描一次。物理枚举的运行时间取决于系统上的元数据(metadata)的数量以及这种元数据跨容器集分布的方式。

物理清洁引入了两个新阶段:预分析和分析。这些新阶段设置了物理枚举所需的一些数据结构。新阶段的运行时间取决于文件系统中元数据的总量。

以下是物理清理的每个阶段的说明:

    1. 预合并:将内存中的index文件写入到磁盘, 并与full index进行合并,该阶段是为枚举阶段而做准备。
    2. 预分析:为索引中的所有元数据段构建散列向量,以加快索引的检索速度
    3. 预枚举:以元数据为单位枚举文件。它可能只对部分数据段进行采样,以帮助估计可删除的水平所集中在磁盘上的位置。
    4. 预过滤:如果写入的数据中依然有重复数据,则找出它的位置,以便可以从系统中删除。
    5. 预选择:选择具有最多可删除数据的物理空间。这些将作为清理的目标区域。
    6. 候选:由于内存限制,每次清洁运行中只能清除一部分物理空间。运行候选阶段以选择要清理的数据子集,并记住数据中的内容。
    7. 合并:索引合并将索引数据刷新到磁盘并为物理枚举创建参考点。
    8. 分析:为索引中的所有元数据段构建散列向量。
    9. 枚举:基于元数据来枚举所有文件,确认哪些文件是未被标记为删除的,应该保留在系统中。
    10. 过滤:如果写入的数据中依然有重复数据,则找出它的位置,以便可以从系统中删除。
    11. 复制:将目标容器(container)中需要的数据摘取出来 , 写入到新的容器中, 并删除旧的容器(旧的容器中将包含已经删除的磁盘碎片)
    12. 摘要:创建系统上的实时数据的摘要。

    3. 如何查询文件系统清理的相关信息

    • 查看上一次cleaning完成的时间, 使用df命令:

# df

Active Tier:

Resource           Size GiB   Used GiB   Avail GiB   Use%   Cleanable GiB*

----------------   --------   --------   ---------   ----   --------------

/data: pre-comp           -     6605.3           -      -                -

/data: post-comp    32068.8      298.3     31770.6     1%              1.4

/ddvar                 29.5       17.5        10.5    63%                -

----------------   --------   --------   ---------   ----   --------------

* Estimated based on last cleaning of 2016/11/15 06:09:22.

    • 可以通过日志分析过去的清理进程的耗时以及结果:

# log view debug/messages.engineering

### 搜索以下关键字: ###

Apr 22 06:00:01 DD4200-Shanghai ddfs[5640]: NOTICE: MSG-GC-00009: Cleaning started

Apr 22 06:02:25 DD4200-Shanghai ddfs[5640]: NOTICE: MSG-GC-00005: Cleaning completed: 0:02:24 elapsed, 92% of used space freed, 0% of total space freed, 113246208 bytes freed

    • 文件系统清理在每次成功执行完成之后会更新一个报告, 可以通过# filesys show detailed-stats 70 来查看每一步消耗的时间. 该信息也可在每天的autosupport日志中找到

# priv set se

    Enter system password:  << 输入产品序列号作为SE模式的密码

# filesys show detailed-stats 70

GC stats for Physical Cleaning on Active Success 4 Aborted 0

Most recent successful GC container range: 145311 to 297545

GC phase:        pre-merge    time:     130 average:     135    seg/s:        0    cont/s:       0

GC phase:     pre-analysis    time:     146 average:     146    seg/s:        0    cont/s:       0

GC phase:  pre-enumeration    time:      75 average:      66    seg/s:  5140504    cont/s:       0

GC phase:       pre-filter    time:     152 average:     141    seg/s:  1164515    cont/s:       0

GC phase:       pre-select    time:      30 average:      28    seg/s:  2253389    cont/s:    2360

GC phase:             copy    time:       9 average:       7    seg/s:        0    cont/s:     630

GC phase:          summary    time:      28 average:      25    seg/s:        0    cont/s:    2334


# 将每一个阶段的时间累加起来, 即为上一次文件系统清理周期所消耗的时间.

好啦, 今天就先聊到这里, 如果感兴趣的同学可以阅读以下以下文档:

How the file system reclaims storage space with file system cleaning, page 158 of DDOS admin guide: https://support.emc.com/docu61787_Data_Domain_Operating_System_5.7.1_Administration_Guide.pdf?language=en_US

485637 : Running clean on a Data Domain Restorer (DDR) does not reclaim the amount of physical space indicated by 'Cleanable Gb'

https://support.emc.com/kb/485637

446734 : Overview of Cleaning Phases

https://support.emc.com/kb/446734

28 消息

2016年11月22日 20:00

请教前辈。

关于网络的设置在data domain新的一代中有没有更灵活的设计?

例如,LOCAL机房DD的IP是 192.168.100.10,那么local机房所有的备份client都是在 192.168.100.X 这个网段

remote机房DD的IP地址是 10.10.10.10,那么remote机房所有的client都在这个 10.10.10.X 这个网段。

两个机房之间有防火墙阻挡但相应的端口已经开通。

目前两个机房各自的备份都正常,且两个机房DD之前使用了DD boost通过EMC NW实施了CCR复制。用这个方式实现DR。

那么,每个机房的DD的IP不仅要承担各自备份任务且还要承担CCR复制的使用,

这样可不可以,LOCAL机房DD的这个地址192.168.100.10只用于本地备份,那么同样remote站点DD的10.10.10.10也只用于当地站点的备份。每个站点的DD再增加一个IP例如: 192.168.100.100 (local DD)   和 10.10.10.100 (remote DD) ,两个DD通过这两个IP进行CCR复制。

14 消息

2016年11月22日 22:00

前辈们,两台dd做复制,同步完成状态下,目标端数据量比原端数据量多,可能是什么情况?

28 消息

2016年11月22日 23:00

前辈,但是之前实施我参与的时候发现,即使一个DD设备可以配置两个或者多个IP地址然而只能使用其中的一个IP,或者有的时候想把同一个DD的两个IP聚合起来做均衡处理都不行。半年前设置DR系统的时候针对DD4200我只好disable其中一个网卡使用了。

28 消息

2016年11月24日 00:00

请教 如果 DD +  NW + DDboost 可以实现备份的DR

那么这个是基于NW复制而不是DD的复制,那么请问DD的复制能用来做什么?可以实现类似的DR么?

177 消息

2016年11月24日 18:00

Hello,

我想问下对于Data moain而言,VTL和DDboost各自的优势而言在哪里呢?

比方针对大型文件服务器,oracle级别的备份,VTL和boost的各自区别在哪里?

177 消息

2016年11月24日 23:00

hello:

我想问下Data Domain的重删比和压缩是一个概念么?

那个post-comp是不是指两者结合呢?

这个post-comp受到什么影响?

6 消息

2016年11月25日 00:00

Hi, 您好,

DD的消重(Global Compression)和压缩(Local Compression)是两个不同的操作.

正如您所提到的, Post-Comp的值其实是两者的结合: 消重比 x 压缩比 = 最终消重率;

  • 全局消重是指文件系统将写入的文件进行切片, 并检测所有的碎片, 去除重复的部分;
  • 而本地压缩是指基于消重之后, 将系统中剩余的碎片进行压缩 (默认基于lz算法);

每一个写入DD的文件都会先进行消重,然后在进行压缩,最终存放于DD上.

Post-Comp的值一般受到以下情况影响:

  1. 文件的类型, 有些文件本身几乎不包含重复数据, 因此难以被很好地消重, 比如DataBase的archive log
  2. 备份软件的设置: 比如当备份软件开启了加密之后, 写入DD的数据将无法被很好地消重, 而当备份软件开启压缩的话DD本身的本地压缩率将受到影响
  3. VTL的tape marker设置与实际备份软件不匹配

更加详细的介绍请参见以下KB:

306117 : Compression FAQ

https://support.emc.com/kb/306117

306103 : How To Determine Compression Rates 

https://support.emc.com/kb/306103

28 消息

2016年11月25日 07:00

请问DD的压缩格式是这样?

那么请问这个格式可以中途更改么?

第一个选项是NONE是不是意味着我选了这个就不能源端消重复或者没有压缩了呢?

kkkh.JPG.jpg

找不到事件!

Top