Symptomen
Data Domainに、期限切れのスナップショットがないことが示されます。これは、次の手順で確認できます。
- Avamar Utility Nodeで、次のコマンドを実行してMTree名を確認します。
avmaint hfscreate
コマンドをAvamarグリッドに追加し、文字列の先頭に /data/col1/avamar-
次:
Example:
avmaint hfscreate
1501099628
結果として得られるMTree名: /data/col1/avamar-1501099628
- Data Domainから、Avamar MTreeに関連付けられているスナップショットのリストを取得します。
snapshot list mtree /data/col1/<avamar-mtree-name>
Example:
snapshot list mtree /data/col1/avamar-1501099628
Snapshot Information for MTree: /data/col1/avamar-1501099628
----------------------------------------------
Name Pre-Comp (GiB) Create Date Retain Until Status
----------------- -------------- ----------------- ------------ ------
cp.20170802130330 501241.1 Aug 2 2017 09:04
cp.20170802131127 501355.0 Aug 2 2017 09:11
cp.20170803120133 503440.7 Aug 3 2017 08:02
cp.20170803120726 503554.7 Aug 3 2017 08:07
cp.20170804120142 496207.0 Aug 4 2017 08:02
cp.20170804120836 496321.0 Aug 4 2017 08:09
cp.20170805130259 523295.5 Aug 5 2017 09:03
cp.20170805130955 523409.5 Aug 5 2017 09:10
cp.20170806130127 541524.5 Aug 6 2017 09:01
cp.20170806130719 541638.5 Aug 6 2017 09:07
cp.20170807130120 438037.9 Aug 7 2017 09:01
cp.20170807130712 438151.9 Aug 7 2017 09:07
----------------- -------------- ----------------- ------------ ------
Snapshot Summary
-------------------
Total: 12
Not expired: 12
Expired: 0
AvamarのDDRメンテナンス ログには、次のイベントが表示されます。
(/usr/local/avamar/var/ddrmaintlogs/ddrmaint.log*)
です。
Aug 7 09:07:45 avamar ddrmaint.bin[122469]: Error: cp-delete::expire_checkpoint_snapshot - Failed to expire checkpoint: cp.20170806130719, ddr: dd.emc.com, ddr-index: 1, DDR result code: 5075, desc: the user has insufficient access rights
Aug 7 09:07:45 avamar ddrmaint.bin[122469]: Error: <4740>Datadomain checkpoint delete operation failed.
...
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Info: Data Domain configured in Stand-Alone mode.
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Info: cp-delete::execute_delete_cp - Deleting DDR Checkpoint for dpnid:<dpnid> on ddr:dd.emc.com cp: cp.20170805130259
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Info: Setting default storage unit to 'avamar-1501099628' for handle 1
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Warning: Calling DDR_EXPIRE_SNAPSHOT returned result code:5075 message:the user has insufficient access rights
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Error: cp-delete::expire_checkpoint_snapshot - Failed to expire checkpoint: cp.20170805130259, ddr: dd.emc.com, ddr-index: 1, DDR result code: 5075, desc: the user has insufficient access rights
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Error: <4740>Datadomain checkpoint delete operation failed.
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Info: ============================= cp-delete finished in 1 seconds
Aug 6 09:07:18 avamar ddrmaint.bin[176316]: Info: ============================= cp-delete cmd finished =============================
ddfs.info ファイルには、次のイベントが表示されます
(/ddr/var/log/debug/ddfs.info*)
Data Domainの場合:
08/07 08:01:06.322 (tid 0x7fe7037cd930): ddboost-<avamar.emc.com-37933>: ddboost_api ERROR: ddp_snapshot_expire() failed for SUName avamar-1501099628, snapshot: cp.20170802130330, retention: -1, flags: 0 Err: 5075-Update retention of snapshot [cp.20170802130330] on Storage Unit [avamar-1501099628(nfs: Operation not permitted)
10/11 11:19:55.468 (tid 0x7f27454a63f0): ddboost-<avamar.emc.com-60566>: test-avamar.dell.emc.com Local Time: Wed Oct 11 11:19:55 2017
10/11 11:19:55.471 (tid 0x7f2cd150e830): OST_FH_PERM FAIL on storage-unit=avamar-1501099628 op=NFSPROC3_DDP_LOOKUP[27] client=test-avamar.dell.emc.com uid=500:uid or gid does not match
09/26 09:17:46.762 (tid 0x7f60d7a08410): ddboost-<avamar.emc.com-37933>: ddboost_api ERROR: ddp_snapshot_list() failed, Err: 5009-Get snapshot list on Storage Unit [avamar-1501099628] failed (nfs: I/O error)
09/26 09:18:46.472 (tid 0x7f7e1ab92d50): ddboost-<avamar.emc.com-37933>: ddboost_api ERROR: ddp_snapshot_list() failed, Err: 5009-Get snapshot list on Storage Unit
Oorzaak
特定のストレージ ユニットのDD Boostユーザーは、以前のバージョンのDDOSで次のオペレーティング システム グループを使用して作成されました。
users
なく
admin
間のデッドロックが原因で潜在的なHMONタイムアウトが発生する問題が解決されています。これは、Avamarが最初にData Domainに接続し、ストレージ ユニットを作成し、次のような権限を設定したときに発生します。
drwxr-xr-x 7 <ddboostuser> users 430 Apr 26 2016 <avamar-mtree-name>
DDOS 6.1.x以降では、ストレージ ユニットの削除やスナップショットの期限切れなどの一部のストレージ ユニット操作では、ストレージ ユニットの所有者が
admin
グループ (
users
グループ)。
そうでない場合、これらの操作は失敗し、毎日、Avamarチェックポイントに対応する2つの新しいData Domainスナップショットが期限切れになりません。
ストレージ ユニットに関連づけられているDD Boostユーザーが
admin
その後の役割。
注:他のバックアップ アプリケーションにはユーザー グループと権限をチェックする操作がないため、この問題はAvamarにのみ影響を与えることが分かっています。
Oplossing
Data Domainで次の手順を実行して、レジストリー設定を確認します。
- Avamarの取得
DDBoost user
ddboost storage-unit show
Name Pre-Comp (GiB) Status User Report Physical
Size (MiB)
----------------- -------------- ------ --------------- ---------------
avamar-1501099628 10808220.0 RW ddboost-avamar -
d025 457051.7 RW ddboost-avamar -
rman_dd 240902.7 RW ddboost-rman -
mssql 142474.8 RW ddboost-avamar -
----------------- -------------- ------ --------------- ---------------
この出力から、Avamar DD Boostユーザーは ddboost-avamar
間のデッドロックが原因で潜在的なHMONタイムアウトが発生する問題が解決されています。
- DD BoostユーザーのUID(ユーザーID)を取得してメモします。
user show list
Example:
User list from node "localhost".
Name Uid Role Last Login From Last Login Time Status Disable Date
-------- --- ----- --------------- ------------------------ ------- ------------
sysadmin 100 admin 10.10.40.59 Tue Oct 10 14:44:52 2017 enabled never
ddboost-avamar 500 admin 10.10.40.55 Wed Oct 11 11:07:49 2017 enabled never
-------- --- ----- --------------- ------------------------ ------- ------------
2 users found.
この例では、UIDは 500 です(ただし、これは異なる場合があります)。
- 次のコマンドを実行して、レジストリー設定を確認します。
reg show protocol.ost
管理者グループのグループID(GID)は50で、usersグループのグループIDは100です(sysadminのUID 100と混同しないでください)
レジストリ設定が正しくない例(グループIDが 100):
reg show protocol.ost
...
protocol.ost.stu_user.<avamar-mtree-name>= 500:100
protocol.ost.uid500:100 = <ddboostusername>
protocol.ost.user.<ddboostusername> = 500:100
...
その後、問題をレビュー、検証、および解決できます。
Getroffen producten
Avamar
Producten
Avamar, Avamar Server, Data Domain