1 Rookie
•
10 メッセージ
0
29
Open Manage Enterprise4.0のMetrics taskについて
■聞きたいこと
OpenManageEnterpriseのMetrics taskというジョブは具体的に、いつ、なにをしているのか、その起動条件及び実行エラーがでる時はなにが原因か。
■状況
アプライアンスのバックアップが実行進捗50%以降進まなくなった。
原因 Metrics Taskジョブが、失敗を繰り返しながら実行中だった。(Metrics Taskが重複して実行されている旨のエラーメッセージ)
対応 Metrics Taskジョブを再起動したところ正常に動作するようになりバックアップもできるようになった。
ayas
Moderator
Moderator
•
6.7K メッセージ
0
2024年4月1日 02:09
@i.m さん
ご返信をありがとうございます。
1.Metrics taskは月初めに15分毎に実行される、とのことですがジョブの詳細を確認すると毎日少なくとも8時40分から5分おきに実行されているようです。これは何らかの設定の変更で、実行タイミングが変わっている、ということでしょうか。
→User Guideを確認する限りAt second :00, every 15 minutes starting at minute :00の記載があるので記録を開始‐終了が15分毎、しかし実際データを採取するのは5分、なのかもしれないですね。
ホワイトペーパーの記載もを見ても開始‐終了が15分になっています。
PowerEdge Metrics in CloudIQ using OpenManage Enterprise (OME): An Overview
Page 10
OpenManage Enterprise 4.0.x User's Guide
Page 181 At second :00, every 15 minutes starting at minute :00, every hour, every day starting on the First, every month.
2.Metrisc taskは基本的にシステムによって自動で起動するとの認識ですが、以前実行エラーが発生した 際は、既に同じタスクが動いているという旨のエラーメッセージで、実行ができなくなっていたのですが、ユーザーからの操作(サーバー検出など)でMetrics Taskが起動する、ということは考えられしょうか。
→‘Metrics task’ and Source = ‘System generated’. と記載があるのでUserでの起動というのは考えにくい気がします。
参考:
PowerEdge Metrics in CloudIQ using OpenManage Enterprise (OME): An Overview
Page 10
The OME users can monitor the overall status of metrics collection on the Monitor > Jobs page. To view only the Metrics tasks, filter by Job Type = ‘Metrics task’ and Source = ‘System generated’.
ayas
Moderator
Moderator
•
6.7K メッセージ
0
2024年4月2日 04:47
@i.m さん
ご返信ありがとうございます。
1.に関して
No plugins registered for metrics collection.
とのメッセージと共に経過時間00:00:00で完了しているため短期間で実行されてるんでしょうか…ちなみに、このメッセージの意味はCloudIQなどのプラグインをアクティブにしていないという意味でしょうか。
→メッセージそのものの意味を示す情報(KBなど)は見つけられませんでしたがメッセージ自体はMetrix情報を採取するプラグインがないことを示していますよね。
2.に関して
重複してMetrics_taskが実行されたのはOpenManageEnterpriseのシステム側の不具合という認識で相違ないでしょうか
→ログを確認しているわけではないので確かなことは言えないですが、何等かの原因で最初のMetrix Taskが終了せず、(ハングしたとか。。)そのまま2回目のMetrix Taskを開始しようとしたが最初のMetrix Taskのせいで開始ができない、というような状況なのかなあと。
しかしあくまで推察ですので確実に何が起きたのかを確認するのであればサポートへの
お問い合わせをお勧めします。
その際は先にお知らせしたKB内になるログも採取しておくといいと思います。
参考:
Dell EMC Knowledge Article 000200479 : OpenManage Enterprise - Architecture, Logs, and Analysis
ayas
Moderator
Moderator
•
6.7K メッセージ
0
2024年3月28日 01:58
i.mさん
OpenManageEnterpriseのMetrics taskというジョブは具体的に、いつ、なにをしているのか、その起動条件及び実行エラーがでる時はなにが原因か
→OpenManageEnterpriseのMetrics taskはMetrics Collection Serviceと呼ばれ15分毎に登録されているPowerEdgeサーバの統計情報を採取するサービスになります。
またそのエラー原因はOpenManagerEnterpriseで管理しているPowerEdgeでの統計情報設定変更(主にiDRAC上でのメトリック情報の変更など)やコネクション切断、などがあげられています。(後述資料*参照)参考になりそうなログについても後述KBにありますので参考にしてください。
参考:PowerEdge Metrics in CloudIQ using OpenManage Enterprise (OME): An Overview
Page 9
OME’s Metrics Collection Service runs a periodic task every 15 minutes to collect metrics from the registered PowerEdge servers.
*Page 20 Scenario 4: Incomplete metric retrieval
OpenManage Enterprise 4.0.x User's Guide
Page 41
At second :00, every 15 minutes starting at minute :00, every hour, every day starting Metric Collection Service - Collects and processes power and thermal data as well as telemetry for various plugins (Power Manager and CloudIQ plugins)on the First, every month.
(15分毎、毎月月始めに起動)
Dell EMC Knowledge Article 000200479 : OpenManage Enterprise - Architecture, Logs, and Analysis
Metric Collection Service - Collects and processes power and thermal data as well as telemetry for various plugins (Power Manager and CloudIQ plugins)
Metric Collection Service - /var/log/dell/mcsi/metriccollectionservice/metricscollectionservice.log ←トラブルシュート時のログの場所
i.m
1 Rookie
1 Rookie
•
10 メッセージ
0
2024年3月29日 05:41
@ayas 回答いただきありがとうございます。Metrics‗tasksの概要がわかりました。
追加で2点ほど確認したいことがございます。
1.Metrics taskは月初めに15分毎に実行される、とのことですが
ジョブの詳細を確認すると毎日少なくとも8時40分から5分おきに実行されているようです。
これは何らかの設定の変更で、実行タイミングが変わっている、ということでしょうか。
2.Metrisc taskは基本的にシステムによって自動で起動するとの認識ですが、以前実行エラーが発生した
際は、既に同じタスクが動いているという旨のエラーメッセージで、実行ができなくなっていたので
すが、ユーザーからの操作(サーバー検出など)でMetrics Taskが起動する、ということは考えられるで
しょうか。
i.m
1 Rookie
1 Rookie
•
10 メッセージ
0
2024年4月2日 01:27
@ayas
回答いただきありがとうございます。
1.に関して
No plugins registered for metrics collection.
とのメッセージと共に経過時間00:00:00で完了しているため短期間で実行されてるんでしょうか…
ちなみに、このメッセージの意味はCloudIQなどのプラグインをアクティブにしていないという意味でしょうか。
2.に関して
重複してMetrics_taskが実行されたのはOpenManageEnterpriseのシステム側の不具合という認識で相違ないでしょうか