論文の概要: Policies for the Dynamic Traveling Maintainer Problem with Alerts
- arxiv url: http://arxiv.org/abs/2105.15119v1
- Date: Mon, 31 May 2021 16:35:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-01 19:37:55.449044
- Title: Policies for the Dynamic Traveling Maintainer Problem with Alerts
- Title(参考訳): アラートによる動的走行保守問題に対する政策
- Authors: Paulo da Costa, Peter Verleijsdonk, Simon Voorberg, Alp Akcay, Stella
Kapodistria, Willem van Jaarsveld and Yingqian Zhang
- Abstract要約: 本稿では,動的旅行管理問題(DTMPA)のモデル化フレームワークを提案する。
目標は、無限の時間的地平線上で発生した割引メンテナンスコストを最小化することである。
本稿では,この問題を解決するための3つの手法を提案する。
- 参考スコア(独自算出の注目度): 1.8933952173153485
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Companies require modern capital assets such as wind turbines, trains and
hospital equipment to experience minimal downtime. Ideally, assets are
maintained right before failure to ensure maximum availability at minimum
maintenance costs. To this end, two challenges arise: failure times of assets
are unknown a priori and assets can be part of a larger asset network.
Nowadays, it is common for assets to be equipped with real-time monitoring that
emits alerts, typically triggered by the first signs of degradation. Thus, it
becomes crucial to plan maintenance considering information received via
alerts, asset locations and maintenance costs. This problem is referred to as
the Dynamic Traveling Maintainer Problem with Alerts (DTMPA). We propose a
modeling framework for the DTMPA, where the alerts are early and imperfect
indicators of failures. The objective is to minimize discounted maintenance
costs accrued over an infinite time horizon. We propose three methods to solve
this problem, leveraging different information levels from the alert signals.
The proposed methods comprise various greedy heuristics that rank assets based
on proximity, urgency and economic risk; a Traveling Maintainer Heuristic
employing combinatorial optimization to optimize near-future costs; a Deep
Reinforcement Learning (DRL) method trained to minimize the long-term costs
using exclusively the history of alerts. In a simulated environment, all
methods can approximate optimal policies with access to perfect condition
information for small asset networks. For larger networks, where computing the
optimal policy is intractable, the proposed methods yield competitive
maintenance policies, with DRL consistently achieving the lowest costs.
- Abstract(参考訳): 企業は、風力タービン、列車、病院設備などの近代的な資本資産を必要とし、最小のダウンタイムを経験する。
理想的には、資産は失敗の直前に維持され、最小のメンテナンスコストで最大限の可用性を確保する。
この目的のために、2つの課題が生じる: 資産の失敗時間が未知であり、資産はより大きな資産ネットワークの一部となる。
今日では、警報を発するリアルタイムモニタリングを備えた資産が一般的であり、これは通常、劣化の兆候によって引き起こされる。
したがって、アラートや資産の場所、メンテナンスコストといった情報をもとにして、メンテナンスを計画することが重要となる。
この問題はDTMPA(Dynamic Traveling Maintainer Problem with Alerts)と呼ばれる。
DTMPAのためのモデリングフレームワークを提案し、警告が早期であり、障害の指標が不十分である。
目標は、無限の時間的地平線上で発生したメンテナンスコストの削減である。
そこで本研究では,アラート信号からの異なる情報レベルを活用し,この問題を解決する3つの手法を提案する。
提案手法は, 近接性, 緊急性, 経済的リスクに基づく資産のランク付けを行う様々な欲求的ヒューリスティック, 近未来コストの最適化に組合せ最適化を用いた旅行管理ヒューリスティック, アラート履歴のみを用いた長期コストの最小化を目的とした深層強化学習(DRL)手法から構成される。
シミュレーション環境では、全ての手法が最適ポリシーを近似し、小さな資産ネットワークの完全な条件情報にアクセスできる。
最適ポリシの計算が難易度の高い大規模ネットワークでは,DRLが最低コストを一貫して達成し,競争力のあるメンテナンスポリシが提案される。
関連論文リスト
- Towards Dynamic Feature Acquisition on Medical Time Series by Maximizing Conditional Mutual Information [11.882952809819855]
医療やウェアラブルにおいて、どの時系列を計測し、いつ測定するかを知ることが重要な課題だ。
条件付き相互情報から着想を得て,下流損失のみを用いてエンド・ツー・エンドの学習者へのアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:54:34Z) - Multi-Level ML Based Burst-Aware Autoscaling for SLO Assurance and Cost
Efficiency [3.5624365288866007]
本稿では、複雑なワークロード下でコンテナ化されたクラウドサービスやアプリケーションのためのBurst-Aware AutoscalingフレームワークであるBAScalerを紹介します。
BAScalerには、予測可能な周期的なワークロードスパイクと実際のバーストを区別する、予測に基づく新しいバースト検出機構が組み込まれている。
論文 参考訳(メタデータ) (2024-02-20T12:28:25Z) - Leveraging Optimal Transport for Enhanced Offline Reinforcement Learning
in Surgical Robotic Environments [4.2569494803130565]
我々は,少数の高品質な専門家によるデモンストレーションを用いて,オフラインの軌道に報酬を割り当てるための革新的なアルゴリズムを導入する。
このアプローチは、手作りの報酬の必要性を回避し、ポリシー学習に膨大なデータセットを活用する可能性を解き放つ。
論文 参考訳(メタデータ) (2023-10-13T03:39:15Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - A Deep Learning Framework for Wind Turbine Repair Action Prediction
Using Alarm Sequences and Long Short Term Memory Algorithms [1.2599533416395765]
コンディションベースの監視(CBM)は、近年のアラームベースのシステムとデータ駆動意思決定の研究の最前線にある。
本稿では,長短期記憶(LSTM)モデルと双方向LSTMモデルを比較し,アラームシーケンスの入力シーケンスから関連する修復動作のセットを予測する新しいアイデアを提案する。
論文 参考訳(メタデータ) (2022-07-19T12:11:06Z) - Innovations in the field of on-board scheduling technologies [64.41511459132334]
本稿では、ミッション自律のためのソフトウェアフレームワークに組み込まれた、オンボードスケジューラを提案する。
スケジューラは線形整数プログラミングに基づいており、ブランチ・アンド・カット・ソルバの使用に依存している。
この技術は地球観測のシナリオでテストされており、その性能を最先端のスケジューリング技術と比較している。
論文 参考訳(メタデータ) (2022-05-04T12:00:49Z) - Deep Reinforcement Learning for Equal Risk Pricing and Hedging under
Dynamic Expectile Risk Measures [1.2891210250935146]
そこで本稿では,非政治的なアクター批判型深層強化学習アルゴリズムにより,オプションに対する高品質な時間一貫したヘッジポリシーを同定できることを示す。
簡単なバニラオプションとよりエキゾチックなバスケットオプションの両方を含む数値実験により, 単純環境, ほぼ最適なヘッジポリシ, 高精度な価格で, かつ, 多様な成熟度を同時に生成できることが確認された。
全体として、リスクを後回しに評価した場合に、静的リスク測定によって生成された戦略を実際に上回ります。
論文 参考訳(メタデータ) (2021-09-09T02:52:06Z) - Coordinated Online Learning for Multi-Agent Systems with Coupled
Constraints and Perturbed Utility Observations [91.02019381927236]
本研究では, 資源制約を満たすため, エージェントを安定な集団状態へ誘導する新しい手法を提案する。
提案手法は,ゲームラグランジアンの拡張によるリソース負荷に基づく分散リソース価格設定手法である。
論文 参考訳(メタデータ) (2020-10-21T10:11:17Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z) - Demand-Side Scheduling Based on Multi-Agent Deep Actor-Critic Learning
for Smart Grids [56.35173057183362]
家庭用家電をネットでスケジュールできるスマートメーターが各家庭に備わっている需要側エネルギー管理の問題点を考察する。
目標は、リアルタイムの料金体系の下で全体のコストを最小化することです。
マルコフゲームとしてスマートグリッド環境の定式化を提案する。
論文 参考訳(メタデータ) (2020-05-05T07:32:40Z) - Hierarchical Adaptive Contextual Bandits for Resource Constraint based
Recommendation [49.69139684065241]
コンテキスト多重武装バンディット(MAB)は、様々な問題において最先端のパフォーマンスを達成する。
本稿では,階層型適応型文脈帯域幅法(HATCH)を提案する。
論文 参考訳(メタデータ) (2020-04-02T17:04:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。