論文の概要: A reinforcement learning agent for maintenance of deteriorating systems with increasingly imperfect repairs
- arxiv url: http://arxiv.org/abs/2505.20725v1
- Date: Tue, 27 May 2025 05:14:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-28 17:05:58.415124
- Title: A reinforcement learning agent for maintenance of deteriorating systems with increasingly imperfect repairs
- Title(参考訳): 不完全な修復を伴う劣化システムの保守のための強化学習エージェント
- Authors: Alberto Pliego Marugán, Jesús M. Pinar-Pérez, Fausto Pedro García Márquez,
- Abstract要約: 機械学習の技術は、エンジニアリングとメンテナンスでますます使われ始めており、強化学習は最も有望な1つだ。
本稿では, 補修が不完全な新しい保守モデルとともに, ガンマ分解プロセスを提案する。
このシステムのメンテナンスポリシを生成するために,Double Deep Q-Networkアーキテクチャを用いた強化学習エージェントを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Efficient maintenance has always been essential for the successful application of engineering systems. However, the challenges to be overcome in the implementation of Industry 4.0 necessitate new paradigms of maintenance optimization. Machine learning techniques are becoming increasingly used in engineering and maintenance, with reinforcement learning being one of the most promising. In this paper, we propose a gamma degradation process together with a novel maintenance model in which repairs are increasingly imperfect, i.e., the beneficial effect of system repairs decreases as more repairs are performed, reflecting the degradational behavior of real-world systems. To generate maintenance policies for this system, we developed a reinforcement-learning-based agent using a Double Deep Q-Network architecture. This agent presents two important advantages: it works without a predefined preventive threshold, and it can operate in a continuous degradation state space. Our agent learns to behave in different scenarios, showing great flexibility. In addition, we performed an analysis of how changes in the main parameters of the environment affect the maintenance policy proposed by the agent. The proposed approach is demonstrated to be appropriate and to significatively improve long-run cost as compared with other common maintenance strategies.
- Abstract(参考訳): 効率的なメンテナンスは、常にエンジニアリングシステムの成功に不可欠である。
しかし、Industrial 4.0の実装において克服すべき課題は、メンテナンス最適化の新しいパラダイムを必要とすることである。
機械学習の技術は、エンジニアリングとメンテナンスでますます使われ始めており、強化学習は最も有望な1つだ。
本稿では, 補修が不完全な新しい保守モデルとともにガンマ劣化プロセスを提案し, 実際のシステムの劣化挙動を反映して, 補修の利点が低下することを示した。
このシステムのメンテナンスポリシを生成するために,Double Deep Q-Networkアーキテクチャを用いた強化学習エージェントを開発した。
このエージェントは、予め定義された予防しきい値なしで動作し、連続的な劣化状態空間で動作することができるという2つの重要な利点を示す。
私たちのエージェントは、さまざまなシナリオで行動することを学び、非常に柔軟性を示します。
さらに,環境の主パラメータの変化が,エージェントが提案する保守方針にどのように影響するかを解析した。
提案手法は,他の一般的な保守戦略と比較して,長期的コストを著しく改善することが実証された。
関連論文リスト
- Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.35348425288859]
RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文 参考訳(メタデータ) (2025-03-03T12:54:54Z) - A Retention-Centric Framework for Continual Learning with Guaranteed Model Developmental Safety [75.8161094916476]
現実世界のアプリケーションでは、学習可能なシステムは、しばしば課題や新しいタスクに対処するために反復的なモデル開発を行う。
既存の能力の新規または改善は、必然的に旧モデルの優れた能力を失う可能性がある。
本稿では,データ依存制約を伴う保持中心のフレームワークを提案し,既存の画像分類能力の獲得や改善を目的とした事前学習型CLIPモデルを継続的に開発する方法について検討する。
論文 参考訳(メタデータ) (2024-10-04T22:34:58Z) - TranDRL: A Transformer-Driven Deep Reinforcement Learning Enabled Prescriptive Maintenance Framework [58.474610046294856]
産業システムは、運用効率を高め、ダウンタイムを減らすための信頼性の高い予測保守戦略を要求する。
本稿では,Transformerモデルに基づくニューラルネットワークと深部強化学習(DRL)アルゴリズムの機能を活用し,システムの保守動作を最適化する統合フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T02:27:54Z) - Continual Learning for Predictive Maintenance: Overview and Challenges [6.620789302906817]
本稿では,予測保守,非定常環境,継続学習について紹介する。
次に,予測的メンテナンスと継続的学習の両面での現在の課題について議論し,両領域の交差点における今後の方向性を提案する。
論文 参考訳(メタデータ) (2023-01-29T15:32:53Z) - Coach-assisted Multi-Agent Reinforcement Learning Framework for
Unexpected Crashed Agents [120.91291581594773]
本稿では,予期せぬクラッシュを伴う協調型マルチエージェント強化学習システムの公式な定式化について述べる。
本稿では,教師支援型多エージェント強化学習フレームワークを提案する。
私たちの知る限りでは、この研究はマルチエージェントシステムにおける予期せぬクラッシュを初めて研究したものです。
論文 参考訳(メタデータ) (2022-03-16T08:22:45Z) - Predictive Maintenance for Edge-Based Sensor Networks: A Deep
Reinforcement Learning Approach [68.40429597811071]
未計画の設備停止のリスクは、収益発生資産の予測保守によって最小化することができる。
機器に基づくセンサネットワークのコンテキストから予測機器のメンテナンスを行うために,モデルフリーのDeep Reinforcement Learningアルゴリズムを提案する。
従来のブラックボックス回帰モデルとは異なり、提案アルゴリズムは最適なメンテナンスポリシーを自己学習し、各機器に対して実行可能なレコメンデーションを提供する。
論文 参考訳(メタデータ) (2020-07-07T10:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。