Fugu-MT 論文翻訳(概要): A Reinforcement Learning Approach to Health Aware Control Strategy

論文の概要: A Reinforcement Learning Approach to Health Aware Control Strategy

arxiv url: http://arxiv.org/abs/2010.09269v1
Date: Mon, 19 Oct 2020 07:25:54 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-05 20:47:55.285016
Title: A Reinforcement Learning Approach to Health Aware Control Strategy
Title（参考訳）: 健康意識制御戦略への強化学習アプローチ
Authors: Mayank Shekhar Jha (CRAN), Philippe Weber, Didier Theilliol, Jean-Christophe Ponsart, Didier Maquin
Abstract要約: 強化学習に基づくアプローチは、コンポーネント劣化に直面した最適制御ポリシーを学習するために用いられる。提案手法は直流モータとシャフト摩耗のシミュレーションを用いて検討した。
参考スコア（独自算出の注目度）: 0.16799377888527683
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Health-aware control (HAC) has emerged as one of the domains where control synthesis is sought based upon the failure prognostics of system/component or the Remaining Useful Life (RUL) predictions of critical components. The fact that mathematical dynamic (transition) models of RUL are rarely available, makes it difficult for RUL information to be incorporated into the control paradigm. A novel framework for health aware control is presented in this paper where reinforcement learning based approach is used to learn an optimal control policy in face of component degradation by integrating global system transition data (generated by an analytical model that mimics the real system) and RUL predictions. The RUL predictions generated at each step, is tracked to a desired value of RUL. The latter is integrated within a cost function which is maximized to learn the optimal control. The proposed method is studied using simulation of a DC motor and shaft wear.
Abstract（参考訳）: ヘルス・アウェア・コントロール(HAC)は、システム/コンポーネントの障害予後や重要なコンポーネントの残留有用生命(RUL)予測に基づいて制御合成を求める領域の1つである。 RULの数学的動的(遷移)モデルはほとんど利用できないため、制御パラダイムにRUL情報を組み込むことは困難である。本論文では,グローバルシステム遷移データ(実システムに類似した解析モデルによる生成)とRUL予測を統合することで,コンポーネント劣化に直面する最適制御ポリシーを学習するために,強化学習に基づくアプローチを用いた新しい健康意識制御フレームワークを提案する。各ステップで生成されたRUL予測は、RULの所望値にトラックされる。後者は最適制御を学ぶために最大化されるコスト関数に統合される。提案手法は直流モータとシャフト摩耗のシミュレーションを用いて検討した。

関連論文リスト

DFPO: Scaling Value Modeling via Distributional Flow towards Robust and Generalizable LLM Post-Training [94.568675548967]
実環境における訓練強化学習(RL)システムは、ノイズの多い監視とドメイン外の一般化が不十分なため、依然として困難である。近年の分布RL法は、複数の量子点を持つ値をモデル化することでロバスト性を向上させるが、スカラーとして各量子点を独立に学習する。 DFPOは、時間ステップをまたいだ連続フローとして値をモデル化する、ロバストな分散RLフレームワークである。
論文参考訳（メタデータ） (2026-02-05T17:07:42Z)
Data-Assimilated Model-Based Reinforcement Learning for Partially Observed Chaotic Flows [3.7960472831772765]
本稿では,部分観測可能性と雑音測定を行うシステムのためのデータ同化モデルベースRL(DA-MBRL)フレームワークを提案する。状態推定から最適制御戦略を学習するために,非政治アクター批判アルゴリズムを用いる。この枠組みは倉本-シヴァインスキーシュ方程式で検証され、時間的にカオス的な流れを安定化させる効果を実証した。
論文参考訳（メタデータ） (2025-04-23T10:12:53Z)
End-to-End Learning Framework for Solving Non-Markovian Optimal Control [9.156265463755807]
本稿では、FOLTIシステムのための革新的なシステム識別方法制御戦略を提案する。また、最初のエンドツーエンドデータ駆動学習フレームワークであるFractional-Order Learning for Optimal Control(FOLOC)も開発しています。
論文参考訳（メタデータ） (2025-02-07T04:18:56Z)
Dropout MPC: An Ensemble Neural MPC Approach for Systems with Learned Dynamics [0.0]
そこで本研究では,モンテカルロのドロップアウト手法を学習システムモデルに応用した,サンプリングベースアンサンブルニューラルMPCアルゴリズムを提案する。この手法は一般に複雑な力学を持つ不確実なシステムを対象としており、第一原理から派生したモデルは推論が難しい。
論文参考訳（メタデータ） (2024-06-04T17:15:25Z)
Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文参考訳（メタデータ） (2024-04-13T15:40:39Z)
Model-based deep reinforcement learning for accelerated learning from flow simulations [0.0]
フロー制御アプリケーションにおけるモデルベース強化学習の利点を実証する。具体的には, 流れシミュレーションから採取した軌道と, 環境モデルのアンサンブルから採取した軌道とを交互に組み合わせることで, 政策を最適化する。モデルベースの学習は、流動的なピンボールテストケースに対して、トレーニング全体の時間を最大85%削減する。
論文参考訳（メタデータ） (2024-02-26T13:01:45Z)
Towards a Theoretical Foundation of Policy Optimization for Learning Control Policies [26.04704565406123]
グラディエントベースの手法は、様々なアプリケーション領域におけるシステム設計と最適化に広く使われてきた。近年、制御と強化学習の文脈において、これらの手法の理論的性質の研究に新たな関心が寄せられている。本稿では、フィードバック制御合成のための勾配に基づく反復的アプローチであるポリシー最適化に関する最近の開発について概説する。
論文参考訳（メタデータ） (2022-10-10T16:13:34Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。最適制御には無関係な状態変数を特徴付ける。
論文参考訳（メタデータ） (2021-10-12T16:41:47Z)
Regret Analysis of Learning-Based MPC with Partially-Unknown Cost Function [5.601217969637838]
探索/探索のトレードオフは、データ駆動および適応制御において固有の課題である。本稿では、最適制御動作の基準として、全てのシステムパラメータの完全な知識を持つ有限水平オラクルコントローラを提案する。我々は,このオラクル有限ホライゾンコントローラに関して,低後悔を達成できる学習ベースのポリシーを開発する。
論文参考訳（メタデータ） (2021-08-04T22:43:51Z)
Learning representations with end-to-end models for improved remaining useful life prognostics [64.80885001058572]
残りの設備の実用寿命(RUL)は、現在の時刻と故障までの期間として定義される。マルチ層パーセプトロンと長期メモリ層(LSTM)に基づくエンドツーエンドのディープラーニングモデルを提案し、RULを予測する。提案するエンド・ツー・エンドのモデルがこのような優れた結果を達成し、他のディープラーニングや最先端の手法と比較する方法について論じる。
論文参考訳（メタデータ） (2021-04-11T16:45:18Z)
Gaussian Process-based Min-norm Stabilizing Controller for Control-Affine Systems with Uncertain Input Effects and Dynamics [90.81186513537777]
本稿では,この問題の制御・アフィン特性を捉えた新しい化合物カーネルを提案する。この結果の最適化問題は凸であることを示し、ガウス過程に基づく制御リャプノフ関数第二次コーンプログラム(GP-CLF-SOCP)と呼ぶ。
論文参考訳（メタデータ） (2020-11-14T01:27:32Z)
Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。 AntLer は確率 1 と任意に最適な解を近似することを示す。
論文参考訳（メタデータ） (2020-07-24T07:00:14Z)
Adaptive Control and Regret Minimization in Linear Quadratic Gaussian (LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。 LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文参考訳（メタデータ） (2020-03-12T19:56:38Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。