論文の概要: Fault Identification Enhancement with Reinforcement Learning (FIERL)
- arxiv url: http://arxiv.org/abs/2405.04938v1
- Date: Wed, 8 May 2024 10:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 18:41:08.870346
- Title: Fault Identification Enhancement with Reinforcement Learning (FIERL)
- Title(参考訳): 強化学習(FIERL)による断層同定の促進
- Authors: Valentina Zaccaria, Davide Sartor, Simone Del Favero, Gian Antonio Susto,
- Abstract要約: 本書は, 活断層検出(AFD)分野における新しいアプローチを提示する。
タスクを、パッシブ障害検出(PFD)と制御入力設計の2つに明確に分離している。
この研究のコアコントリビューションは、このような制御戦略の設計のための一般的なシミュレーションベースのアプローチであるFIERLである。
- 参考スコア(独自算出の注目度): 4.264842065153012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This letter presents a novel approach in the field of Active Fault Detection (AFD), by explicitly separating the task into two parts: Passive Fault Detection (PFD) and control input design. This formulation is very general, and most existing AFD literature can be viewed through this lens. By recognizing this separation, PFD methods can be leveraged to provide components that make efficient use of the available information, while the control input is designed in order to optimize the gathering of information. The core contribution of this work is FIERL, a general simulation-based approach for the design of such control strategies, using Constrained Reinforcement Learning (CRL) to optimize the performance of arbitrary passive detectors. The control policy is learned without the need of knowing the passive detector inner workings, making FIERL broadly applicable. However, it is especially useful when paired with the design of an efficient passive component. Unlike most AFD approaches, FIERL can handle fairly complex scenarios such as continuous sets of fault modes. The effectiveness of FIERL is tested on a benchmark problem for actuator fault diagnosis, where FIERL is shown to be fairly robust, being able to generalize to fault dynamics not seen in training.
- Abstract(参考訳): 本稿では,PFD (Passive Fault Detection) と制御入力設計の2つの部分にタスクを明示的に分離することで,アクティブフォールト検出(AFD)の分野における新しいアプローチを提案する。
この定式化は非常に一般的であり、既存のAFD文献はこのレンズを通して見ることができる。
この分離を認識することで、PFD法を利用して、情報収集を最適化するために制御入力を設計し、利用可能な情報を効率的に活用するコンポーネントを提供することができる。
この研究の核となる貢献は、任意の受動検出器の性能を最適化するために制約強化学習(CRL)を用いて、このような制御戦略を設計するための一般的なシミュレーションベースのアプローチであるFIERLである。
制御ポリシーは受動的検出器の内部動作を知ることなく学習され、FIERLは広く適用できる。
しかし、効率的な受動的コンポーネントの設計と組み合わせると特に便利である。
多くのAFDアプローチとは異なり、FIERLは障害モードの連続セットのようなかなり複雑なシナリオを処理できる。
FIERLの有効性は、アクチュエータ故障診断のベンチマーク問題で検証され、FIERLはかなり堅牢であることが示され、トレーニング中に見えない断層力学に一般化できる。
関連論文リスト
- SPACE: SPAtial-aware Consistency rEgularization for anomaly detection in Industrial applications [2.5465367830324905]
本研究では,特徴量(FE)を学生教師法の構造に組み込んだ新しい異常検出手法を提案する。
提案手法は空間整合正則化損失(SCL)と特徴変換モジュール(FM)の2つの重要な要素を有する。
論文 参考訳(メタデータ) (2024-11-05T04:35:46Z) - Efficient Diffusion as Low Light Enhancer [63.789138528062225]
RATR(Reflectance-Aware Trajectory Refinement)は、イメージの反射成分を用いて教師の軌跡を洗練するための、シンプルで効果的なモジュールである。
textbfReDDiT (textbfDistilled textbfTrajectory) は低照度画像強調(LLIE)に適した効率的で柔軟な蒸留フレームワークである。
論文 参考訳(メタデータ) (2024-10-16T08:07:18Z) - Efficient Human-Object-Interaction (EHOI) Detection via Interaction Label Coding and Conditional Decision [33.59153869330463]
本研究では, 検出性能, 推論複雑性, 数学的透明性のバランスを良くするために, 効率の良いHOI検出器を提案する。
我々の貢献は、稀な相互作用のケースをエンコードするためのエラー訂正符号(ECC)の適用を含む。
実験により,ECC符号化対話ラベルの利点と検出性能とEHOI法の複雑さのバランスが良好であることが示された。
論文 参考訳(メタデータ) (2024-08-13T16:34:06Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - InferAligner: Inference-Time Alignment for Harmlessness through
Cross-Model Guidance [56.184255657175335]
我々は,無害アライメントのためのクロスモデルガイダンスを利用する新しい推論時間アライメント手法であるtextbfInferAligner を開発した。
実験結果から,本手法はファイナンス,医学,数学の分野特化モデルに極めて効果的に適用可能であることが示された。
これは有害な命令とジェイルブレイク攻撃の両方のアタック成功率(ASR)を著しく低下させ、下流タスクではほとんど変化のないパフォーマンスを維持している。
論文 参考訳(メタデータ) (2024-01-20T10:41:03Z) - Unsupervised Continual Anomaly Detection with Contrastively-learned
Prompt [80.43623986759691]
UCADと呼ばれる新しい非教師付き連続異常検出フレームワークを提案する。
このフレームワークは、対照的に学習したプロンプトを通じて、UDAに継続的な学習能力を持たせる。
我々は総合的な実験を行い、教師なし連続異常検出とセグメンテーションのベンチマークを設定した。
論文 参考訳(メタデータ) (2024-01-02T03:37:11Z) - A Data-Driven Approach for High-Impedance Fault Localization in
Distribution Systems [5.6874061098584345]
低電流のため, 従来の過電流リレーによるHIFの検出は困難である。
本稿では,HIFイベントの識別のためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2023-11-26T02:52:37Z) - Efficient Deep Reinforcement Learning Requires Regulating Overfitting [91.88004732618381]
本稿では,高時間差(TD)誤差が深部RLアルゴリズムの性能に悪影響を及ぼす主要な原因であることを示す。
検証TDエラーをターゲットとした簡単なオンラインモデル選択法は,状態ベースDMCおよびGymタスク間で有効であることを示す。
論文 参考訳(メタデータ) (2023-04-20T17:11:05Z) - Simulation-to-reality UAV Fault Diagnosis with Deep Learning [20.182411473467656]
そこで本研究では,四重項の故障診断におけるシミュレーションと現実のギャップに対処する深層学習モデルを提案する。
提案手法はプロペラ断層の検出において96%の精度を実現する。
これは4段プロペラのシミュレーション・トゥ・リアル故障診断のための信頼性と効率のよい最初の方法である。
論文 参考訳(メタデータ) (2023-02-09T02:37:48Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Explainability: Relevance based Dynamic Deep Learning Algorithm for
Fault Detection and Diagnosis in Chemical Processes [0.0]
産業環境における統計的プロセス制御(SPC)の2つの重要な応用は、故障検出と診断(FDD)である。
本研究では,FDDに対して深層学習(DL)に基づく方法論を提案する。
本研究では,比較的少ないサンプル数のデータセットを用いた深層ニューラルネットワークモデルのfdd精度向上のための説明可能性概念の適用について検討する。
論文 参考訳(メタデータ) (2021-03-22T23:10:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。