論文の概要: Fault Identification Enhancement with Reinforcement Learning (FIERL)
- arxiv url: http://arxiv.org/abs/2405.04938v1
- Date: Wed, 8 May 2024 10:10:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-09 18:41:08.870346
- Title: Fault Identification Enhancement with Reinforcement Learning (FIERL)
- Title(参考訳): 強化学習(FIERL)による断層同定の促進
- Authors: Valentina Zaccaria, Davide Sartor, Simone Del Favero, Gian Antonio Susto,
- Abstract要約: 本書は, 活断層検出(AFD)分野における新しいアプローチを提示する。
タスクを、パッシブ障害検出(PFD)と制御入力設計の2つに明確に分離している。
この研究のコアコントリビューションは、このような制御戦略の設計のための一般的なシミュレーションベースのアプローチであるFIERLである。
- 参考スコア(独自算出の注目度): 4.264842065153012
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This letter presents a novel approach in the field of Active Fault Detection (AFD), by explicitly separating the task into two parts: Passive Fault Detection (PFD) and control input design. This formulation is very general, and most existing AFD literature can be viewed through this lens. By recognizing this separation, PFD methods can be leveraged to provide components that make efficient use of the available information, while the control input is designed in order to optimize the gathering of information. The core contribution of this work is FIERL, a general simulation-based approach for the design of such control strategies, using Constrained Reinforcement Learning (CRL) to optimize the performance of arbitrary passive detectors. The control policy is learned without the need of knowing the passive detector inner workings, making FIERL broadly applicable. However, it is especially useful when paired with the design of an efficient passive component. Unlike most AFD approaches, FIERL can handle fairly complex scenarios such as continuous sets of fault modes. The effectiveness of FIERL is tested on a benchmark problem for actuator fault diagnosis, where FIERL is shown to be fairly robust, being able to generalize to fault dynamics not seen in training.
- Abstract(参考訳): 本稿では,PFD (Passive Fault Detection) と制御入力設計の2つの部分にタスクを明示的に分離することで,アクティブフォールト検出(AFD)の分野における新しいアプローチを提案する。
この定式化は非常に一般的であり、既存のAFD文献はこのレンズを通して見ることができる。
この分離を認識することで、PFD法を利用して、情報収集を最適化するために制御入力を設計し、利用可能な情報を効率的に活用するコンポーネントを提供することができる。
この研究の核となる貢献は、任意の受動検出器の性能を最適化するために制約強化学習(CRL)を用いて、このような制御戦略を設計するための一般的なシミュレーションベースのアプローチであるFIERLである。
制御ポリシーは受動的検出器の内部動作を知ることなく学習され、FIERLは広く適用できる。
しかし、効率的な受動的コンポーネントの設計と組み合わせると特に便利である。
多くのAFDアプローチとは異なり、FIERLは障害モードの連続セットのようなかなり複雑なシナリオを処理できる。
FIERLの有効性は、アクチュエータ故障診断のベンチマーク問題で検証され、FIERLはかなり堅牢であることが示され、トレーニング中に見えない断層力学に一般化できる。
関連論文リスト
- Fault Detection and Monitoring using an Information-Driven Strategy: Method, Theory, and Application [5.056456697289351]
本稿では,新しいコンセプトドリフト検出器に基づく情報駆動型故障検出手法を提案する。
本手法は,加法雑音モデルの入出力関係におけるドリフトの同定に適している。
提案したMIに基づく故障検出手法の理論的特性を実証する。
論文 参考訳(メタデータ) (2024-05-06T17:43:39Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - InferAligner: Inference-Time Alignment for Harmlessness through
Cross-Model Guidance [56.184255657175335]
我々は,無害アライメントのためのクロスモデルガイダンスを利用する新しい推論時間アライメント手法であるtextbfInferAligner を開発した。
実験結果から,本手法はファイナンス,医学,数学の分野特化モデルに極めて効果的に適用可能であることが示された。
これは有害な命令とジェイルブレイク攻撃の両方のアタック成功率(ASR)を著しく低下させ、下流タスクではほとんど変化のないパフォーマンスを維持している。
論文 参考訳(メタデータ) (2024-01-20T10:41:03Z) - Unsupervised Continual Anomaly Detection with Contrastively-learned
Prompt [80.43623986759691]
UCADと呼ばれる新しい非教師付き連続異常検出フレームワークを提案する。
このフレームワークは、対照的に学習したプロンプトを通じて、UDAに継続的な学習能力を持たせる。
我々は総合的な実験を行い、教師なし連続異常検出とセグメンテーションのベンチマークを設定した。
論文 参考訳(メタデータ) (2024-01-02T03:37:11Z) - A Data-Driven Approach for High-Impedance Fault Localization in
Distribution Systems [5.6874061098584345]
低電流のため, 従来の過電流リレーによるHIFの検出は困難である。
本稿では,HIFイベントの識別のためのデータ駆動型手法を提案する。
論文 参考訳(メタデータ) (2023-11-26T02:52:37Z) - Efficient Deep Reinforcement Learning Requires Regulating Overfitting [91.88004732618381]
本稿では,高時間差(TD)誤差が深部RLアルゴリズムの性能に悪影響を及ぼす主要な原因であることを示す。
検証TDエラーをターゲットとした簡単なオンラインモデル選択法は,状態ベースDMCおよびGymタスク間で有効であることを示す。
論文 参考訳(メタデータ) (2023-04-20T17:11:05Z) - Continual Detection Transformer for Incremental Object Detection [154.8345288298059]
インクリメンタルオブジェクト検出(IOD)は、新しいオブジェクトカテゴリに対するアノテーションを備えた、フェーズ内のオブジェクト検出をトレーニングすることを目的としている。
他の段階的な設定として、IODは破滅的な忘れがちであり、知識蒸留(KD)や模範再生(ER)といった技術によってしばしば対処される。
本稿では,この文脈でKDとERを効果的に活用できるトランスフォーマーベースのIODを提案する。
論文 参考訳(メタデータ) (2023-04-06T14:38:40Z) - Simulation-to-reality UAV Fault Diagnosis with Deep Learning [20.182411473467656]
そこで本研究では,四重項の故障診断におけるシミュレーションと現実のギャップに対処する深層学習モデルを提案する。
提案手法はプロペラ断層の検出において96%の精度を実現する。
これは4段プロペラのシミュレーション・トゥ・リアル故障診断のための信頼性と効率のよい最初の方法である。
論文 参考訳(メタデータ) (2023-02-09T02:37:48Z) - Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。
まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。
次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文 参考訳(メタデータ) (2021-11-18T23:21:00Z) - Explainability: Relevance based Dynamic Deep Learning Algorithm for
Fault Detection and Diagnosis in Chemical Processes [0.0]
産業環境における統計的プロセス制御(SPC)の2つの重要な応用は、故障検出と診断(FDD)である。
本研究では,FDDに対して深層学習(DL)に基づく方法論を提案する。
本研究では,比較的少ないサンプル数のデータセットを用いた深層ニューラルネットワークモデルのfdd精度向上のための説明可能性概念の適用について検討する。
論文 参考訳(メタデータ) (2021-03-22T23:10:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。