論文の概要: Transfer Learning for Control Systems via Neural Simulation Relations
- arxiv url: http://arxiv.org/abs/2412.01783v1
- Date: Mon, 02 Dec 2024 18:34:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:40:51.619608
- Title: Transfer Learning for Control Systems via Neural Simulation Relations
- Title(参考訳): ニューラルネットワークによる制御系の伝達学習
- Authors: Alireza Nadali, Bingzhuo Zhong, Ashutosh Trivedi, Majid Zamani,
- Abstract要約: 本稿では、ソース制御システムからターゲット制御システムへ制御ロジックを効果的に転送することに焦点を当てる。
我々は、2つのシステムの挙動間の観測的等価性を特徴付けるために(近似的な)シミュレーション関係を用いる。
また, 条件が満たされれば, 対応する制御器を備えた2つのシステムの出力のクローズネスが保証される, 妥当性条件も導入する。
- 参考スコア(独自算出の注目度): 5.234181168765602
- License:
- Abstract: Transfer learning is an umbrella term for machine learning approaches that leverage knowledge gained from solving one problem (the source domain) to improve speed, efficiency, and data requirements in solving a different but related problem (the target domain). The performance of the transferred model in the target domain is typically measured via some notion of loss function in the target domain. This paper focuses on effectively transferring control logic from a source control system to a target control system while providing approximately similar behavioral guarantees in both domains. However, in the absence of a complete characterization of behavioral specifications, this problem cannot be captured in terms of loss functions. To overcome this challenge, we use (approximate) simulation relations to characterize observational equivalence between the behaviors of two systems. Simulation relations ensure that the outputs of both systems, equipped with their corresponding controllers, remain close to each other over time, and their closeness can be quantified {\it a priori}. By parameterizing simulation relations with neural networks, we introduce the notion of \emph{neural simulation relations}, which provides a data-driven approach to transfer any synthesized controller, regardless of the specification of interest, along with its proof of correctness. Compared with prior approaches, our method eliminates the need for a closed-loop mathematical model and specific requirements for both the source and target systems. We also introduce validity conditions that, when satisfied, guarantee the closeness of the outputs of two systems equipped with their corresponding controllers, thus eliminating the need for post-facto verification. We demonstrate the effectiveness of our approach through case studies involving a vehicle and a double inverted pendulum.
- Abstract(参考訳): トランスファーラーニング(Transfer Learning)とは、ある問題(ソースドメイン)を解くことで得られる知識を活用して、異なる問題(ターゲットドメイン)を解く際のスピード、効率、データ要求を改善する機械学習の手法である。
対象領域における移動モデルの性能は、典型的には、対象領域における損失関数の概念によって測定される。
本稿では、ソース制御系からターゲット制御系へ制御ロジックを効果的に転送することに焦点を当て、両領域でほぼ同様の動作保証を提供する。
しかし、行動仕様の完全な特徴が欠如しているため、この問題は損失関数の観点では捉えられない。
この課題を克服するために、我々は2つのシステムの挙動間の観測的等価性を特徴付けるために(近似的な)シミュレーション関係を用いる。
シミュレーション関係は、対応するコントローラを備えた両方のシステムの出力が時間とともに互いに近づき、その近さを定量化することができることを保証している。
ニューラルネットワークとのシミュレーション関係をパラメータ化することにより、関心の仕様によらず、任意の合成されたコントローラを転送するためのデータ駆動型アプローチと、その正しさの証明を提供する「emph{neural Simulation Relation}」の概念を導入する。
従来の手法と比較して,本手法は閉ループの数学的モデルの必要性を排除し,ソースシステムとターゲットシステムの両方に固有の要件を課す。
また, 条件が満たされれば, 対応する制御器を備えた2つのシステムの出力の近接性を保証し, 事後検証の必要性を解消する妥当性条件も導入する。
車両と二重反転振子を用いたケーススタディにより,本手法の有効性を実証した。
関連論文リスト
- How to discretize continuous state-action spaces in Q-learning: A symbolic control approach [0.0]
本稿では,空間離散化法における大きな欠点を浮き彫りにした系統解析について述べる。
この課題に対処するために,行動関係を表す記号モデルを提案する。
この関係により、オリジナルのシステムへの抽象化に基づいて、合成されたコントローラをシームレスに適用することができる。
論文 参考訳(メタデータ) (2024-06-03T17:30:42Z) - Fault Detection and Monitoring using an Information-Driven Strategy: Method, Theory, and Application [5.056456697289351]
本稿では,新しいコンセプトドリフト検出器に基づく情報駆動型故障検出手法を提案する。
本手法は,加法雑音モデルの入出力関係におけるドリフトの同定に適している。
提案したMIに基づく故障検出手法の理論的特性を実証する。
論文 参考訳(メタデータ) (2024-05-06T17:43:39Z) - Two-phase Dual COPOD Method for Anomaly Detection in Industrial Control
System [0.0]
従来のICS異常検出法は透明性と解釈性に欠けていた。
本稿では,これらの課題に対処する2相二重コプラ型外乱検出法(COPOD)を提案する。
この方法は経験的分布関数に基づいており、パラメータフリーであり、各特徴の異常への寄与を定量化することで解釈性を提供する。
論文 参考訳(メタデータ) (2023-04-30T18:13:40Z) - Interactive System-wise Anomaly Detection [66.3766756452743]
異常検出は様々なアプリケーションにおいて基本的な役割を果たす。
既存のメソッドでは、インスタンスがデータとして容易に観察できないシステムであるシナリオを扱うのが難しい。
システム埋め込みを学習するエンコーダデコーダモジュールを含むエンドツーエンドアプローチを開発する。
論文 参考訳(メタデータ) (2023-04-21T02:20:24Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - Convolutional generative adversarial imputation networks for
spatio-temporal missing data in storm surge simulations [86.5302150777089]
GAN(Generative Adversarial Imputation Nets)とGANベースの技術は、教師なし機械学習手法として注目されている。
提案手法を Con Conval Generative Adversarial Imputation Nets (Conv-GAIN) と呼ぶ。
論文 参考訳(メタデータ) (2021-11-03T03:50:48Z) - Data-Driven Optimized Tracking Control Heuristic for MIMO Structures: A
Balance System Case Study [8.035375408614776]
PIDは2入力の2アウトプットバランスシステムで示される。
自己調整型非線形しきい値とニューラルネットワークを統合し、所望の過渡特性と定常特性を妥協する。
ニューラルネットワークは、客観的コスト関数のような重み付き導関数の最適化を訓練する。
論文 参考訳(メタデータ) (2021-04-01T02:00:20Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Data-Driven Verification under Signal Temporal Logic Constraints [0.0]
力学が部分的に不明な不確実性のあるシステムを考える。
本研究の目的は,そのようなシステムの軌道による時間論理特性の満足度について研究することである。
本研究では, ベイズ推定手法を用いて, 信頼度と満足度を関連づける。
論文 参考訳(メタデータ) (2020-05-08T08:32:30Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。