Fugu-MT 論文翻訳(概要): Safe Control and Learning Using Generalized Action Governor

論文の概要: Safe Control and Learning Using Generalized Action Governor

arxiv url: http://arxiv.org/abs/2211.12628v1
Date: Tue, 22 Nov 2022 23:25:25 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-24 16:08:08.305737
Title: Safe Control and Learning Using Generalized Action Governor
Title（参考訳）: 一般化アクションガバナを用いた安全制御と学習
Authors: Nan Li, Yutong Li, Ilya Kolmanovsky, Anouck Girard, H. Eric Tseng, Dimitar Filev
Abstract要約: 本稿では,厳密な制約処理能力を備えた名目クローズドループシステムを強化するための監督スキームである一般行動管理者を紹介する。リアルタイムデータを用いた制御パラメータを安全に進化させ,不確実なシステムの性能を向上させることを目的とした,安全なオンライン学習への応用について論じる。
参考スコア（独自算出の注目度）: 5.7406123763046955
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: This paper introduces the Generalized Action Governor, which is a supervisory scheme for augmenting a nominal closed-loop system with the capability of strictly handling constraints. After presenting its theory for general systems and introducing tailored design approaches for linear and discrete systems, we discuss its application to safe online learning, which aims to safely evolve control parameters using real-time data to improve performance for uncertain systems. In particular, we propose two safe learning algorithms based on integration of reinforcement learning/data-driven Koopman operator-based control with the generalized action governor. The developments are illustrated with a numerical example.
Abstract（参考訳）: 本稿では,厳密な制約処理能力を備えた名目クローズドループシステムを強化するための監督スキームである一般行動管理者を紹介する。汎用システムに対するその理論を提示し,線形および離散システムのための最適化設計アプローチを導入した後,リアルタイムデータを用いた制御パラメータを安全に発展させ,不確実性システムの性能を向上させることを目的とした,安全なオンライン学習への応用について論じる。特に,強化学習/データ駆動型koopmanオペレータベースの制御と汎用アクションガバナの統合に基づく2つの安全な学習アルゴリズムを提案する。発展は数値的な例で示される。

関連論文リスト

SAGE-LLM: Towards Safe and Generalizable LLM Controller with Fuzzy-CBF Verification and Graph-Structured Knowledge Retrieval for UAV Decision [46.089736018739295]
大型言語モデル (LLM) には、ドメイン固有のUAV制御知識と正式な安全保証がない。本稿では,LLMに基づく列車自由な2層決定アーキテクチャを提案し,低レベルの高精度制御と高レベルの安全計画を統合する。
論文参考訳（メタデータ） (2026-02-27T06:41:04Z)
Toward General Instruction-Following Alignment for Retrieval-Augmented Generation [63.611024451010316]
Retrieval-Augmented Generation (RAG) システムの効果的な適用には、自然な指示に従うことが不可欠である。 RAGシステムにおける命令追従アライメントのための,最初の自動化,拡張性,検証可能な合成パイプラインであるVIF-RAGを提案する。
論文参考訳（メタデータ） (2024-10-12T16:30:51Z)
Last-Iterate Global Convergence of Policy Gradients for Constrained Reinforcement Learning [62.81324245896717]
我々はC-PGと呼ばれる探索非依存のアルゴリズムを導入し、このアルゴリズムは(弱)勾配支配仮定の下でのグローバルな最終点収束を保証する。制約付き制御問題に対して,我々のアルゴリズムを数値的に検証し,それらを最先端のベースラインと比較する。
論文参考訳（メタデータ） (2024-07-15T14:54:57Z)
Nonparametric Control-Koopman Operator Learning: Flexible and Scalable Models for Prediction and Control [2.7784144651669704]
非線形制御-アフィン系のクープマン演算子表現を学習するための非パラメトリックフレームワークを提案する。また、ランダムなプロジェクションを活用することにより、制御クープマン作用素推定器のスケーラビリティも向上する。予測タスクと制御タスクの両方において,新しいcKORアプローチの有効性を実証した。
論文参考訳（メタデータ） (2024-05-12T15:46:52Z)
Data-Driven Permissible Safe Control with Barrier Certificates [11.96747040086603]
本稿では,未知のダイナミクスを持つシステムのデータから,安全戦略の最大セットを特定する手法を提案する。ケーススタディでは、システム学習のためのデータセットのサイズが大きくなると、許容可能な戦略セットが大きくなることが示されている。
論文参考訳（メタデータ） (2024-04-30T18:32:24Z)
A Tutorial on Gaussian Process Learning-based Model Predictive Control [6.868436894461309]
本チュートリアルでは,ガウス過程(GP)とモデル予測制御(MPC)を統合し,複雑なシステムにおける制御の強化を図る。このチュートリアルの中心的な貢献は、文学におけるGP-MPCの詳細な体系的な数学的定式化である。挑戦的な地形における移動ロボットの経路追従や混合車両小隊などのロボット制御の実践的応用について論じる。
論文参考訳（メタデータ） (2024-04-02T03:13:05Z)
Decentralized Event-Triggered Online Learning for Safe Consensus of Multi-Agent Systems with Gaussian Process Regression [3.405252606286664]
本稿では,補助力学によって強化された,学習に基づく分散制御法を提案する。予測性能を継続的に向上するために、分散イベントトリガー機構を備えたデータ効率の高いオンライン学習戦略を提案する。提案手法の有効性を示すため,従来の分散制御法とオフライン学習法を対比して比較分析を行った。
論文参考訳（メタデータ） (2024-02-05T16:41:17Z)
Value Functions are Control Barrier Functions: Verification of Safe Policies using Control Theory [46.85103495283037]
本稿では,制御理論から学習値関数への検証手法の適用方法を提案する。我々は値関数と制御障壁関数の間の関係を確立する原定理を定式化する。我々の研究は、RLベースの制御システムの汎用的でスケーラブルで検証可能な設計のための公式なフレームワークに向けた重要な一歩である。
論文参考訳（メタデータ） (2023-06-06T21:41:31Z)
In-Distribution Barrier Functions: Self-Supervised Policy Filters that Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文参考訳（メタデータ） (2023-01-27T22:28:19Z)
Robust Action Governor for Uncertain Piecewise Affine Systems with Non-convex Constraints and Safe Reinforcement Learning [5.7406123763046955]
Action Governorは、制御アクションを監視し、調整し、ポイントインタイムの状態と制約として表現された安全仕様を強制する名目制御ループへのアドオンスキームである。非時間付加的不確実性として表現できるシステムのロバスト行動知事(RAG)を紹介する。この開発により、環境の安全なリアルタイム進化と、システムパラメータの変化への適応が可能になる。
論文参考訳（メタデータ） (2022-07-17T17:31:07Z)
Reinforcement Learning for Task Specifications with Action-Constraints [4.046919218061427]
有限状態マルコフ決定過程の最適制御ポリシーを学習する手法を提案する。安全でないと考えられるアクションシーケンスの集合が有限状態オートマトンによって与えられると仮定する。非マルコフ的行動系列と状態制約の存在下で最適なポリシーを学習するためのQ-learningアルゴリズムのバージョンを提案する。
論文参考訳（メタデータ） (2022-01-02T04:22:01Z)
Learning Robust Output Control Barrier Functions from Safe Expert Demonstrations [50.37808220291108]
本稿では,専門家によるデモンストレーションの部分的な観察から,安全な出力フィードバック制御法を考察する。まず,安全性を保証する手段として,ロバスト出力制御バリア関数(ROCBF)を提案する。次に、安全なシステム動作を示す専門家による実証からROCBFを学習するための最適化問題を定式化する。
論文参考訳（メタデータ） (2021-11-18T23:21:00Z)
Sparsity in Partially Controllable Linear Systems [56.142264865866636]
本研究では, 部分制御可能な線形力学系について, 基礎となる空間パターンを用いて検討する。最適制御には無関係な状態変数を特徴付ける。
論文参考訳（メタデータ） (2021-10-12T16:41:47Z)
Adaptive control of a mechatronic system using constrained residual reinforcement learning [0.0]
本研究では,不確実な環境下での従来のコントローラの性能向上のための,シンプルで実用的で直感的な手法を提案する。本手法は, 産業用モーションコントロールにおける従来の制御器が, 異なる動作条件に対応するために適応性よりも頑健であることを示す。
論文参考訳（メタデータ） (2021-10-06T08:13:05Z)
Safe RAN control: A Symbolic Reinforcement Learning Approach [62.997667081978825]
本稿では,無線アクセスネットワーク(RAN)アプリケーションの安全管理のためのシンボル強化学習(SRL)アーキテクチャを提案する。我々は、ユーザが所定のセルネットワークトポロジに対して高レベルの論理的安全性仕様を指定できる純粋に自動化された手順を提供する。ユーザがシステムに意図仕様を設定するのを支援するために開発されたユーザインターフェース(UI)を導入し、提案するエージェントの動作の違いを検査する。
論文参考訳（メタデータ） (2021-06-03T16:45:40Z)
Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文参考訳（メタデータ） (2021-02-18T05:11:41Z)
Learning Hybrid Control Barrier Functions from Data [66.37785052099423]
ハイブリッドシステムの安全な制御法則を得るための体系的なツールが欠如していることから,データから確実に安全な制御法則を学習するための最適化ベースのフレームワークを提案する。特に、システムダイナミクスが知られており、安全なシステム動作を示すデータが利用可能であるような設定を仮定する。
論文参考訳（メタデータ） (2020-11-08T23:55:02Z)
Control Barrier Functions for Unknown Nonlinear Systems using Gaussian Processes [17.870440210358847]
本稿では,安全制約を確保しつつ,未知の非線形システムに対する制御器の合成に焦点をあてる。学習段階において、未知の制御アフィン非線形力学を学習するために、学習したモデルの精度に統計的に拘束されるように、データ駆動方式を用いる。第2の制御器合成ステップでは,学習モデルの不確実性を考慮した制御障壁関数の計算方式を開発する。
論文参考訳（メタデータ） (2020-10-12T16:12:52Z)
Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。 AntLer は確率 1 と任意に最適な解を近似することを示す。
論文参考訳（メタデータ） (2020-07-24T07:00:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。