論文の概要: Safe Online Control-Informed Learning
- arxiv url: http://arxiv.org/abs/2512.13868v1
- Date: Mon, 15 Dec 2025 19:56:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.476098
- Title: Safe Online Control-Informed Learning
- Title(参考訳): 安全なオンライン制御インフォームドラーニング
- Authors: Tianyu Zhou, Zihao Liang, Zehui Lu, Shaoshuai Mou,
- Abstract要約: 本稿では,安全クリティカル自律システムのためのセーフオンライン制御情報学習フレームワークを提案する。
このフレームワークは、最適制御、パラメータ推定、安全性制約をオンライン学習プロセスに統合する。
- 参考スコア(独自算出の注目度): 4.548770944690356
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: This paper proposes a Safe Online Control-Informed Learning framework for safety-critical autonomous systems. The framework unifies optimal control, parameter estimation, and safety constraints into an online learning process. It employs an extended Kalman filter to incrementally update system parameters in real time, enabling robust and data-efficient adaptation under uncertainty. A softplus barrier function enforces constraint satisfaction during learning and control while eliminating the dependence on high-quality initial guesses. Theoretical analysis establishes convergence and safety guarantees, and the framework's effectiveness is demonstrated on cart-pole and robot-arm systems.
- Abstract(参考訳): 本稿では,安全クリティカル自律システムのためのセーフオンライン制御情報学習フレームワークを提案する。
このフレームワークは、最適制御、パラメータ推定、安全性制約をオンライン学習プロセスに統合する。
拡張Kalmanフィルタを使用して、システムパラメータをリアルタイムでインクリメンタルに更新し、不確実性の下で堅牢でデータ効率の高い適応を可能にする。
ソフトプラスバリア関数は、高品質な初期推測への依存を排除しつつ、学習と制御の間に制約満足度を強制する。
理論的解析は収束と安全性の保証を確立し、このフレームワークの有効性はカートポールやロボットアームシステムで実証される。
関連論文リスト
- Safely Learning Controlled Stochastic Dynamics [61.82896036131116]
システム力学の安全な探索と効率的な推定を可能にする手法を提案する。
学習後、学習モデルはシステムのダイナミクスの予測を可能にし、任意の制御の安全性検証を可能にする。
我々は、真の力学のソボレフ正則性を高めることにより、安全性と適応学習率の向上を理論的に保証する。
論文 参考訳(メタデータ) (2025-06-03T11:17:07Z) - Foundations of Safe Online Reinforcement Learning in the Linear Quadratic Regulator: $\sqrt{T}$-Regret [5.108909395876561]
我々は,安全制約付き強化学習における厳格な後悔の限界を証明した。
我々は$tildeO_T(sqrtT)$を後悔する最初の安全なアルゴリズムを提供する。
論文 参考訳(メタデータ) (2025-04-25T19:22:57Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Sample-efficient Safe Learning for Online Nonlinear Control with Control
Barrier Functions [35.9713619595494]
強化学習と連続非線形制御は、複雑なシーケンシャルな意思決定タスクの複数の領域にうまく展開されている。
学習過程の探索特性とモデル不確実性の存在を考えると、それらを安全クリティカルな制御タスクに適用することは困難である。
本稿では,オンライン制御タスクを対象とした,効率のよいエピソード型安全な学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-29T00:54:35Z) - Model-Based Safe Reinforcement Learning with Time-Varying State and
Control Constraints: An Application to Intelligent Vehicles [13.40143623056186]
本稿では、時間変化状態と制御制約を持つ非線形システムの最適制御のための安全なRLアルゴリズムを提案する。
多段階の政策評価機構が提案され、時間変化による安全制約の下での政策の安全性リスクを予測し、安全更新を誘導する。
提案アルゴリズムは、シミュレーションされたセーフティガイム環境において、最先端のRLアルゴリズムよりも優れている。
論文 参考訳(メタデータ) (2021-12-18T10:45:31Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Learning Hybrid Control Barrier Functions from Data [66.37785052099423]
ハイブリッドシステムの安全な制御法則を得るための体系的なツールが欠如していることから,データから確実に安全な制御法則を学習するための最適化ベースのフレームワークを提案する。
特に、システムダイナミクスが知られており、安全なシステム動作を示すデータが利用可能であるような設定を仮定する。
論文 参考訳(メタデータ) (2020-11-08T23:55:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。