論文の概要: Online Intention Prediction via Control-Informed Learning
- arxiv url: http://arxiv.org/abs/2604.09303v1
- Date: Fri, 10 Apr 2026 13:11:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.872495
- Title: Online Intention Prediction via Control-Informed Learning
- Title(参考訳): 制御インフォームドラーニングによるオンライン意図予測
- Authors: Tianyu Zhou, Zihao Liang, Zehui Lu, Shaoshuai Mou,
- Abstract要約: 本稿では,自律システムの目標状態をリアルタイムに推定するオンライン意図予測フレームワークを提案する。
シフトする地平線戦略は時代遅れの情報を割引し、オンライン制御情報学習は効率的な勾配計算とオンラインパラメータ更新を可能にする。
- 参考スコア(独自算出の注目度): 4.548770944690356
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents an online intention prediction framework for estimating the goal state of autonomous systems in real time, even when intention is time-varying, and system dynamics or objectives include unknown parameters. The problem is formulated as an inverse optimal control / inverse reinforcement learning task, with the intention treated as a parameter in the objective. A shifting horizon strategy discounts outdated information, while online control-informed learning enables efficient gradient computation and online parameter updates. Simulations under varying noise levels and hardware experiments on a quadrotor drone demonstrate that the proposed approach achieves accurate, adaptive intention prediction in complex environments.
- Abstract(参考訳): 本稿では,意図が時間的変化であっても,自律システムの目標状態をリアルタイムで推定するためのオンライン意図予測フレームワークを提案する。
課題は、目的のパラメータとして扱われる逆最適制御/逆強化学習タスクとして定式化される。
シフトする地平線戦略は時代遅れの情報を割引し、オンライン制御情報学習は効率的な勾配計算とオンラインパラメータ更新を可能にする。
四極子ドローンの騒音レベルとハードウェア実験によるシミュレーションにより,提案手法が複雑な環境下で正確な適応意図予測を実現することを示す。
関連論文リスト
- Real-Time Sampling-based Online Planning for Drone Interception [18.340019191662957]
本稿では,ニューラルネットワークの推論を利用して,時間を要する非線形軌道最適化を代替するサンプリングベースのオンライン計画アルゴリズムを提案する。
提案手法は、無人機が衝突を回避し、不完全な目標予測を処理しながら、目標を迎撃しなければならないドローン迎撃問題に適用される。
論文 参考訳(メタデータ) (2025-02-20T03:48:38Z) - Smoothed Online Learning for Prediction in Piecewise Affine Systems [43.64498536409903]
本稿では,最近開発されたスムーズなオンライン学習フレームワークに基づく。
これは、断片的なアフィン系における予測とシミュレーションのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2023-01-26T15:54:14Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Incremental Correction in Dynamic Systems Modelled with Neural Networks
for Constraint Satisfaction [6.729108277517129]
提案手法は、その引数の基底値のまわりのダイナミクスを線形化することである。
オンライン更新アプローチは、有限水平制御の全体的なターゲティング精度を高めるのに有用である。
論文 参考訳(メタデータ) (2022-09-08T10:33:30Z) - Regret Analysis of Online Gradient Descent-based Iterative Learning
Control with Model Mismatch [4.922572106422331]
不正確な勾配情報を用いたオンライン勾配差に基づくスキームの性能を解析した。
本手法の基本的限界と適応機構との統合について検討した。
論文 参考訳(メタデータ) (2022-04-10T16:35:27Z) - Guaranteed Trajectory Tracking under Learned Dynamics with Contraction Metrics and Disturbance Estimation [5.147919654191323]
本稿では,制約指標と外乱推定に基づく軌道中心学習制御へのアプローチを提案する。
提案するフレームワークは、平面四重項の例で検証される。
論文 参考訳(メタデータ) (2021-12-15T15:57:33Z) - Online Algorithms and Policies Using Adaptive and Machine Learning
Approaches [0.22020053359163297]
非線形力学系の2つのクラスが考慮され、どちらも制御アフィンである。
本稿では,外ループにおける強化学習に基づくポリシーの組み合わせを,名目力学の安定性と最適性を確保するために好適に選択する。
リアルタイム制御による安定性保証の確立に加えて、AC-RLコントローラは、持続的な励振を伴うパラメータ学習につながることも示している。
論文 参考訳(メタデータ) (2021-05-13T22:51:25Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。