論文の概要: Hierarchical Motion Planning and Control under Unknown Nonlinear Dynamics via Predicted Reachability
- arxiv url: http://arxiv.org/abs/2604.00320v1
- Date: Tue, 31 Mar 2026 23:36:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-02 16:44:31.76798
- Title: Hierarchical Motion Planning and Control under Unknown Nonlinear Dynamics via Predicted Reachability
- Title(参考訳): 予測到達可能性による未知非線形ダイナミクス下での階層的運動計画と制御
- Authors: Zhiquan Zhang, Melkior Ornik,
- Abstract要約: 未知の非線形力学の下での自律的な運動計画には、目標に向かってナビゲートしながら学習システムの特性が必要である。
我々は,事前のシステム知識を限定したオンライン動作合成を可能にする階層的計画制御フレームワークを開発した。
- 参考スコア(独自算出の注目度): 2.857551605623957
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autonomous motion planning under unknown nonlinear dynamics requires learning system properties while navigating toward a target. In this work, we develop a hierarchical planning-control framework that enables online motion synthesis with limited prior system knowledge. The state space is partitioned into polytopes and approximates the unknown nonlinear system using a piecewise-affine (PWA) model. The local affine models are identified once the agent enters the corresponding polytopes. To reduce computational complexity, we introduce a non-uniform adaptive state space partition strategy that refines the partition only in task-relevant regions. The resulting PWA system is abstracted into a directed weighted graph, whose edge existence is incrementally verified using reach control theory and predictive reachability conditions. Certified edges are weighted using provable time-to-reach bounds, while uncertain edges are assigned information-theoretic weights to guide exploration. The graph is updated online as new data becomes available, and high-level planning is performed by graph search, while low-level affine feedback controllers are synthesized to execute the plan. Furthermore, the conditions of classical reach control theory are often difficult to satisfy in underactuated settings. We therefore introduce relaxed reachability conditions to extend the framework to such systems. Simulations demonstrate effective exploration-exploitation trade-offs with formal reachability guarantees.
- Abstract(参考訳): 未知の非線形力学の下での自律的な運動計画には、目標に向かってナビゲートしながら学習システムの特性が必要である。
本研究では,事前のシステム知識を限定したオンライン動作合成が可能な階層型計画制御フレームワークを開発する。
状態空間はポリトープに分割され、ピースワイズアフィン(PWA)モデルを用いて未知の非線形系を近似する。
エージェントが対応するポリトップに入ると、局所的なアフィンモデルが識別される。
計算複雑性を低減するため,タスク関連領域のみに分割を洗練させる非一様適応状態空間分割戦略を導入する。
得られたPWAシステムは、エッジの存在を段階的に検証する有向重み付きグラフに抽象化され、到達制御理論と予測到達性条件を用いて検証される。
証明されたエッジは証明可能な時間とリーチの境界で重み付けされ、不確実なエッジは探索を導くために情報理論の重み付けが割り当てられる。
新たなデータが利用可能になると、グラフをオンラインで更新し、グラフ検索によって高レベルプランニングを行い、低レベルアフィンフィードバックコントローラを合成して計画を実行する。
さらに、古典的リーチ制御理論の条件は、不安定な環境では満たせないことが多い。
そこで我々は,フレームワークをそのようなシステムに拡張するために,ゆるやかな到達性条件を導入する。
シミュレーションは、正式な到達可能性を保証する効果的な探索・探索トレードオフを示す。
関連論文リスト
- Scaling Up Occupancy-centric Driving Scene Generation: Dataset and Method [54.461213497603154]
作業中心の手法は、最近、フレームとモダリティをまたいだ一貫した条件付けを提供することで、最先端の結果を得た。
Nuplan-Occは、広く使われているNuplanベンチマークから構築された、これまでで最大の占有率データセットである。
高品質な占有、多視点ビデオ、LiDAR点雲を共同で合成する統合フレームワークを開発した。
論文 参考訳(メタデータ) (2025-10-27T03:52:45Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - Latent feedback control of distributed systems in multiple scenarios through deep learning-based reduced order models [3.5161229331588095]
高次元分散システムの継続的な監視とリアルタイム制御は、望まれる物理的な振る舞いを保証するためにアプリケーションに不可欠である。
完全順序モデルに依存する従来のフィードバック制御設計は、制御計算の遅延のため、これらの要求を満たすことができない。
非線形非侵襲的深層学習に基づく還元順序モデル(DL-ROM)により強化されたリアルタイム閉ループ制御戦略を提案する。
論文 参考訳(メタデータ) (2024-12-13T08:04:21Z) - Hybrid Recurrent Models Support Emergent Descriptions for Hierarchical Planning and Control [0.8749675983608172]
リカレントスイッチング線形力学系(rSLDS)として知られるハイブリッド状態空間モデルのクラスは、意味のある振る舞い単位を発見する。
我々は、rSLDSによって形成されたリッチな表現は、計画と制御に有用な抽象化を提供することができると提案する。
本稿では,低レベル線形二乗制御器上に離散型MDPを配置する,アクティブ推論にインスパイアされた新しい階層型モデルベースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-20T16:02:54Z) - Exploration Policies for On-the-Fly Controller Synthesis: A
Reinforcement Learning Approach [0.0]
強化学習(RL)に基づく非有界学習のための新しい手法を提案する。
我々のエージェントは、非常に観察可能な部分的なRLタスクでスクラッチから学習し、トレーニング中に見つからないケースで、全体のパフォーマンスを上回ります。
論文 参考訳(メタデータ) (2022-10-07T20:28:25Z) - Model-Based Reinforcement Learning via Stochastic Hybrid Models [39.83837705993256]
本稿では非線形モデリングと制御のハイブリッドシステムビューを採用する。
本稿では,データの時間的構造を捉えるシーケンスモデリングパラダイムについて考察する。
これらの時系列モデルは,ローカルフィードバックコントローラの抽出に使用するクローズドループ拡張を自然に認めていることを示す。
論文 参考訳(メタデータ) (2021-11-11T14:05:46Z) - DySMHO: Data-Driven Discovery of Governing Equations for Dynamical
Systems via Moving Horizon Optimization [77.34726150561087]
本稿では,スケーラブルな機械学習フレームワークである移動水平最適化(DySMHO)による動的システムの発見について紹介する。
DySMHOは、基底関数の大きな辞書から基礎となる支配方程式を逐次学習する。
標準非線形力学系の例は、DySMHOが規則を正確に回復できることを示すために用いられる。
論文 参考訳(メタデータ) (2021-07-30T20:35:03Z) - Controlling nonlinear dynamical systems into arbitrary states using
machine learning [77.34726150561087]
機械学習(ML)を活用した,新しい完全データ駆動制御方式を提案する。
最近開発されたMLに基づく複雑なシステムの予測機能により、非線形系は任意の初期状態から来る任意の動的対象状態に留まることが証明された。
必要なデータ量が少なく,柔軟性の高いコントロールスキームを備えることで,工学から医学まで幅広い応用の可能性について簡単に議論する。
論文 参考訳(メタデータ) (2021-02-23T16:58:26Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z) - Implicit Regularization and Momentum Algorithms in Nonlinearly
Parameterized Adaptive Control and Prediction [13.860437051795419]
我々は,古典的適応非線形制御技術と最近の機械学習の進歩との間に強いつながりを生かしている。
適応的非線形制御と適応的ダイナミクス予測の両方において,アルゴリズム開発には未発達の可能性があることが示されている。
論文 参考訳(メタデータ) (2019-12-31T03:13:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。