論文の概要: A Robust Task-Level Control Architecture for Learned Dynamical Systems
- arxiv url: http://arxiv.org/abs/2511.09790v1
- Date: Fri, 14 Nov 2025 01:10:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-14 22:53:22.486486
- Title: A Robust Task-Level Control Architecture for Learned Dynamical Systems
- Title(参考訳): 学習力学系のためのロバストタスクレベル制御アーキテクチャ
- Authors: Eshika Pathak, Ahmed Aboudonia, Sandeep Banik, Naira Hovakimyan,
- Abstract要約: 動的システム(DS)に基づく実演学習(LfD)は,ロボットシステムの動作空間における動作計画を生成する強力なツールである。
タスクレベルのロバスト制御アーキテクチャ L1-augmented Dynamical Systems (L1-DS) を提案する。
我々のフレームワークは、名目安定化コントローラとL1適応コントローラを備えたDSベースのLfDモデルを拡張します。
- 参考スコア(独自算出の注目度): 5.9875599887427216
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Dynamical system (DS)-based learning from demonstration (LfD) is a powerful tool for generating motion plans in the operation (`task') space of robotic systems. However, the realization of the generated motion plans is often compromised by a ''task-execution mismatch'', where unmodeled dynamics, persistent disturbances, and system latency cause the robot's actual task-space state to diverge from the desired motion trajectory. We propose a novel task-level robust control architecture, L1-augmented Dynamical Systems (L1-DS), that explicitly handles the task-execution mismatch in tracking a nominal motion plan generated by any DS-based LfD scheme. Our framework augments any DS-based LfD model with a nominal stabilizing controller and an L1 adaptive controller. Furthermore, we introduce a windowed Dynamic Time Warping (DTW)-based target selector, which enables the nominal stabilizing controller to handle temporal misalignment for improved phase-consistent tracking. We demonstrate the efficacy of our architecture on the LASA and IROS handwriting datasets.
- Abstract(参考訳): 動的システム(DS)に基づく実演学習(LfD)は,ロボットシステムの操作(「タスク」)空間における運動計画を生成する強力なツールである。
しかし、生成した動作計画の実現はしばしば「タスク実行ミスマッチ」によって損なわれ、そこでは、非モデル化されたダイナミクス、永続的な障害、システムの遅延により、ロボットの実際のタスク空間状態が所望の運動軌跡から分岐する。
L1-DS(L1-Augmented Dynamical Systems)と呼ばれる新しいタスクレベルのロバスト制御アーキテクチャを提案する。
我々のフレームワークは、名目安定化コントローラとL1適応コントローラを備えたDSベースのLfDモデルを拡張します。
さらに、位相整合性トラッキングを改善するために、名目安定化コントローラが時間的ミスアライメントを処理できるように、ウィンドウ付き動的時間ワープ(DTW)ベースのターゲットセレクタを導入する。
LASAおよびIROS手書きデータセットにおけるアーキテクチャの有効性を実証する。
関連論文リスト
- SP-VLA: A Joint Model Scheduling and Token Pruning Approach for VLA Model Acceleration [70.72227437717467]
VLA(Vision-Language-Action)モデルは、その強力な制御能力に注目が集まっている。
計算コストが高く、実行頻度も低いため、ロボット操作や自律ナビゲーションといったリアルタイムタスクには適さない。
本稿では,共同スケジューリングモデルとプルーニングトークンにより,VLAモデルを高速化する統一フレームワークSP-VLAを提案する。
論文 参考訳(メタデータ) (2025-06-15T05:04:17Z) - Dynamic Manipulation of Deformable Objects in 3D: Simulation, Benchmark and Learning Strategy [88.8665000676562]
従来の手法は、しばしば問題を低速または2D設定に単純化し、現実の3Dタスクに適用性を制限する。
データ不足を軽減するため、新しいシミュレーションフレームワークと、低次ダイナミクスに基づくベンチマークを導入する。
本研究では,シミュレーション前トレーニングと物理インフォームドテスト時間適応を統合するフレームワークであるDynamics Informed Diffusion Policy (DIDP)を提案する。
論文 参考訳(メタデータ) (2025-05-23T03:28:25Z) - Zero-Shot Trajectory Planning for Signal Temporal Logic Tasks [7.389002274709231]
Signal Temporal Logic (STL) は、連続信号の複雑な時間的挙動を記述するための強力な仕様言語である。
STLタスクの実行可能なSTLプランの生成は、タスク仕様とシステムダイナミクスの結合を考慮する必要があるため、難しい。
オフライントレーニングにおいてタスク非依存の軌道データのみを活用することで、新しいSTLタスクへのゼロショット一般化を可能にする階層的計画フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-23T08:15:52Z) - Iterative Learning Control of Fast, Nonlinear, Oscillatory Dynamics (Preprint) [0.0]
非線形でカオス的で、しばしばアクティブな制御方式では速すぎる。
そこで我々は,反復的,軌道最適化,パラメータ調整による代替能動制御システムを開発した。
特定の要件を満たす限り、コントローラは情報不足や制御不能なパラメータに対して堅牢であることを示す。
論文 参考訳(メタデータ) (2024-05-30T13:27:17Z) - Interactive Character Control with Auto-Regressive Motion Diffusion Models [18.727066177880708]
リアルタイム動作合成のためのA-MDM(Auto-Regressive Motion Diffusion Model)を提案する。
我々の条件拡散モデルは初期ポーズを入力とし、前者のフレームに条件付けられた連続した動きフレームを自動回帰的に生成する。
本稿では,タスク指向サンプリング,インペインティング,階層的強化学習など,対話型制御をA-MDMに組み込む一連の手法を紹介する。
論文 参考訳(メタデータ) (2023-06-01T07:48:34Z) - OSCAR: Data-Driven Operational Space Control for Adaptive and Robust
Robot Manipulation [50.59541802645156]
オペレーショナル・スペース・コントロール(OSC)は、操作のための効果的なタスクスペース・コントローラとして使われてきた。
本稿では,データ駆動型OSCのモデル誤差を補償するOSC for Adaptation and Robustness (OSCAR)を提案する。
本手法は,様々なシミュレーション操作問題に対して評価し,制御器のベースラインの配列よりも大幅に改善されていることを示す。
論文 参考訳(メタデータ) (2021-10-02T01:21:38Z) - Imitation Learning for Robust and Safe Real-time Motion Planning: A
Contraction Theory Approach [9.35511513240868]
LAG-ROSは、境界外乱によって乱される安全臨界非線形システムのリアルタイムロバストな動作計画アルゴリズムである。
LAG-ROSはリアルタイム計算のためのより速い実行の速度のより高い制御性能そしてタスクの成功率を達成します。
論文 参考訳(メタデータ) (2021-02-25T03:47:15Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。