論文の概要: Perceptive Hierarchical-Task MPC for Sequential Mobile Manipulation in Unstructured Semi-Static Environments
- arxiv url: http://arxiv.org/abs/2603.10227v1
- Date: Tue, 10 Mar 2026 20:55:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:42.181508
- Title: Perceptive Hierarchical-Task MPC for Sequential Mobile Manipulation in Unstructured Semi-Static Environments
- Title(参考訳): 非構造半静的環境における逐次移動操作のための知覚階層型MPC
- Authors: Xintong Du, Jingxing Qian, Siqi Zhou, Angela P. Schoellig,
- Abstract要約: 連続的な移動操作は、一貫した動きの生成だけでなく、動作環境の変化に対するロボットの認識と適応性にも依存する。
本研究では,非構造的かつ変化する環境下での効率的な移動操作を実現するための,新しい知覚的階層型タスクモデル予測制御(HTMPC)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 10.890430040930971
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As compared to typical mobile manipulation tasks, sequential mobile manipulation poses a unique challenge -- as the robot operates over extended periods, successful task completion is not solely dependent on consistent motion generation but also on the robot's awareness and adaptivity to changes in the operating environment. While existing motion planners can generate whole-body trajectories to complete sequential tasks, they typically assume that the environment remains static and rely on precomputed maps. This assumption often breaks down during long-term operations, where semi-static changes such as object removal, introduction, or shifts are common. In this work, we propose a novel perceptive hierarchical-task model predictive control (HTMPC) framework for efficient sequential mobile manipulation in unstructured, changing environments. To tackle the challenge, we leverage a Bayesian inference framework to explicitly model object-level changes and thereby maintain a temporally accurate representation of the 3D environment; this up-to-date representation is embedded in a lexicographic optimization framework to enable efficient execution of sequential tasks. We validate our perceptive HTMPC approach through both simulated and real-robot experiments. In contrast to baseline methods, our approach systematically accounts for moved and phantom obstacles, successfully completing sequential tasks with higher efficiency and reactivity, without relying on prior maps or external infrastructure.
- Abstract(参考訳): 通常のモバイル操作タスクと比較して、シーケンシャルなモバイル操作はユニークな課題であり、ロボットが長期にわたって動作しているため、タスク完了の成功は、一貫した動作生成にのみ依存するだけでなく、動作環境の変化に対するロボットの認識と適応性にも依存する。
既存の運動プランナーは、シーケンシャルなタスクを完了するために全身の軌道を生成することができるが、通常は環境が静的であり、事前計算された地図に依存していると仮定する。
この仮定は、オブジェクトの削除、導入、シフトといった半静的な変更が一般的である、長期的な操作の間、しばしば壊れる。
本研究では,非構造的かつ変化する環境における効率的な移動操作のための,新しい知覚的階層型タスクモデル予測制御(HTMPC)フレームワークを提案する。
この課題に対処するために、ベイズ推論フレームワークを用いて、オブジェクトレベルの変化を明示的にモデル化し、3D環境の時間的精度を保ちながら、この最新の表現を辞書最適化フレームワークに組み込んで、シーケンシャルタスクの効率的な実行を可能にする。
シミュレーションおよび実ロボット実験により, 知覚型HTMPCアプローチの有効性を検証した。
ベースライン手法とは対照的に,本手法は移動障害や幻の障害を体系的に考慮し,事前の地図や外部インフラに頼ることなく,高い効率と反応性で逐次タスクを完了させる。
関連論文リスト
- Unlocking Smarter Device Control: Foresighted Planning with a World Model-Driven Code Execution Approach [82.27842884709378]
本研究では,自然言語理解と構造化推論を優先し,エージェントの環境に対するグローバルな理解を高める枠組みを提案する。
本手法は,従来の手法,特にタスク成功率の44.4%向上を達成している。
論文 参考訳(メタデータ) (2025-05-22T09:08:47Z) - Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [73.75271615101754]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。
Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。
Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文 参考訳(メタデータ) (2025-03-25T15:19:56Z) - Diffusion Transformer Policy [48.50988753948537]
本稿では,拡散変圧器ポリシー(Diffusion Transformer Policy)と呼ばれる多モード拡散変圧器を提案し,連続的なエンドエフェクタ動作をモデル化する。
トランスのスケーリング機能を活用することで、提案手法は、多種多様なロボットデータセットにわたる継続的エンドエフェクタアクションを効果的にモデル化することができる。
論文 参考訳(メタデータ) (2024-10-21T12:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。