論文の概要: Grasp-Then-Plan with Failure Attribution: A Closed Two-Stage Framework for Precise and Generalizable Robotic Manipulation
- arxiv url: http://arxiv.org/abs/2606.03385v1
- Date: Tue, 02 Jun 2026 09:29:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.904455
- Title: Grasp-Then-Plan with Failure Attribution: A Closed Two-Stage Framework for Precise and Generalizable Robotic Manipulation
- Title(参考訳): Grasp-Then-Plan with failure Attribution: A Closed Two-Stage Framework for Precise and Generalizable Robotic Manipulation
- Authors: Jiahao Xu, Peiyuan Wang, Hanzhuo Zhang, Zihao Yu, Tianyu Fu, Hao Chen, Xuanhao Xiang, Jianbo Yu, Chenchen Fu, Wanyuan Wang,
- Abstract要約: ロボット操作において、握りと運動計画の密結合は、しばしば真の失敗の原因を曖昧にする。
本稿では,GTP-FAを提案する。GTP-FAはタスク指向の2段階のグリップ計画フレームワークで,グリップ候補を生成し,選択したグリップに条件付き下流動作計画を実行する。
GTP-FAは、RL、IL、拡散政治、VLAベースの設定にまたがって、対応するベースラーナーを改善し、全体的なタスク成功率を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 12.60091812522059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In robotic manipulation, the tight coupling between grasping and motion planning often obscures the true source of failure, leading to inefficient trial-and-error. To enable efficient long-horizon manipulation, we propose GTP-FA (Grasp-Then-Plan with Failure Attribution), a task-oriented two-stage grasp-then-plan framework that generates grasp candidates and performs downstream motion planning conditioned on the selected grasp. Given a failed manipulation trajectory, we learn a failure attribution model that generalizes to unseen grasps and produces a stable distribution over failure modes for diagnosis-guided optimization. Based on these attribution results, we then optimize both modules in a diagnosis-driven manner: on the grasping side, we inject task-level priors and risk penalties into grasp candidate scoring and optimization to suppress unstable or task-incompatible grasps; on the planning side, we target high-risk initial states through data collection and fine-tuning to address genuine planning bottlenecks. We evaluate the proposed framework in both simulation and real-robot experiments, and show that GTP-FA improves the corresponding base learners across RL, IL, diffusion-policy, and VLA-based settings, achieving substantially higher overall task success rates.
- Abstract(参考訳): ロボット操作において、把握と運動計画の密結合はしばしば失敗の原因を曖昧にし、非効率な試行錯誤につながる。
本稿では,GTP-FA(Grasp-Then-Plan with Failure Attribution)を提案する。
操作路の故障を考慮し, 認識不能な把握を一般化し, 診断誘導最適化のために, 故障モード上の安定分布を生成する故障帰属モデルを学習する。
これらの帰属結果に基づいて,両モジュールを診断駆動方式で最適化する。把握側では,不安定あるいはタスク非互換な把握を抑えるために,タスクレベル先行とリスクペナルティを把握対象のスコアと最適化に注入し,データ収集と真の計画ボトルネックに対処するために,リスクの高い初期状態をターゲットにする。
提案手法をシミュレーションと実ロボット実験の両方で評価し、GTP-FAがRL, IL, 拡散ポリシー, VLAベースの設定で対応するベースラーナーを改良し、タスク成功率を大幅に向上させることを示した。
関連論文リスト
- DisasterBench: Benchmarking LLM Planning under Typed Tool Interface Constraints [29.573427850164222]
災害は深刻な社会的影響を引き起こし、異種AIツールの迅速な調整を要求する。
効果的な調整には意味論的に妥当なツールを選択する以上のことが必要です。
本稿では,構造化マルチエージェント計画の評価ベンチマークであるDreamaBenchを紹介する。
論文 参考訳(メタデータ) (2026-05-27T04:50:23Z) - PIVOT: Bridging Planning and Execution in LLM Agents via Trajectory Refinement [22.285969725581044]
大規模言語モデル(LLM)ベースのエージェントは、実行時に失敗するように見える一貫性のある計画を生成する。
PIVOTは、トラジェクトリを最適化可能なオブジェクトとして、環境相互作用を通じて反復的に洗練する自己管理フレームワークを通じて、この計画実行ミスアライメントに対処する。
論文 参考訳(メタデータ) (2026-05-11T20:43:20Z) - Optimizing Trajectory-Trees in Belief Space: An Application from Model Predictive Control to Task and Motion Planning [12.236092368066332]
本稿では,部分的に観測可能なロボット計画問題に対して,一般的な逐次的トラジェクトリではなく,アーボラキシートラジェクトリ(トラジェクトリ木)の利点を考察する。
システムの1つの前方進化をモデル化するシーケンシャルなトラジェクトリとは異なり、トラジェクトリツリーは複数の可能なコンティニュエーションをキャプチャする。
論文 参考訳(メタデータ) (2026-05-03T13:06:20Z) - HAD: Combining Hierarchical Diffusion with Metric-Decoupled RL for End-to-End Driving [51.268878540511054]
我々は階層的拡散政策を備えたエンドツーエンドの計画フレームワークであるHADを提案する。
我々は,NAVSIMとHUGSIMの両方でHADが新たな最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2026-04-04T04:12:47Z) - World Action Verifier: Self-Improving World Models via Forward-Inverse Asymmetry [82.93104394404781]
汎用世界モデルは、スケーラブルなポリシー評価、最適化、計画を約束します。
本稿では,世界モデルによる予測誤りと自己改善を識別するフレームワークであるWorld Action Verifier(WAV)を提案する。
論文 参考訳(メタデータ) (2026-04-02T12:48:36Z) - TableMind++: An Uncertainty-Aware Programmatic Agent for Tool-Augmented Table Reasoning [44.20336483508951]
テーブル推論は、意味的理解と正確な数値操作を共同で行うモデルを必要とする。
これらの制約に対処するため、我々は以前TableMindをチューニングベースの自律型プログラムエージェントとして提案した。
この基盤をTableMind++に拡張し、新しい不確実性を認識した推論フレームワークを導入しました。
論文 参考訳(メタデータ) (2026-03-08T08:31:33Z) - Model Specific Task Similarity for Vision Language Model Selection via Layer Conductance [92.72779885657373]
本稿では,視覚エンコーダの内部関数力学におけるモデル選択の基盤となるフレームワークを提案する。
提案手法は,各タスクをレイヤワイドコンダクタンスにより表現し,エントロピー正規化アライメントによる目標条件付きブロック重要度分布を導出する。
そこで本研究では,DCD(Directional Conductance Divergence)という,ソースタスクが対象の機能ブロックをいかに効果的にカバーするかを定量化する非対称な指標を提案する。
論文 参考訳(メタデータ) (2026-02-01T17:29:43Z) - Plan-R1: Safe and Feasible Trajectory Planning as Language Modeling [74.41886258801209]
本稿では,行動学習から原理的アライメントを分離する2段階の軌道計画フレームワークを提案する。
Plan-R1は計画の安全性と実現可能性を大幅に改善し、最先端の性能を達成する。
論文 参考訳(メタデータ) (2025-05-23T09:22:19Z) - Improving Large Language Model Planning with Action Sequence Similarity [50.52049888490524]
本研究では,インコンテキスト学習(ICL)によるモデル計画能力の向上について検討する。
GRASE-DC は2段階のパイプラインで,まず高効率のAS例を再サンプリングし,選択した例をキュレートする。
実験の結果,GRASE-DCは様々な計画タスクにおいて大幅な性能向上を実現していることがわかった。
論文 参考訳(メタデータ) (2025-05-02T05:16:17Z) - World Modeling Makes a Better Planner: Dual Preference Optimization for Embodied Task Planning [60.100794160682646]
そこで本稿では,嗜好学習による状態予測と行動選択を協調的に最適化する新たな学習フレームワークを提案する。
人間のアノテーションを使わずに軌道や段階的な選好データを自動的に収集するために,試行錯誤による広範囲な探索のための木探索機構を導入する。
提案手法は,Qwen2-VL (7B), LLaVA-1.6 (7B), LLaMA-3.2 (11B) に適用した場合, 既存の手法と GPT-4o を著しく上回っている。
論文 参考訳(メタデータ) (2025-03-13T15:49:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。