論文の概要: Affordance-Graphed Task Worlds: Self-Evolving Task Generation for Scalable Embodied Learning
- arxiv url: http://arxiv.org/abs/2602.12065v1
- Date: Thu, 12 Feb 2026 15:23:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.404222
- Title: Affordance-Graphed Task Worlds: Self-Evolving Task Generation for Scalable Embodied Learning
- Title(参考訳): Affordance-Graphed Task Worlds: スケーラブルな身体学習のための自己進化型タスク生成
- Authors: Xiang Liu, Sen Cui, Guocai Yao, Zhong Cao, Jingheng Ma, Min Zhang, Changshui Zhang,
- Abstract要約: Affordance-Graphed Task Worlds (AGT-World) は対話型シミュレーション環境とそれに対応するロボットタスクポリシーを自律的に構築するフレームワークである。
ランダムな提案や静的レプリケーションに依存するメソッドとは異なり、AGT-Worldは構造化グラフとしてタスク空間を定式化している。
提案手法は,スケーラブルなロボット学習のための提案,実行,修正の自己改善サイクルを達成し,成功率と一般化を著しく上回る。
- 参考スコア(独自算出の注目度): 38.10198732103412
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training robotic policies directly in the real world is expensive and unscalable. Although generative simulation enables large-scale data synthesis, current approaches often fail to generate logically coherent long-horizon tasks and struggle with dynamic physical uncertainties due to open-loop execution. To address these challenges, we propose Affordance-Graphed Task Worlds (AGT-World), a unified framework that autonomously constructs interactive simulated environments and corresponding robot task policies based on real-world observations. Unlike methods relying on random proposals or static replication, AGT-World formalizes the task space as a structured graph, enabling the precise, hierarchical decomposition of complex goals into theoretically grounded atomic primitives. Furthermore, we introduce a Self-Evolution mechanism with hybrid feedback to autonomously refine policies, combining Vision-Language Model reasoning and geometric verification. Extensive experiments demonstrate that our method significantly outperforms in success rates and generalization, achieving a self-improving cycle of proposal, execution, and correction for scalable robot learning.
- Abstract(参考訳): 現実の世界でロボットのポリシーを直接訓練するのは、高価で費用がかからない。
生成的シミュレーションは大規模なデータ合成を可能にするが、現在の手法では論理的に一貫性のある長距離タスクの生成に失敗し、オープンループ実行による動的物理的不確実性に苦慮することが多い。
これらの課題に対処するため,実世界観測に基づく対話型シミュレーション環境とそれに対応するロボットタスクポリシーを自律的に構築する統合フレームワークであるAffordance-Graphed Task Worlds (AGT-World)を提案する。
ランダムな提案や静的複製に依存する手法とは異なり、AGT-Worldはタスク空間を構造化グラフとして形式化し、複雑な目標を理論的に基底化された原子原始体に正確に階層的に分解することを可能にする。
さらに,ビジョンランゲージモデル推論と幾何的検証を組み合わせることで,ポリシを自律的に洗練するためのハイブリッドフィードバックを備えた自己進化機構を導入する。
大規模実験により,提案手法は,拡張性のあるロボット学習のための提案・実行・修正の自己改善サイクルを達成し,成功率と一般化率を著しく上回ることを示した。
関連論文リスト
- End-to-end example-based sim-to-real RL policy transfer based on neural stylisation with application to robotic cutting [3.398964351541323]
そこで本研究では,強化学習政策のシミュレートから現実への移行手法を提案する。
スタイル転送のための自己教師付き特徴表現を共同学習するために,変分オートエンコーダを用いる。
本稿では,未知素材のロボット切断を事例として,本手法の適用例を示す。
論文 参考訳(メタデータ) (2026-01-28T18:45:55Z) - One Life to Learn: Inferring Symbolic World Models for Stochastic Environments from Unguided Exploration [77.8436947454471]
シンボリック・ワールド・モデリングは、実行可能プログラムとして環境の遷移力学を推論し、表現する必要がある。
OneLifeは、条件付きアクティベートされたプログラム法則を通じて世界ダイナミクスをモデル化するフレームワークである。
OneLifeは、最小限の、ガイドなしのインタラクションから、キー環境のダイナミクスをうまく学べる。
論文 参考訳(メタデータ) (2025-10-14T02:49:32Z) - Executable Analytic Concepts as the Missing Link Between VLM Insight and Precise Manipulation [70.8381970762877]
VLM(Vision-Language Models)は、セマンティック推論とタスク計画において顕著な能力を示す。
本稿では,VLMに基づく推論を実行可能な解析概念を通じて基礎づける新しいフレームワークであるGRACEを紹介する。
G GRACEは高レベル命令理解と低レベルロボット制御の統一的で解釈可能なインターフェースを提供する。
論文 参考訳(メタデータ) (2025-10-09T09:08:33Z) - Robotic World Model: A Neural Network Simulator for Robust Policy Optimization in Robotics [50.191655141020505]
この研究は、長期水平予測、エラー蓄積、およびsim-to-real転送の課題に対処することで、モデルに基づく強化学習を前進させる。
スケーラブルでロバストなフレームワークを提供することで、現実のアプリケーションにおいて適応的で効率的なロボットシステムを実現することができる。
論文 参考訳(メタデータ) (2025-01-17T10:39:09Z) - Planning-Guided Diffusion Policy Learning for Generalizable Contact-Rich Bimanual Manipulation [16.244250979166214]
Generalizable Planning-Guided Diffusion Policy Learning (GLIDE)は、コンタクトリッチな双方向操作タスクを解決するためのアプローチである。
本稿では,特徴抽出,タスク表現,行動予測,データ拡張における重要な設計オプションのセットを提案する。
本手法は, 多様な地形, 寸法, 物理的特性の物体を効果的に操作することができる。
論文 参考訳(メタデータ) (2024-12-03T18:51:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。