論文の概要: Expanding Spatial and Temporal Context for Robotic Imitation Learning With Scene Graphs
- arxiv url: http://arxiv.org/abs/2606.01072v1
- Date: Sun, 31 May 2026 07:34:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.191752
- Title: Expanding Spatial and Temporal Context for Robotic Imitation Learning With Scene Graphs
- Title(参考訳): シーングラフを用いたロボット模倣学習のための空間的・時間的文脈の拡大
- Authors: Jianing Qian, Qinhe Peng, Emmanuel Panov, Leonor Fermoselle, Dinesh Jayaraman, Bernadette Bucher, Tarik Kelestemur,
- Abstract要約: 本研究では,シーングラフを模倣学習における明示的で構造化された記憶機構として用いることを提案する。
オブジェクト中心の関係と時間的進化をキャプチャする動的なシーングラフを維持することにより,エージェントが関連する歴史的文脈を維持することができる。
実世界におけるモバイル操作とテーブルトップ操作のシミュレーション実験により,提案手法が政策性能を大幅に向上することを示す。
- 参考スコア(独自算出の注目度): 20.685320925756375
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Imitation learning enables robots to learn how to execute tasks via observation. However, real-world environments like homes and offices are often severely partially observed due to their large spatial scales. In addition, many tasks involve executing a series of subtasks requiring autonomous robots to reason over extended time horizons. To address these challenges, we propose using scene graphs as an explicit and structured memory mechanism in imitation learning. By maintaining a dynamic scene graph that captures object-centric relationships and their evolution over time, our method allows the agent to retain relevant historical context during task execution to efficiently reason over incrementally accrued scene information. Our experiments on simulated mobile manipulation and real-world tabletop manipulation demonstrate that our approach substantially improves policy performance, particularly in settings that demand long-term reasoning and robust generalization under partial observability.
- Abstract(参考訳): 模倣学習により、ロボットは観察を通してタスクの実行方法を学ぶことができる。
しかし、住宅やオフィスのような現実世界の環境は、空間的規模が大きいため、しばしば部分的に観察される。
加えて、多くのタスクは、長い時間的地平線を越えて自律ロボットに推論を要求する一連のサブタスクの実行を含む。
これらの課題に対処するために,シーングラフを模倣学習における明示的で構造化された記憶機構として用いることを提案する。
オブジェクト中心の関係と時間的進化をキャプチャする動的なシーングラフを維持することにより,タスク実行中にエージェントが関連する履歴コンテキストを保持でき,段階的に獲得したシーン情報を効率的に推論することができる。
モバイル操作のシミュレーションと実世界のテーブルトップ操作に関する実験は、特に長期的推論と部分観測可能性による堅牢な一般化を必要とする環境では、我々のアプローチが政策性能を大幅に向上することを示した。
関連論文リスト
- Learning Semantic-Geometric Task Graph-Representations from Human Demonstrations [16.68801520494275]
対象の同一性や対象間の関係を符号化する意味幾何学的タスクグラフ表現と,その時間的幾何学的進化を人間の実演から導入する。
意味幾何学的タスクグラフ表現は、高い動作とオブジェクトの可変性を持つタスクに特に有益であることを示す。
論文 参考訳(メタデータ) (2026-01-16T17:35:00Z) - Generalizable Geometric Prior and Recurrent Spiking Feature Learning for Humanoid Robot Manipulation [90.90219129619344]
本稿では,スパイキング機能を備えたR-prior-S, Recurrent Geometric-priormodal Policyを提案する。
物理的現実の高レベル推論を基礎として、軽量な2次元幾何学的帰納バイアスを利用する。
ロボット行動生成におけるデータ効率問題に対して,再帰的適応スパイクネットワークを導入する。
論文 参考訳(メタデータ) (2026-01-13T23:36:30Z) - FindingDory: A Benchmark to Evaluate Memory in Embodied Agents [49.18498389833308]
本研究では,Habitatシミュレータに長距離エンボディタスクのための新しいベンチマークを導入する。
このベンチマークは、持続的なエンゲージメントとコンテキスト認識を必要とする60タスクにわたるメモリベースの機能を評価する。
論文 参考訳(メタデータ) (2025-06-18T17:06:28Z) - Reasoning in visual navigation of end-to-end trained agents: a dynamical systems approach [23.52028824411467]
本研究では,物理ロボットを用いた実環境におけるヌンペプソデスのナビゲーションエピソードに関する大規模実験を行った。
エンドツーエンドのトレーニングから生じる推論のタイプを分析します。
本稿では,エージェントが学習した値関数が長期計画に関連があることをポストホック分析で示す。
論文 参考訳(メタデータ) (2025-03-11T11:16:47Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Instruction-driven history-aware policies for robotic manipulations [82.25511767738224]
複数の入力を考慮に入れた統一型トランスフォーマー方式を提案する。
特に,我々のトランスフォーマーアーキテクチャは,(i)自然言語命令と(ii)多視点シーン観測を統合している。
RLBenchベンチマークと実世界のロボットを用いて,本手法の評価を行った。
論文 参考訳(メタデータ) (2022-09-11T16:28:25Z) - Modeling Long-horizon Tasks as Sequential Interaction Landscapes [75.5824586200507]
本稿では,一連のデモビデオからのみ,サブタスク間の依存関係と遷移を学習するディープラーニングネットワークを提案する。
これらのシンボルは、画像観察から直接学習し、予測できることが示される。
我々は,(1)人間によって実行されるパズル片のブロック積み重ね,(2)物体のピック・アンド・プレイスとキャビネットドアを7-DoFロボットアームで滑らせるロボット操作という,2つの長期水平作業において,我々の枠組みを評価する。
論文 参考訳(メタデータ) (2020-06-08T18:07:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。