論文の概要: EgoGuide: Egocentric Guidance for Efficient Robot-Free Demonstration Collection and Learning
- arxiv url: http://arxiv.org/abs/2606.14665v1
- Date: Fri, 12 Jun 2026 17:36:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:43.013256
- Title: EgoGuide: Egocentric Guidance for Efficient Robot-Free Demonstration Collection and Learning
- Title(参考訳): EgoGuide: 効率的なロボットレスデモコレクションと学習のためのエゴセントリックガイダンス
- Authors: Yue Xu, Mingtao Nie, Tianle Li, Hong Li, Yibo Luo, Siyuan Huang, Yong-Lu Li,
- Abstract要約: EgoGuideは、同期した手首と頭/自我中心の観察を記録するコレクションインターフェースである。
我々はまた、視点の異なる自我中心カメラからの堅牢な学習のためのGated Egocentric Residual Policyも導入した。
実世界の実験では、EgoGuideは必要なデータエピソード数を削減し、データ効率を向上させる。
- 参考スコア(独自算出の注目度): 24.974334099369543
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Robot learning from real-world demonstrations is currently constrained by data scaling. Universal Manipulation Interface (UMI) provides an efficient robot-free data collection interface, yet current UMI-style pipelines often collect redundant demonstrations and lack global scene context. To improve data efficiency, we present EgoGuide, a collection interface that records synchronized wrist and head/egocentric observations and couples them with online visual-geometric data quality guidance. We also introduce a Gated Egocentric Residual Policy for robust learning from a viewpoint-varying egocentric camera, allowing head/egocentric context to correct ambiguous local observations while preserving stable wrist-view control. Real-world experiments show that EgoGuide reduces the required number of data episodes and improves data efficiency. The residual policy further improves robustness under visual occlusion. Project Page: https://silicx.github.io/EgoGuide
- Abstract(参考訳): 実世界のデモから学ぶロボットは現在、データスケーリングによって制限されている。
Universal Manipulation Interface (UMI)は、効率的なロボットフリーのデータ収集インタフェースを提供するが、現在のUMIスタイルのパイプラインは、しばしば冗長なデモを集め、グローバルなシーンコンテキストを欠いている。
データ効率を向上させるために、同期した手首と頭/自我中心の観測結果を記録し、それらをオンラインの視覚幾何学的データ品質ガイダンスと結合するコレクションインターフェースであるEgoGuideを提案する。
また,安定した手首視点制御を保ちながら,頭部/自我中心のコンテキストで不明瞭な局部観察を補正できる,視点変化型自我中心型カメラからの堅牢な学習のためのGated Egocentric Residual Policyを導入する。
実世界の実験では、EgoGuideは必要なデータエピソード数を削減し、データ効率を向上させる。
残留ポリシーは、視覚的閉塞下での堅牢性をさらに改善する。
Project Page: https://silicx.github.io/EgoGuide
関連論文リスト
- EgoTraj: Real-World Egocentric Human Trajectory Dataset for Multimodal Prediction [4.1965237414146666]
EgoTrajはMeta Quest Pro(MQPro)を用いて記録されたエゴセントリックなマルチモーダルオープンデータセットである
現実世界の都市環境において、複数のMQPro装着者から収集された75のヒューマンナビゲーションが含まれている。
私たちの知る限りでは、EgoTrajは、長い水平な自己方向のナビゲーションをキャプチャすることで、典型的なエゴセントリックな軌道データセットとは異なる。
論文 参考訳(メタデータ) (2026-05-18T18:26:51Z) - EgoSim: Egocentric World Simulator for Embodied Interaction Generation [93.11209644808783]
EgoSimは、空間的に一貫した対話ビデオを生成するクローズドループエゴセントリックな世界シミュレータである。
連続シミュレーションのために、基礎となる3Dシーン状態を継続的に更新する。
EgoSimは、視覚的品質、空間的整合性、一般化の点で、既存の手法を大幅に上回っている。
論文 参考訳(メタデータ) (2026-04-01T15:00:46Z) - ENIGMA-360: An Ego-Exo Dataset for Human Behavior Understanding in Industrial Scenarios [50.47300468137957]
ENIGMA-360は、実際の産業シナリオで取得された新しいエゴエクソデータセットである。
データセットは、時間的に同期された180エゴセントリックと180エゴセントリックなプロシージャビデオで構成されている。
これらの結果は、実環境において堅牢なエゴエクソ理解が可能な新しいモデルの必要性を浮き彫りにする。
論文 参考訳(メタデータ) (2026-03-10T14:47:15Z) - AoE: Always-on Egocentric Human Video Collection for Embodied AI [44.083451969789216]
ファンデーションモデルは、事前トレーニングとスケーリングのために、大規模で高品質な現実世界のインタラクションデータを必要とする。
我々は,人間とスマートフォンを活用したハードウェア依存の簡易化を目的とした,Always-on Egocentric (AoE)データ収集システムを提案する。
論文 参考訳(メタデータ) (2026-02-27T10:41:49Z) - A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning [67.72413262980272]
事前訓練された視覚モデル(PVM)は現代のロボティクスの基本であるが、その最適構成は定かではない。
セマンティック・ボトルネックを導入してオブジェクト中心の表現を誘導する手法であるSlotMIMを開発した。
提案手法は,画像認識,シーン理解,ロボット学習評価において,従来の作業よりも大幅に改善されている。
論文 参考訳(メタデータ) (2025-03-10T06:18:31Z) - EgoMe: A New Dataset and Challenge for Following Me via Egocentric View in Real World [12.699670048897085]
人間の模倣学習において、模倣者は、通常、自我中心の視点を基準として、自我中心の視点から自我中心の視点に観察された振る舞いを自然に伝達する。
実世界における模倣者の自我中心的な視点を通じて、人間の模倣学習のプロセスに従うためのEgoMeを紹介する。
我々のデータセットには7902対のエゴビデオが含まれており、様々な現実のシナリオにおいて多様な日々の行動にまたがっている。
論文 参考訳(メタデータ) (2025-01-31T11:48:22Z) - EgoMimic: Scaling Imitation Learning via Egocentric Video [22.902881956495765]
EgoMimicは、人間の体表データを介して操作をスケールするフルスタックフレームワークである。
EgoMimic は,1) エルゴノミクス・プロジェクト・Aria メガネを用いたヒトの体型データをキャプチャするシステム,2) 人体データとの運動的ギャップを最小限に抑える低コストなバイマティックマニピュレータ,(4) 人体データとロボットデータとのコトレーニングを行う模倣学習アーキテクチャ,の2つによって実現している。
論文 参考訳(メタデータ) (2024-10-31T17:59:55Z) - Learning Fine-grained View-Invariant Representations from Unpaired
Ego-Exo Videos via Temporal Alignment [71.16699226211504]
我々は,エゴセントリックな映像とエゴセントリックな映像を時間内に整列させることにより,視点に不変なきめ細かいアクション特徴を学習することを提案する。
そこで本研究では,2つの鍵設計を持つ自己教師型埋め込み手法であるAE2を提案する。
評価のために,エゴ・エクソ・コンテキストにおけるきめ細かい映像理解のためのベンチマークを構築した。
論文 参考訳(メタデータ) (2023-06-08T19:54:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。