論文の概要: ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning
- arxiv url: http://arxiv.org/abs/2603.01474v2
- Date: Thu, 05 Mar 2026 04:48:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-23 08:17:41.812051
- Title: ROSER: Few-Shot Robotic Sequence Retrieval for Scalable Robot Learning
- Title(参考訳): ROSER:スケーラブルなロボット学習のためのFew-Shot Robotic Sequence Retrieval
- Authors: Zillur Rahman, Eddison Pham, Alejandro Daniel Noel, Cristian Meo,
- Abstract要約: ロボット学習における重要なボトルネックは、タスクラベル付きセグメント化されたトレーニングデータの不足である。
時間ウィンドウ上でタスクに依存しない距離空間を学習する軽量な数ショット検索フレームワークであるROSERを紹介する。
我々の実験では、ROSERは精度と効率の両面で全ての先行手法を一貫して上回っている。
- 参考スコア(独自算出の注目度): 40.51327348071904
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A critical bottleneck in robot learning is the scarcity of task-labeled, segmented training data, despite the abundance of large-scale robotic datasets recorded as long, continuous interaction logs. Existing datasets contain vast amounts of diverse behaviors, yet remain structurally incompatible with modern learning frameworks that require cleanly segmented, task-specific trajectories. We address this data utilization crisis by formalizing robotic sequence retrieval: the task of extracting reusable, task-centric segments from unlabeled logs using only a few reference examples. We introduce ROSER, a lightweight few-shot retrieval framework that learns task-agnostic metric spaces over temporal windows, enabling accurate retrieval with as few as 3-5 demonstrations, without any task-specific training required. To validate our approach, we establish comprehensive evaluation protocols and benchmark ROSER against classical alignment methods, learned embeddings, and language model baselines across three large-scale datasets (e.g., LIBERO, DROID, and nuScenes). Our experiments demonstrate that ROSER consistently outperforms all prior methods in both accuracy and efficiency, achieving sub-millisecond per-match inference while maintaining superior distributional alignment. By reframing data curation as few-shot retrieval, ROSER provides a practical pathway to unlock underutilized robotic datasets, fundamentally improving data availability for robot learning.
- Abstract(参考訳): ロボット学習における重要なボトルネックは、タスクラベル付きセグメント化されたトレーニングデータの不足である。
既存のデータセットには膨大な多様な振る舞いが含まれているが、クリーンにセグメンテーションされたタスク固有の軌道を必要とする現代の学習フレームワークとは構造的に相容れない。
ロボットシーケンス検索の形式化により、このデータ利用危機に対処する: 少数の参照例を用いて、ラベルのないログから再利用可能なタスク中心セグメントを抽出するタスク。
ROSERは,時間的ウィンドウ上でタスクに依存しない距離空間を学習し,タスク固有のトレーニングを必要とせずに,最大3~5回のデモで正確な検索を可能にする軽量な数ショット検索フレームワークである。
提案手法を検証するため,従来のアライメント手法,学習埋め込み,言語モデルベースライン(LIBERO,DROID,nuScenesなど)に対する総合的な評価プロトコルとROSERのベンチマークを確立した。
実験により, ROSERは精度と効率の両面において, 従来手法よりも常に優れており, より優れた分布アライメントを維持しつつ, サブミリ秒毎のマッチング推定を実現していることがわかった。
データキュレーションを数ショットの検索として再定義することで、ROSERは、未使用のロボットデータセットをアンロックする実用的な経路を提供し、ロボット学習のためのデータ可用性を根本的に改善する。
関連論文リスト
- Retrieval-Augmented Robots via Retrieve-Reason-Act [5.93914911947526]
我々は、ロボットが受動的執行者からアクティブな情報検索ユーザーへと進化する必要があると主張している。
以前のデモが存在しない厳密なゼロショット設定では、ロボットは重要な情報ギャップに直面している。
このパラダイムをRetrieval-Augmented Robotics (RAR) と定義し,ロボットに情報探索機能を持たせる。
論文 参考訳(メタデータ) (2026-03-03T07:32:15Z) - Robometer: Scaling General-Purpose Robotic Reward Models via Trajectory Comparisons [69.87766750714945]
汎用ロボット報酬モデルは通常、専門家によるデモンストレーションから絶対的なタスク進捗を予測するために訓練される。
本稿では、軌道内進行監視と軌道間優先監視を組み合わせたスケーラブルな報酬モデリングフレームワークRobometerを紹介する。
ロビオメーターは、専門家データに報酬等級を固定するフレームレベルのプログレス・ロスと、グローバルな順序制約を課す軌跡比較優先損失という2つの目的で訓練されている。
論文 参考訳(メタデータ) (2026-03-02T17:38:58Z) - What Matters in Learning from Large-Scale Datasets for Robot Manipulation [12.703188997313223]
我々はこの質問に答えるために大規模なデータセット合成研究を行っている。
既存のデータセットの多様性の共通源を手続き的にエミュレートするデータ生成フレームワークを開発した。
カメラのポーズや空間配置は、収集における多様性と検索におけるアライメントの両方にとって重要な次元であることがわかった。
論文 参考訳(メタデータ) (2025-06-16T14:25:29Z) - Coarse-to-fine Q-Network with Action Sequence for Data-Efficient Robot Learning [62.3886343725955]
本稿では,行動列上のQ値を出力する批判ネットワークを学習する,新しい値に基づく強化学習アルゴリズムを提案する。
実験により、CQN-ASは、様々なスパース逆ヒューマノイド制御およびテーブルトップ操作タスクにおいて、いくつかのベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2024-11-19T01:23:52Z) - Affordance-based Robot Manipulation with Flow Matching [7.51335919610328]
本稿では,ロボット操作支援のためのフレームワークを提案する。
第1に,大規模モデルを下流シーンの空き時間理解タスクに効果的に適用し,第2に,視覚的空き時間モデルに基づいて,効果的にロボット行動軌跡を学習する。
我々は,教師付きフローマッチング手法を用いて,ロボットの行動軌跡を空き時間で案内する。
論文 参考訳(メタデータ) (2024-09-02T09:11:28Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - Pre-Training for Robots: Offline RL Enables Learning New Tasks from a
Handful of Trials [97.95400776235736]
新しいタスクを効果的に学習しようとするオフラインRLに基づくフレームワークを提案する。
既存のロボットデータセットの事前トレーニングと、新しいタスクの迅速な微調整と、最大10のデモを組み合わせたものだ。
我々の知る限り、PTRは本物のWidowXロボットで新しいドメインで新しいタスクを学習する最初のRL手法である。
論文 参考訳(メタデータ) (2022-10-11T06:30:53Z) - Learn Fast, Segment Well: Fast Object Segmentation Learning on the iCub
Robot [20.813028212068424]
我々は、新しいオブジェクトや異なるドメインの存在下で、オブジェクトセグメンテーションモデルに適応できる様々な技術について研究する。
データをストリーム化するロボットアプリケーションのための高速なインスタンスセグメンテーション学習のためのパイプラインを提案する。
提案したパイプラインを2つのデータセットでベンチマークし、実際のロボットであるiCubヒューマノイドにデプロイする。
論文 参考訳(メタデータ) (2022-06-27T17:14:04Z) - Laser2Vec: Similarity-based Retrieval for Robotic Perception Data [7.538482310185135]
本稿では,多くのデプロイメントから2次元LiDARデータを安価に保存するシステムを実装し,完全・部分スキャンのためのトップクェリを効率よく評価する。
我々は畳み込み変分オートエンコーダを用いてレーザスキャンの圧縮表現を生成し、それらをデータベースに格納する。
我々は,ロボットが同じ場所に遭遇した複数のエピソードにまたがって,類似のスキャンを高精度かつ効率的に検出する。
論文 参考訳(メタデータ) (2020-07-30T21:11:50Z) - Scalable Multi-Task Imitation Learning with Autonomous Improvement [159.9406205002599]
我々は、自律的なデータ収集を通じて継続的に改善できる模倣学習システムを構築している。
我々は、ロボット自身の試行を、実際に試みたタスク以外のタスクのデモとして活用する。
従来の模倣学習のアプローチとは対照的に,本手法は,継続的改善のための疎い監視によるデータ収集を自律的に行うことができる。
論文 参考訳(メタデータ) (2020-02-25T18:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。