論文の概要: SynthICL: Scalable In-context Imitation Learning with Synthetic Data
- arxiv url: http://arxiv.org/abs/2606.08154v1
- Date: Sat, 06 Jun 2026 13:09:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.878713
- Title: SynthICL: Scalable In-context Imitation Learning with Synthetic Data
- Title(参考訳): SynthICL: 合成データを用いたスケーラブルなインコンテキスト模倣学習
- Authors: Cheng Qian, Ruomeng Fan, Yifei Ren, Yilong Wang, Edward Johns,
- Abstract要約: インコンテキスト模倣学習(ICIL)は、ロボットが少数のデモから新しいタスクを学習することを可能にする。
RGBのみの合成データからICILポリシーをトレーニングするフレームワークであるSynthICLを提案する。
- 参考スコア(独自算出の注目度): 14.31290372298426
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In-context imitation learning (ICIL) enables robots to learn new tasks from a small number of demonstrations by conditioning a pre-trained policy on task-specific examples, without retraining at test time. Despite this promise, training generalizable and scalable in-context imitation policies remains an open challenge. We present SynthICL, a scalable framework that trains ICIL policies entirely from RGB-only synthetic data. Specifically, we build a data generation pipeline to produce high-fidelity ICIL data and train a flow-matching transformer policy on the resulting dataset. SynthICL avoids the need for depth sensing, precise camera calibration, and real-world training data in prior approaches, offering a simpler and more scalable alternative. We further incorporate subgoal prediction by training the model to predict the next subgoal images, enabling more precise and visually grounded control. Evaluated on 16 unseen real-world manipulation tasks, SynthICL achieves an average success rate of 79% with only one demonstration provided at test time and outperforms prior methods. Project page: https://synth-icl.github.io
- Abstract(参考訳): In-context mimicion Learning (ICIL)は、テスト時に再トレーニングすることなく、タスク固有の例に対して事前訓練されたポリシーを条件にすることで、少数のデモから新しいタスクを学習することを可能にする。
この約束にもかかわらず、一般化可能でスケーラブルなインコンテキスト模倣ポリシーはオープンな課題である。
我々は、RGBのみの合成データからICILポリシーをトレーニングするスケーラブルなフレームワークであるSynthICLを提案する。
具体的には、高忠実度ICILデータを生成するデータ生成パイプラインを構築し、結果のデータセットにフローマッチングトランスフォーマーポリシーをトレーニングする。
SynthICLは、よりシンプルでスケーラブルな代替手段を提供するため、奥行き検知、精密カメラキャリブレーション、および以前のアプローチでの現実世界のトレーニングデータを必要としない。
さらに、モデルのトレーニングにより、次のサブゴール画像を予測することで、より正確で視覚的に接地された制御を可能にする。
SynthICLは16の目に見えない実世界の操作タスクに基づいて評価され、テスト時に1つのデモしか提供されず、平均的な成功率は79%に達する。
プロジェクトページ:https://synth-icl.github.io
関連論文リスト
- End-to-end example-based sim-to-real RL policy transfer based on neural stylisation with application to robotic cutting [3.398964351541323]
そこで本研究では,強化学習政策のシミュレートから現実への移行手法を提案する。
スタイル転送のための自己教師付き特徴表現を共同学習するために,変分オートエンコーダを用いる。
本稿では,未知素材のロボット切断を事例として,本手法の適用例を示す。
論文 参考訳(メタデータ) (2026-01-28T18:45:55Z) - Studying the Role of Synthetic Data for Machine Learning-based Wireless Networks Traffic Forecasting [1.1699027359021665]
本稿では,大規模Wi-Fi展開のための一階自動回帰雑音統計量に基づく合成データ生成手法を提案する。
実験結果から, 実データを用いて得られた10~15項目のうち, 平均絶対誤差(MAE)値が得られた。
一般化が必要な場合、合成データ学習モデルは、実データ学習ベースラインと比較して、予測精度を最大50%向上させる。
論文 参考訳(メタデータ) (2026-01-12T15:27:55Z) - Test-time Offline Reinforcement Learning on Goal-related Experience [50.94457794664909]
基礎モデルの研究では、テストタイムトレーニングによってパフォーマンスが大幅に改善できることが示されている。
本稿では、オフラインデータセットから現在の状態への関連性に応じて遷移を選択する、新しい自己教師型データ選択基準を提案する。
目標条件付きテストタイムトレーニング(GC-TTT)アルゴリズムは、評価中にこのルーチンを後退水平方式で適用し、現在の軌道にポリシーを適用する。
論文 参考訳(メタデータ) (2025-07-24T21:11:39Z) - Private Training & Data Generation by Clustering Embeddings [74.00687214400021]
差分プライバシー(DP)は、個々のデータを保護するための堅牢なフレームワークを提供する。
本稿では,DP合成画像埋め込み生成のための新しい原理的手法を提案する。
経験的に、合成的に生成された埋め込みに基づいて訓練された単純な2層ニューラルネットワークは、最先端(SOTA)分類の精度を達成する。
論文 参考訳(メタデータ) (2025-06-20T00:17:14Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - A Scaling Law for Synthetic-to-Real Transfer: A Measure of Pre-Training [52.93808218720784]
合成から現実への変換学習は,実タスクのための合成画像と接地真実アノテーションを用いた事前学習を行うフレームワークである。
合成画像はデータの不足を克服するが、事前訓練されたモデルで微調整性能がどのようにスケールするかは定かではない。
我々は、合成事前学習データの様々なタスク、モデル、複雑さにおける学習曲線を一貫して記述する、単純で一般的なスケーリング法則を観察する。
論文 参考訳(メタデータ) (2021-08-25T02:29:28Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。