論文の概要: Guiding Data Collection via Factored Scaling Curves
- arxiv url: http://arxiv.org/abs/2505.07728v1
- Date: Mon, 12 May 2025 16:36:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-13 20:21:49.491394
- Title: Guiding Data Collection via Factored Scaling Curves
- Title(参考訳): ファクタースケーリング曲線によるデータ収集のガイド
- Authors: Lihan Zha, Apurva Badithela, Michael Zhang, Justin Lidard, Jeremy Bao, Emily Zhou, David Snyder, Allen Z. Ren, Dhruv Shah, Anirudha Majumdar,
- Abstract要約: 大規模なデータセットで訓練された一般の模倣学習ポリシーは、多様な操作タスクを解決するための大きな約束を示す。
異なる条件への一般化を保証するために、ポリシーは環境要因の多様さにまたがって収集されたデータで訓練される必要がある。
本稿では,因子スケーリング曲線を構成することにより,各因子について収集するデータと収集するデータ量を決定する方法を提案する。
- 参考スコア(独自算出の注目度): 16.429557849719885
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalist imitation learning policies trained on large datasets show great promise for solving diverse manipulation tasks. However, to ensure generalization to different conditions, policies need to be trained with data collected across a large set of environmental factor variations (e.g., camera pose, table height, distractors) $-$ a prohibitively expensive undertaking, if done exhaustively. We introduce a principled method for deciding what data to collect and how much to collect for each factor by constructing factored scaling curves (FSC), which quantify how policy performance varies as data scales along individual or paired factors. These curves enable targeted data acquisition for the most influential factor combinations within a given budget. We evaluate the proposed method through extensive simulated and real-world experiments, across both training-from-scratch and fine-tuning settings, and show that it boosts success rates in real-world tasks in new environments by up to 26% over existing data-collection strategies. We further demonstrate how factored scaling curves can effectively guide data collection using an offline metric, without requiring real-world evaluation at scale.
- Abstract(参考訳): 大規模なデータセットで訓練された一般の模倣学習ポリシーは、多様な操作タスクを解決するための大きな約束を示す。
しかし、異なる条件を一般化するためには、大規模な環境要因の変動(例えば、カメラポーズ、テーブルの高さ、気晴らしなど)にまたがって収集されたデータで政策を訓練する必要がある。
本研究では,FSC(Factered Scaling curves)を構築することにより,各因子について収集するデータと収集するデータ量を決定する方法を提案する。
これらの曲線は、特定の予算内で最も影響力のある要素の組み合わせをターゲットとするデータ取得を可能にする。
提案手法は,スクラッチ環境と微調整環境の両方において,広範囲なシミュレーションおよび実世界の実験を通じて評価し,既存のデータ収集戦略よりも最大26%,新しい環境における実世界のタスクの成功率を高めることを示す。
さらに、実世界のスケール評価を必要とせず、オフラインメトリックを使用してデータ収集を効果的にガイドする方法を実証する。
関連論文リスト
- FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文 参考訳(メタデータ) (2025-03-20T04:49:40Z) - Capturing the Temporal Dependence of Training Data Influence [100.91355498124527]
我々は、訓練中にデータポイントを除去する影響を定量化する、軌跡特異的な離脱の影響の概念を定式化する。
軌道固有LOOの効率的な近似を可能にする新しい手法であるデータ値埋め込みを提案する。
データバリューの埋め込みは、トレーニングデータの順序付けをキャプチャするので、モデルトレーニングのダイナミクスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2024-12-12T18:28:55Z) - Dual-Criterion Model Aggregation in Federated Learning: Balancing Data Quantity and Quality [0.0]
フェデレートラーニング(FL)は、プライバシ保護のための協調学習の鍵となる方法の1つとなっている。
集約アルゴリズムは、システムの有効性と安全性を確保する上で最も重要なコンポーネントの1つとして認識される。
本研究では,クライアントノードからのデータ量と品質を含む新しい二項重み付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-11-12T14:09:16Z) - $\textbf{Only-IF}$:Revealing the Decisive Effect of Instruction Diversity on Generalization [1.6958018695660049]
トレーニングデータがセマンティックドメインで十分に分散されている場合、textbfonlyが$であることを示す。
例えば$textit$textbfspecialist$$と$textit$textbf generalist$$$モデルの微調整などです。
論文 参考訳(メタデータ) (2024-10-07T03:15:11Z) - Efficient Data Collection for Robotic Manipulation via Compositional Generalization [70.76782930312746]
本研究では, 環境要因をデータから構成し, 未確認の要因の組み合わせに遭遇した場合に成功できることを示す。
コンポジションを利用したドメイン内データ収集手法を提案する。
ビデオはhttp://iliad.stanford.edu/robot-data-comp/で公開しています。
論文 参考訳(メタデータ) (2024-03-08T07:15:38Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。