論文の概要: Data Agent: Learning to Select Data via End-to-End Dynamic Optimization
- arxiv url: http://arxiv.org/abs/2603.07433v1
- Date: Sun, 08 Mar 2026 03:10:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-10 15:13:14.588125
- Title: Data Agent: Learning to Select Data via End-to-End Dynamic Optimization
- Title(参考訳): データエージェント: エンドツーエンド動的最適化によるデータ選択の学習
- Authors: Suorong Yang, Fangjian Su, Hai Gan, Ziqi Ye, Jie Li, Baile Xu, Furao Shen, Soujanya Poria,
- Abstract要約: データエージェントは、トレーニング対応のシーケンシャルな意思決定問題としてデータ選択を定式化する。
データエージェントは、パフォーマンスを保留または改善しながら、トレーニングを継続的に加速する。
データセットに依存しない定式化とモジュラー報酬により、タスクやシナリオをプラグイン&プレイできる。
- 参考スコア(独自算出の注目度): 37.1771265765151
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic Data selection aims to accelerate training by prioritizing informative samples during online training. However, existing methods typically rely on task-specific handcrafted metrics or static/snapshot-based criteria to estimate sample importance, limiting scalability across learning paradigms and making it difficult to capture the evolving utility of data throughout training. To address this challenge, we propose Data Agent, an end-to-end dynamic data selection framework that formulates data selection as a training-aware sequential decision-making problem. The agent learns a sample-wise selection policy that co-evolves with model optimization, guided by a composite reward that integrates loss-based difficulty and confidence-based uncertainty signals. The reward signals capture complementary objectives of optimization impact and information gain, together with a tuning-free adaptive weighting mechanism that balances these signals over training. Extensive experiments across a wide range of datasets and architectures demonstrate that Data Agent consistently accelerates training while preserving or improving performance, e.g., reducing costs by over 50\% on ImageNet-1k and MMLU with lossless performance. Moreover, its dataset-agnostic formulation and modular reward make it plug-and-play across tasks and scenarios, e.g., robustness to noisy datasets, highlighting its potential in real-world scenarios.
- Abstract(参考訳): 動的データ選択は、オンライントレーニング中に情報的サンプルを優先順位付けすることで、トレーニングを加速することを目的としている。
しかしながら、既存のメソッドは通常、サンプルの重要度を見積り、学習パラダイム間のスケーラビリティを制限し、トレーニングを通じてデータの進化する有用性を捉えるのが困難になるために、タスク固有の手作業メトリクスや静的/スナップショットベースの基準に依存しています。
この課題に対処するために,データ選択をトレーニング対応のシーケンシャル意思決定問題として定式化する,エンドツーエンドの動的データ選択フレームワークであるData Agentを提案する。
エージェントは、損失に基づく困難と信頼に基づく不確実性信号を統合する複合報酬によって導かれるモデル最適化と共進化するサンプルワイズ選択ポリシーを学習する。
報酬信号は、最適化効果と情報ゲインの相補的な目的を、トレーニング中にこれらの信号のバランスをとる調整不要適応重み付け機構とともに捉えている。
幅広いデータセットとアーキテクチャにわたる大規模な実験により、Data Agentは継続的にトレーニングを加速し、パフォーマンスを保存または改善している。
さらに、データセットに依存しない定式化とモジュラー報酬により、タスクやシナリオ、例えば、ノイズの多いデータセットに対する堅牢性など、プラグアンドプレイが可能になり、現実のシナリオにおけるその可能性を強調している。
関連論文リスト
- ZPD Detector: Data Selection via Capability-Difficulty Alignment for Large Language Models [9.072905469784951]
本研究では,モデルとデータ間の双方向的な視点を取り入れたデータ選択フレームワークZPD Detectorを提案する。
ZPDインタクタは、困難校正、アイテム応答理論(IRTy)に基づくモデル能力推定、そして、最も情報性の高いサンプルを動的に識別する能力微分マッチングスコアを統合する。
論文 参考訳(メタデータ) (2026-01-16T04:23:10Z) - RL-Selector: Reinforcement Learning-Guided Data Selection via Redundancy Assessment [10.284993431741377]
サンプル間の関係に基づいてサンプル冗長性を定量化する,エプシロン・サンプル被覆の概念を導入する。
我々は、強化学習プロセスとしてデータ選択を再構成し、RLセレクタを提案する。
我々の手法は、既存の最先端のベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2025-06-26T06:28:56Z) - When Dynamic Data Selection Meets Data Augmentation [10.217776379089093]
動的データ選択と拡張を統一する新しいオンラインデータトレーニングフレームワークを提案する。
提案手法は,各サンプルの局所密度と多モーダル意味一貫性の結合分布を推定し,拡張に適したサンプルのターゲット選択を可能にする。
提案手法は, 耐雑音性を高め, モデルロバスト性を向上し, 実世界のシナリオにおける実用性を向上する。
論文 参考訳(メタデータ) (2025-05-02T11:38:48Z) - FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。
ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。
本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文 参考訳(メタデータ) (2025-03-20T04:49:40Z) - A CLIP-Powered Framework for Robust and Generalizable Data Selection [51.46695086779598]
実世界のデータセットは、しばしば冗長でノイズの多いデータを含み、トレーニング効率とモデルパフォーマンスに悪影響を及ぼす。
データ選択は、データセット全体から最も代表的なサンプルを特定することを約束している。
より堅牢で一般化可能なサンプル選択にマルチモーダル情報を活用するCLIPを利用した新しいデータ選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-15T03:00:58Z) - LESS: Selecting Influential Data for Targeted Instruction Tuning [64.78894228923619]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。