論文の概要: Make LLM Learn to Synthesize from Streaming Experiences through Feedback
- arxiv url: http://arxiv.org/abs/2605.29940v1
- Date: Thu, 28 May 2026 13:51:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:56.365408
- Title: Make LLM Learn to Synthesize from Streaming Experiences through Feedback
- Title(参考訳): LLMがフィードバックを通じてストリーミングエクスペリエンスからシンセサイズを学ばせる
- Authors: Zhenlin Hu, Yan Wang, Zhen Bi, Zihao Xue, Bingyu Zhu, Longtao Huang, Xiongtao Zhang, Zeyu Yang, Zhixuan Chu, Jungang Lou,
- Abstract要約: 合成タスクが順次到着し、過去のタスクから経験することで、将来的な合成のための情報信号を提供する新しい設定であるStream Synthを紹介する。
タスクストリーム上で再利用可能な合成体験を合成モデルで取得できるフレームワークであるSynLearnerを提案する。
実験の結果、SynLearnerは以前のタスクからの経験を効果的に活用し、後続のタスクでの合成性能を改善し、一貫したクロスタスク転送性を示すことがわかった。
- 参考スコア(独自算出の注目度): 28.343295556944295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) have been widely adopted for synthetic data generation, significantly reducing annotation costs. However, most existing studies treat synthesis as a set of isolated tasks and overlook a more fundamental question: whether a model can learn to synthesize by accumulating experience from past tasks and transferring it to future ones. In this work, we introduce StreamSynth, a new setting in which synthesis tasks arrive sequentially and experience from historical tasks provides informative signals for future synthesis. To address this setting, we propose SynLearner, a general framework that enables synthesis models to acquire reusable synthesis experience over a task stream. Instead of generating data independently for each task, SynLearner encourages the model to explore diverse synthesis patterns, learn from feedback, and balance sample quality with set-level diversity as tasks evolve. Extensive experiments across multiple benchmarks show that SynLearner effectively leverages experience from earlier tasks to improve synthesis performance on later ones, exhibiting consistent cross-task transferability. These findings provide evidence for the feasibility of StreamSynth and highlight synthetic data generation as an experience-driven process that can benefit from task streams.
- Abstract(参考訳): 大規模言語モデル(LLM)は、アノテーションのコストを大幅に削減し、合成データ生成に広く採用されている。
しかしながら、既存のほとんどの研究は、合成を独立したタスクの集合として扱い、モデルが過去のタスクから経験を蓄積し、それを将来のタスクに移すことで合成を学ぶことができるかどうかという、より根本的な問題を見落としている。
本稿では,合成タスクが順次到着し,過去のタスクを体験することで,将来的な合成のための情報信号を提供するStreamSynthを紹介する。
この設定に対処するため、SynLearnerを提案する。SynLearnerは、タスクストリーム上で再利用可能な合成体験を合成モデルが取得できる汎用フレームワークである。
タスクごとに独立してデータを生成する代わりに、SynLearner氏は、さまざまな合成パターンを探索し、フィードバックから学び、タスクが進化するにつれてサンプル品質とセットレベルの多様性のバランスを取ることをモデルに推奨する。
複数のベンチマークにわたる大規模な実験により、SynLearnerは以前のタスクからの経験を効果的に活用し、後続のタスクの合成性能を改善し、一貫したクロスタスク転送可能性を示している。
これらの結果は、StreamSynthの実現可能性を示す証拠であり、タスクストリームから恩恵を受けることができるエクスペリエンス駆動プロセスとして、合成データ生成を強調している。
関連論文リスト
- Adapting Web Agents with Synthetic Supervision [80.89365133130558]
Webエージェントは、環境固有のタスクやデモが不足しているため、新しいWebサイトへの適応に苦慮している。
最近の研究は、この課題に対処するために合成データ生成を探求している。
完全合成監視フレームワークであるSynthAgentを提案する。
論文 参考訳(メタデータ) (2025-11-08T18:45:33Z) - EvoSyn: Generalizable Evolutionary Data Synthesis for Verifiable Learning [63.03672166010434]
我々は、進化的、タスクに依存しない、戦略を導いた、実行可能検証可能なデータ合成フレームワークを紹介します。
問題、多様な候補解、検証成果物を共同で合成する。
これは、人間による注釈付きチェックと戦略によるチェックの合意を強制する一貫性に基づく評価器を通じて戦略を反復的に発見する。
論文 参考訳(メタデータ) (2025-10-20T11:56:35Z) - Scaling Laws of Synthetic Data for Language Models [125.41600201811417]
プレトレーニングコーパスを多種多様な高品質な合成データセットに変換するスケーラブルなフレームワークであるSynthLLMを紹介した。
提案手法は,グラフアルゴリズムを用いて複数の文書にまたがるハイレベルな概念を自動的に抽出し,再結合することで実現している。
論文 参考訳(メタデータ) (2025-03-25T11:07:12Z) - Diversity-Driven Synthesis: Enhancing Dataset Distillation through Directed Weight Adjustment [39.137060714048175]
多様性の向上は、データセットを合成するための並列化可能であるが孤立したアプローチを改善することができる、と我々は主張する。
本稿では,動的かつ指向的な重み調整技術を用いて合成過程を変調する新しい手法を提案する。
提案手法は,合成データの各バッチが,元のデータセットの大規模かつ多様なサブセットの特徴を反映していることを保証する。
論文 参考訳(メタデータ) (2024-09-26T08:03:19Z) - SynthesizRR: Generating Diverse Datasets with Retrieval Augmentation [55.2480439325792]
トピック分類,感情分析,トーン検出,ユーモアの6つのデータセットの合成について検討した。
その結果,SynthesizRRは語彙や意味の多様性,人文との類似性,蒸留性能を大幅に向上させることがわかった。
論文 参考訳(メタデータ) (2024-05-16T12:22:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。