Fugu-MT 論文翻訳(概要): Make LLM Learn to Synthesize from Streaming Experiences through Feedback

論文の概要: Make LLM Learn to Synthesize from Streaming Experiences through Feedback

arxiv url: http://arxiv.org/abs/2605.29940v1
Date: Thu, 28 May 2026 13:51:58 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-30 02:45:56.365408
Title: Make LLM Learn to Synthesize from Streaming Experiences through Feedback
Title（参考訳）: LLMがフィードバックを通じてストリーミングエクスペリエンスからシンセサイズを学ばせる
Authors: Zhenlin Hu, Yan Wang, Zhen Bi, Zihao Xue, Bingyu Zhu, Longtao Huang, Xiongtao Zhang, Zeyu Yang, Zhixuan Chu, Jungang Lou,
Abstract要約: 合成タスクが順次到着し、過去のタスクから経験することで、将来的な合成のための情報信号を提供する新しい設定であるStream Synthを紹介する。タスクストリーム上で再利用可能な合成体験を合成モデルで取得できるフレームワークであるSynLearnerを提案する。実験の結果、SynLearnerは以前のタスクからの経験を効果的に活用し、後続のタスクでの合成性能を改善し、一貫したクロスタスク転送性を示すことがわかった。
参考スコア（独自算出の注目度）: 28.343295556944295
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Large language models (LLMs) have been widely adopted for synthetic data generation, significantly reducing annotation costs. However, most existing studies treat synthesis as a set of isolated tasks and overlook a more fundamental question: whether a model can learn to synthesize by accumulating experience from past tasks and transferring it to future ones. In this work, we introduce StreamSynth, a new setting in which synthesis tasks arrive sequentially and experience from historical tasks provides informative signals for future synthesis. To address this setting, we propose SynLearner, a general framework that enables synthesis models to acquire reusable synthesis experience over a task stream. Instead of generating data independently for each task, SynLearner encourages the model to explore diverse synthesis patterns, learn from feedback, and balance sample quality with set-level diversity as tasks evolve. Extensive experiments across multiple benchmarks show that SynLearner effectively leverages experience from earlier tasks to improve synthesis performance on later ones, exhibiting consistent cross-task transferability. These findings provide evidence for the feasibility of StreamSynth and highlight synthetic data generation as an experience-driven process that can benefit from task streams.
Abstract（参考訳）: 大規模言語モデル(LLM)は、アノテーションのコストを大幅に削減し、合成データ生成に広く採用されている。しかしながら、既存のほとんどの研究は、合成を独立したタスクの集合として扱い、モデルが過去のタスクから経験を蓄積し、それを将来のタスクに移すことで合成を学ぶことができるかどうかという、より根本的な問題を見落としている。本稿では,合成タスクが順次到着し,過去のタスクを体験することで,将来的な合成のための情報信号を提供するStreamSynthを紹介する。この設定に対処するため、SynLearnerを提案する。SynLearnerは、タスクストリーム上で再利用可能な合成体験を合成モデルが取得できる汎用フレームワークである。タスクごとに独立してデータを生成する代わりに、SynLearner氏は、さまざまな合成パターンを探索し、フィードバックから学び、タスクが進化するにつれてサンプル品質とセットレベルの多様性のバランスを取ることをモデルに推奨する。複数のベンチマークにわたる大規模な実験により、SynLearnerは以前のタスクからの経験を効果的に活用し、後続のタスクの合成性能を改善し、一貫したクロスタスク転送可能性を示している。これらの結果は、StreamSynthの実現可能性を示す証拠であり、タスクストリームから恩恵を受けることができるエクスペリエンス駆動プロセスとして、合成データ生成を強調している。

論文の概要: Make LLM Learn to Synthesize from Streaming Experiences through Feedback

関連論文リスト