Fugu-MT 論文翻訳(概要): What Makes Good Instruction-Tuning Data? An In-Context Learning Perspective

論文の概要: What Makes Good Instruction-Tuning Data? An In-Context Learning Perspective

arxiv url: http://arxiv.org/abs/2604.25132v1
Date: Tue, 28 Apr 2026 02:09:28 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-29 16:49:17.664757
Title: What Makes Good Instruction-Tuning Data? An In-Context Learning Perspective
Title（参考訳）: 優れたインストラクションチューニングデータとは何か? インテクスト学習の視点から
Authors: Guangzeng Han, Xiaolei Huang,
Abstract要約: We propose a instruction data selection framework based on weighted in-context influence (wICI)。そこで本研究では,コンテキスト内から効果的な指導指導データを構成するもの,サンプルの難易度がコンテキスト内の影響と相関するかどうか,コンテキスト内の影響が命令チューニングの有効性にどのように影響するか,という3つの重要な疑問に対処する。
参考スコア（独自算出の注目度）: 3.6513314422153296
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Instruction-tuning datasets often contain substantial redundancy and low-quality samples, necessitating effective data selection methods. We propose an instruction data selection framework based on weighted in-context influence (wICI), which measures how effectively each candidate example reduces instruction-following difficulty for semantically related peers. Through systematic experiments, we address three key questions: what constitutes effective instruction tuning data from an in-context perspective, whether sample difficulty correlates with in-context influence, and how in-context influence translates to instruction tuning effectiveness. Experiments across multiple models and benchmarks demonstrate that our method consistently outperforms existing baselines under constrained data budgets, while empirically showing that sample difficulty negatively correlates with in-context influence.
Abstract（参考訳）: インストラクションチューニングデータセットは、しばしば実質的な冗長性と低品質なサンプルを含み、効果的なデータ選択方法を必要とする。本稿では,重み付きインコンテキスト・インフルエンス(wICI)に基づく命令データ選択フレームワークを提案する。系統的な実験を通じて,テキスト内から効果的な指導指導データを構成するもの,サンプルの難易度がテキスト内の影響と相関するものかどうか,テキスト内の影響が命令チューニングの効率にどのように変換されるか,の3つの重要な疑問に対処する。複数のモデルおよびベンチマーク実験により,本手法は制約付きデータ予算下で既存のベースラインを一貫して上回り,サンプルの難易度とコンテキスト内の影響が負の相関があることを実証的に示す。

関連論文リスト

Influence Functions for Efficient Data Selection in Reasoning [22.94556593981994]
チェーン・オブ・ソート(CoT)データに基づく細調整された大型言語モデル(LLM)は、少量の高品質なデータが大量のデータセットより優れていることを示している。本稿では,個々のCoTサンプルが下流の精度に与える影響を計測する影響関数を用いて,推論データ品質を定義することを提案する。
論文参考訳（メタデータ） (2025-10-07T16:40:42Z)
On the Loss of Context-awareness in General Instruction Fine-tuning [101.03941308894191]
教師付き微調整後の文脈認識の喪失について検討した。性能低下は,会話指導の微調整中に学んだ異なる役割に対する偏見と関連していることがわかった。一般命令微調整データセットから文脈依存例を識別する指標を提案する。
論文参考訳（メタデータ） (2024-11-05T00:16:01Z)
How Hard is this Test Set? NLI Characterization by Exploiting Training Dynamics [49.9329723199239]
本稿では, 実例と非実例を手作業で構築することなく, 挑戦的なテストセットを自動生成する手法を提案する。一般的なNLIデータセットのテストセットを,トレーニングダイナミクスを利用した3つの難易度に分類する。我々の評価法がトレーニングセットに適用された場合、トレーニング対象データのごく一部でトレーニングされたモデルは、フルデータセットでトレーニングされたモデルに匹敵するパフォーマンスを達成する。
論文参考訳（メタデータ） (2024-10-04T13:39:21Z)
Most Influential Subset Selection: Challenges, Promises, and Beyond [9.479235005673683]
我々は,最も集団的影響の大きいトレーニングサンプルのサブセットを特定することを目的とした,MISS(Most Influential Subset Selection)問題について検討する。我々は、MISにおける一般的なアプローチを包括的に分析し、その強みと弱点を解明する。本稿では,これらを反復的に適用した適応バージョンが,試料間の相互作用を効果的に捕捉できることを実証する。
論文参考訳（メタデータ） (2024-09-25T20:00:23Z)
One-Shot Learning as Instruction Data Prospector for Large Language Models [108.81681547472138]
textscNuggetsはワンショット学習を使用して、広範なデータセットから高品質な命令データを選択する。我々は,textscNuggets がキュレートした例の上位1%による命令チューニングが,データセット全体を用いた従来の手法よりも大幅に優れていることを示す。
論文参考訳（メタデータ） (2023-12-16T03:33:12Z)
Finding Support Examples for In-Context Learning [73.90376920653507]
本稿では,この課題を2段階に解決するためのfilter-thEN-Search法であるLENSを提案する。まず、データセットをフィルタリングして、個別に情報的インコンテキストの例を得る。そこで本研究では,反復的に改良し,選択したサンプル順列を評価可能な多様性誘導型サンプル探索を提案する。
論文参考訳（メタデータ） (2023-02-27T06:32:45Z)
Improving Multi-Turn Response Selection Models with Complementary Last-Utterance Selection by Instance Weighting [84.9716460244444]
我々は、データリソース自体の根底にある相関を利用して、異なる種類の監視信号を導出することを検討する。 2つの公開データセットで広範な実験を行い、両方のデータセットで大幅に改善した。
論文参考訳（メタデータ） (2020-02-18T06:29:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。