Fugu-MT 論文翻訳(概要): Instruction Fine-Tuning: Does Prompt Loss Matter?

論文の概要: Instruction Fine-Tuning: Does Prompt Loss Matter?

arxiv url: http://arxiv.org/abs/2401.13586v2
Date: Sun, 18 Feb 2024 10:12:55 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 03:18:31.869813
Title: Instruction Fine-Tuning: Does Prompt Loss Matter?
Title（参考訳）: インストラクションファインチューニング: プロンプト損失は重要か?
Authors: Mathew Huerta-Enochian
Abstract要約: 本稿では,命令の微調整におけるPLWの効果について検討する。短時間補完データセットで微調整したモデルの性能はPLWと統計的に有意な負の二次関係を持つことがわかった。非ゼロのPLWはトレーニング中にトレーニング済みのモデル重みから外れないようにし、高いPLWは過度な適合を減少させると結論付けた。
参考スコア（独自算出の注目度）: 2.1756081703276
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a study analyzing the effects of prompt loss weighting (PLW) on supervised instruction fine-tuning. We recreated Stanford's Alpaca experiment with both LLaMA 1 and LLaMA 2 and multiple instruction datasets. We found that performance of models fine-tuned on our short-completion dataset had a statistically significant negative quadratic relationship with PLW, but performance of models fine-tuned on medium- and long-completion data did not show any relationship with PLW. I.e., prompt loss can be safely ignored for many datasets. For short-completion data, small values (0.01-0.1) of PLW were optimal for multiple-choice and short-generation tasks while large values (~ 1.0) of PLW were optimal for long-generation tasks. We concluded that low non-zero PLW encourages models to not diverge from pre-trained model weights during training and high PLW reduces overfitting. Finally, we present a rough guide for selecting PLW values based on the completion-prompt length ratio of fine-tuning data.
Abstract（参考訳）: 本稿では,教師付き命令の微調整におけるplwの効果について検討する。 LLaMA 1とLLaMA 2の両方と複数の命令データセットを用いて、スタンフォード大学のAlpaca実験を再現した。短時間補完データセットで微調整したモデルの性能はPLWと統計的に有意な負の二次関係を示したが,中長期補完データで微調整したモデルの性能はPLWとは何の関係も示さなかった。即時損失は多くのデータセットに対して安全に無視できる。短時間補完データの場合,PLWの小さな値 (0.01-0.1) は複数選択および短世代タスクに最適であり,PLWの大きな値 (~1.0) は長世代タスクに最適であった。その結果、低非ゼロPLWはトレーニング中にトレーニング済みモデル重量から逸脱しないようにし、高いPLWは過度な適合を減少させる。最後に、微調整データの完成-急激な長さ比に基づいてPLW値を選択するための粗いガイドを示す。

関連論文リスト

Exploring Fine-Tuning for Tabular Foundation Models [3.884856136722027]
本研究は,タブラル基礎モデル(TFM)におけるファインチューニングに関する最初の総合的研究である。我々は、ゼロショット、メタラーニング、スーパーバイザード(SFT)、パラメータ効率(PEFT)アプローチを比較し、不均衡、サイズ、次元といったデータセット要素が結果にどのように影響するかを分析する。本研究は, 性能, キャリブレーション, 公平性について検討し, 微調整が有効である時期と限界について検討した。
論文参考訳（メタデータ） (2026-01-14T17:40:46Z)
Learning from the Undesirable: Robust Adaptation of Language Models without Forgetting [18.680059467974825]
言語モデル(LM)は、ダウンストリームタスクに特化するために、教師付き微調整(SFT)によって適応されることが多い。微調整データに制限がある典型的なシナリオでは、SFTはLMを過度に適合させ、急激なパターンに依存する。本研究では,SFT がデータ制限のある LM を微調整する際の問題を緩和するための,単純かつ効果的な正規化手法であるLfU を提案する。
論文参考訳（メタデータ） (2025-11-17T06:57:44Z)
Verifying the Verifiers: Unveiling Pitfalls and Potentials in Fact Verifiers [59.168391398830515]
我々は,14のファクトチェックベンチマークのサンプルを用いて,12の事前学習LDMと1つの特殊ファクト検証器を評価した。データセットにおけるアノテーションエラーとあいまいさに対処することの重要性を強調します。最上位のパフォーマンスを実現するために、前作でしばしば見落とされがちな、数ショットのインコンテキストの例を持つフロンティアLSM。
論文参考訳（メタデータ） (2025-06-16T10:32:10Z)
Look Within or Look Beyond? A Theoretical Comparison Between Parameter-Efficient and Full Fine-Tuning [50.05207363001145]
フルファインチューニング(FFT)に匹敵する性能を実現するPEFT法最適化理論に基づく表現能力とロバスト性の観点から,PEFTとFFTの特性を比較した。分類,生成,推論,微調整タスクを含む15のデータセットの実験と,11の逆検定セットによる理論の検証を行った。
論文参考訳（メタデータ） (2025-05-28T13:35:12Z)
Water Quality Data Imputation via A Fast Latent Factorization of Tensors with PID-based Optimizer [21.261626027956737]
センサ故障による水質データには多くの欠落点がある。グラディエントDescent (SGD) によるPID (LFT) の潜在因子化は, 効率的な計算法であることが証明された。本稿では,この問題に対処するためのPID(FLFT)モデルについて提案する。
論文参考訳（メタデータ） (2025-03-10T07:22:54Z)
Visual Fourier Prompt Tuning [63.66866445034855]
本稿では,大規模なトランスフォーマーモデルに適用するための汎用的で効果的な方法として,Visual Fourier Prompt Tuning (VFPT)法を提案する。提案手法では,高速フーリエ変換を即時埋め込みに取り入れ,空間領域情報と周波数領域情報の両方を調和的に検討する。提案手法は,2つのベンチマークにおいて,現状のベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2024-11-02T18:18:35Z)
Large Continual Instruction Assistant [59.585544987096974]
CIT(Continuous Instruction Tuning)は、大規模モデルにデータによる人間の意図データに従うよう指示するために用いられる。既存の更新勾配は、CITプロセス中に前のデータセットのパフォーマンスを著しく損なうことになる。本稿では,この課題に対処する汎用的な連続的命令チューニングフレームワークを提案する。
論文参考訳（メタデータ） (2024-10-08T11:24:59Z)
An Empirical Study of Parameter Efficient Fine-tuning on Vision-Language Pre-train Model [33.853380101736306]
PEFTの自然な期待は、様々なPEFTの性能がデータサイズと微調整可能なパラメータサイズに肯定的な関係があることである。このような直感は、下流のデータとタスクが事前トレーニングと一致していない場合にのみ成立する。事前トレーニングと整合した下流の微調整では、データサイズはもはやパフォーマンスに影響を与えず、微調整可能なパラメータサイズの影響は単調ではない。
論文参考訳（メタデータ） (2024-03-13T11:33:38Z)
On the Performance of Empirical Risk Minimization with Smoothed Data [59.3428024282545]
経験的リスク最小化(Empirical Risk Minimization、ERM)は、クラスがiidデータで学習可能であれば、サブ線形誤差を達成できる。 We show that ERM can able to achieve sublinear error when a class are learnable with iid data。
論文参考訳（メタデータ） (2024-02-22T21:55:41Z)
SIBO: A Simple Booster for Parameter-Efficient Fine-Tuning [10.450910399290818]
初期残基を注入することによりPEFTを増強するSIBOを提案する。 22のベンチマークデータセットに対する大規模な実験により、SIBOは様々な強力なベースラインの性能を著しく向上させ、算術および常識推論タスクにおける既存のPEFTメソッドよりも最大15.7%、23.5%向上した。
論文参考訳（メタデータ） (2024-02-19T07:22:29Z)
From PEFT to DEFT: Parameter Efficient Finetuning for Reducing Activation Density in Transformers [52.199303258423306]
本稿では,事前学習したモデルにおいて,高い活性化空間性を促進する新しい密度損失を提案する。提案手法である textbfDEFT は,RoBERTa$_mathrmLarge$ で textbf44.94% ,Flan-T5$_mathrmXXL$ で textbf53.19% (エンコーダ密度) と textbf90.60% (デコーダ密度) で常に活性化密度を減少させることができる。
論文参考訳（メタデータ） (2024-02-02T21:25:46Z)
DePT: Decomposed Prompt Tuning for Parameter-Efficient Fine-tuning [14.975436239088312]
ソフトプロンプトを短いソフトプロンプトと2つの異なる学習率で最適化された低ランク行列に分解するDePTを提案する。 DePTは、いくつかのシナリオにおいて、完全な微調整ベースラインを含む最先端のPEFTアプローチよりも優れていることを示す。
論文参考訳（メタデータ） (2023-09-11T00:02:05Z)
Sensi-BERT: Towards Sensitivity Driven Fine-Tuning for Parameter-Efficient BERT [6.029590006321152]
本稿では、下流タスクのための感度駆動効率の良いBERTモデルの微調整であるSensi-BERTを提案する。実験の結果,MNLI,QQP,QNLI,SST-2,SQuADなどの下流タスクに対するSensi-BERTの有効性が示された。
論文参考訳（メタデータ） (2023-07-14T17:24:15Z)
To Repeat or Not To Repeat: Insights from Scaling LLM under Token-Crisis [50.31589712761807]
大規模言語モデル(LLM)は、事前トレーニング中にトークンに悩まされていることで知られており、Web上の高品質なテキストデータは、LSMのスケーリング制限に近づいている。本研究では,事前学習データの再学習の結果について検討し,モデルが過度に適合する可能性が示唆された。第2に, マルチエポック劣化の原因となる要因について検討し, データセットのサイズ, モデルパラメータ, トレーニング目標など, 重要な要因について検討した。
論文参考訳（メタデータ） (2023-05-22T17:02:15Z)
Strong Baselines for Parameter Efficient Few-Shot Fine-tuning [50.83426196335385]
FSC (Few-shot Classification) は、事前訓練(メタトレーニング)フェーズの後にクラス毎にいくつかの例を与えられた新しいクラスを学習する。近年の研究では、新しいテストクラスで事前訓練された視覚変換器(ViT)を微調整することが、FSCにとって強力なアプローチであることが示されている。しかし、微調整のViTは、時間、計算、ストレージに費用がかかる。これにより、Transformerのパラメータのごく一部だけを微調整するPEFT法が考案された。
論文参考訳（メタデータ） (2023-04-04T16:14:39Z)
Sound Event Classification in an Industrial Environment: Pipe Leakage Detection Use Case [3.9414768019101682]
産業環境におけるパイプ漏れ検出のための多段階機械学習パイプラインを提案する。提案されたパイプラインは複数のステップを適用し、それぞれが環境の課題に対処する。その結果, 精度99%, F1スコア0.93, 0.9の優れた結果が得られた。
論文参考訳（メタデータ） (2022-05-05T15:26:22Z)
CPM-2: Large-scale Cost-effective Pre-trained Language Models [71.59893315671997]
本稿では, PLM を用いた事前学習, 微調整, 推論の効率性問題に対処するための費用対効果技術について述べる。我々は,既存のPLMをスクラッチからトレーニングする代わりに活用することで,事前学習プロセスの促進を目的とした知識継承を導入する。計算資源が限られている大規模PLMに対して,新しい推論ツールキット,すなわちInfMoEを実装した。
論文参考訳（メタデータ） (2021-06-20T15:43:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。