論文の概要: Understanding and Improving Noisy Embedding Techniques in Instruction Finetuning
- arxiv url: http://arxiv.org/abs/2605.23171v1
- Date: Fri, 22 May 2026 02:43:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.167581
- Title: Understanding and Improving Noisy Embedding Techniques in Instruction Finetuning
- Title(参考訳): インストラクションファインタニングにおけるノイズ埋め込み手法の理解と改善
- Authors: Abhay Yadav,
- Abstract要約: 埋め込みにおける対称雑音を利用した言語モデルのための新しい微調整手法を提案する。
我々のアプローチであるSymNoiseは、対称ノイズ埋め込みを用いて、このスコアを69.04%に向上させた。
様々なモデルとより強力なベースライン命令データセットでテストすると、SymNoiseは一貫してNEFTuneを上回っている。
- 参考スコア(独自算出の注目度): 0.10152838128195468
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Recent advancements in instructional fine-tuning have injected noise into embeddings, with NEFTune (Jain et al., 2024) setting benchmarks using uniform noise. Despite NEFTune's empirical findings that uniform noise outperforms Gaussian noise, the reasons for this remain unclear. This paper aims to clarify this by offering a thorough analysis, both theoretical and empirical, indicating comparable performance among these noise types. Additionally, we introduce a new fine-tuning method for language models, utilizing symmetric noise in embeddings. This method aims to enhance the model's function by more stringently regulating its local curvature, demonstrating superior performance over the current method, NEFTune. When fine-tuning the LLaMA-2-7B model using Alpaca, standard techniques yield a 29.79% score on AlpacaEval. However, our approach, SymNoise, increases this score significantly to 69.04%, using symmetric noisy embeddings. This is a 6.7% improvement over the state-of-the-art method, NEFTune (64.69%). Furthermore, when tested on various models and stronger baseline instruction datasets, such as Evol-Instruct, ShareGPT, OpenPlatypus, SymNoise consistently outperforms NEFTune. The current literature, including NEFTune, has underscored the importance of more in-depth research into the application of noise-based strategies in the fine-tuning of language models. Our approach, SymNoise, is another significant step towards this direction, showing notable improvement over the existing state-of-the-art method.
- Abstract(参考訳): 近年, NEFTune (Jain et al , 2024) による一様雑音を用いたベンチマークにより, 音を埋め込みに注入している。
NEFTuneは、一様ノイズがガウスノイズより優れているという経験的な発見をしているが、その理由は不明なままである。
本論文は,これらのノイズタイプに匹敵する性能を示す理論的および経験的両方の徹底的な解析を提供することにより,これを明らかにすることを目的としている。
さらに,埋め込みにおける対称雑音を利用した言語モデルのためのファインチューニング手法を提案する。
本手法は,局所曲率をより厳密に制御し,現行手法NEFTuneよりも優れた性能を示すことにより,モデルの機能を向上することを目的としている。
アルパカを用いてLLaMA-2-7Bモデルを微調整すると、標準技術は29.79%のスコアをAlpacaEvalで得る。
しかし、我々のアプローチであるSymNoiseは、対称雑音埋め込みを用いて、このスコアを69.04%に向上させた。
これは最先端の手法であるNEFTune (64.69%)よりも6.7%改善されている。
さらに、さまざまなモデルや、Evol-Instruct、ShareGPT、OpenPlatypusといったより強力なベースライン命令データセットでテストする場合、SymNoiseはNEFTuneを一貫して上回る。
NEFTuneを含む現在の文献は、言語モデルの微調整におけるノイズベースの戦略の適用について、より詳細な研究の重要性を強調している。
われわれのアプローチであるSymNoiseは、この方向に向けた重要なステップであり、既存の最先端手法に対する顕著な改善を示している。
関連論文リスト
- NoiseRater: Meta-Learned Noise Valuation for Diffusion Model Training [81.58321000203712]
NoiseRaterは、拡散モデルトレーニングにおけるインスタンスレベルのノイズ評価のためのメタラーニングフレームワークである。
NoiseRaterは、重要度スコアをデータとタイムステップで条件付けられた個々のノイズ実現に割り当てる。
FFHQとImageNetの実験では、すべてのノイズサンプルが等しく寄与するわけではない。
論文 参考訳(メタデータ) (2026-05-02T19:43:16Z) - Enhance Vision-Language Alignment with Noise [59.2608298578913]
本研究では,凍結モデルがカスタマイズノイズによって微調整可能であるか検討する。
ビジュアルエンコーダとテキストエンコーダの両方にノイズを注入することでCLIPを微調整できる正インセンティブノイズ(PiNI)を提案する。
論文 参考訳(メタデータ) (2024-12-14T12:58:15Z) - High Noise Scheduling is a Must [7.694256285730863]
一貫性モデルは、画像生成の能力が高く、高度な技術を通じてサンプリングステップを1ステップに進める。
現在の進歩は、一貫性トレーニングのテクニックを一歩前進させ、トレーニングの制限を取り除く。
本研究では, 騒音分布における高騒音レベルと低騒音レベルのバランスについて検討し, 安定性を維持するための騒音分布を提供した。
論文 参考訳(メタデータ) (2024-04-09T14:44:12Z) - SymNoise: Advancing Language Model Fine-tuning with Symmetric Noise [1.8399030634592846]
埋め込みプロセスに対称雑音を組み込む言語モデルのための新しい微調整手法を提案する。
本手法は,局所曲率をより厳密に制御し,現行手法NEFTuneよりも優れた性能を示すことにより,モデルの機能を向上することを目的としている。
論文 参考訳(メタデータ) (2023-12-03T22:44:58Z) - NEFTune: Noisy Embeddings Improve Instruction Finetuning [113.34098028348946]
NEFTuneは、トレーニング中に埋め込みベクターにノイズを追加する。
Evol-Instructでトレーニングされたモデルは10%改善され、ShareGPTは8%改善され、OpenPlatypusは8%改善された。
論文 参考訳(メタデータ) (2023-10-09T17:58:34Z) - Latent Class-Conditional Noise Model [54.56899309997246]
本稿では,ベイズ的枠組みの下での雑音遷移をパラメータ化するためのLatent Class-Conditional Noise Model (LCCN)を提案する。
次に、Gibs sampler を用いて遅延真のラベルを効率的に推測できる LCCN の動的ラベル回帰法を導出する。
提案手法は,サンプルのミニバッチから事前の任意チューニングを回避するため,ノイズ遷移の安定な更新を保護している。
論文 参考訳(メタデータ) (2023-02-19T15:24:37Z) - Noise Stability Regularization for Improving BERT Fine-tuning [94.80511419444723]
BERTのような微調整済みの言語モデルは、様々なNLPタスクにまたがるリーダーボードを支配する一般的なプラクティスとなっている。
レイヤワイドノイズ安定正規化(LNSR)と呼ばれる,NLPタスクの微調整を改善するための,新しい効果的な正規化手法を提案する。
良好な性能を示すモデルが雑音に対する感度が低く、LNSRによる微調整は明らかに高い一般化性と安定性を示すことを実験的に確認した。
論文 参考訳(メタデータ) (2021-07-10T13:19:04Z) - Analysing the Noise Model Error for Realistic Noisy Label Data [14.766574408868806]
本研究では,ノイズモデルの予測誤差を導出して,理論的な側面から推定ノイズモデルの品質について検討する。
NLPドメインから新たなノイズラベルデータセットであるNoisyNERも公開しています。
論文 参考訳(メタデータ) (2021-01-24T17:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。