Fugu-MT 論文翻訳(概要): Optimizing Temperature for Language Models with Multi-Sample Inference

論文の概要: Optimizing Temperature for Language Models with Multi-Sample Inference

arxiv url: http://arxiv.org/abs/2502.05234v1
Date: Fri, 07 Feb 2025 19:35:25 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-11 18:57:49.141845
Title: Optimizing Temperature for Language Models with Multi-Sample Inference
Title（参考訳）: マルチサンプル推論を用いた言語モデルの最適温度推定
Authors: Weihua Du, Yiming Yang, Sean Welleck,
Abstract要約: 本稿では,異なる大言語モデルに対する(近傍)最適温度の自動同定という課題に対処する。モデルアーキテクチャ、データセット、タスクタイプ、モデルサイズ、予測精度の変動を考慮して、性能最適化における温度の役割を総合的に分析する。本稿では,温度自動最適化のためのエントロピーに基づく新しい計量法を提案する。
参考スコア（独自算出の注目度）: 47.14991144052361
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Multi-sample aggregation strategies, such as majority voting and best-of-N sampling, are widely used in contemporary large language models (LLMs) to enhance predictive accuracy across various tasks. A key challenge in this process is temperature selection, which significantly impacts model performance. Existing approaches either rely on a fixed default temperature or require labeled validation data for tuning, which are often scarce and difficult to obtain. This paper addresses the challenge of automatically identifying the (near)-optimal temperature for different LLMs using multi-sample aggregation strategies, without relying on task-specific validation data. We provide a comprehensive analysis of temperature's role in performance optimization, considering variations in model architectures, datasets, task types, model sizes, and predictive accuracy. Furthermore, we propose a novel entropy-based metric for automated temperature optimization, which consistently outperforms fixed-temperature baselines. Additionally, we incorporate a stochastic process model to enhance interpretability, offering deeper insights into the relationship between temperature and model performance.
Abstract（参考訳）: 多数決やベスト・オブ・Nサンプリングといったマルチサンプル集約戦略は、様々なタスクにおける予測精度を高めるために、現代の大規模言語モデル(LLM)で広く使われている。このプロセスにおける重要な課題は、モデルの性能に大きな影響を与える温度選択である。既存のアプローチでは、固定されたデフォルト温度に依存するか、チューニングにラベル付きバリデーションデータを必要とする。本稿では,タスク固有の検証データに頼ることなく,マルチサンプルアグリゲーション戦略を用いて,異なるLLMに対して(近傍)最適温度を自動的に識別する課題について述べる。モデルアーキテクチャ、データセット、タスクタイプ、モデルサイズ、予測精度の変動を考慮して、性能最適化における温度の役割を総合的に分析する。さらに,温度自動最適化のためのエントロピーに基づく新しい計量法を提案する。さらに,解釈可能性を高めるために確率的プロセスモデルを導入し,温度とモデル性能の関係について深い知見を提供する。

関連論文リスト

Improving Diversity in Language Models: When Temperature Fails, Change the Loss [81.73385878967899]
そこで我々は,Precision-Recallフレームワークを利用した言語モデルにおける損失関数の再考を提案する。以上の結果から,本手法は温度スケーリングと負のログライクなトレーニングを単に組み合わせることよりも,精度とリコールのトレードオフを著しく向上することが示された。
論文参考訳（メタデータ） (2025-08-13T09:37:53Z)
Exploring the Impact of Temperature on Large Language Models:Hot or Cold? [9.70280446429164]
我々は,0から2の範囲の温度が6つの異なる能力を評価するために設計されたデータセットに与える影響を評価する。本研究は,最適温度選択の複雑さを浮き彫りにして,温度がモデル性能に与える影響を明らかにする。本稿では,これらの観測効果を利用して,所定のプロンプトの最適温度を推定するBERTに基づく温度セレクタを提案する。
論文参考訳（メタデータ） (2025-06-08T21:36:26Z)
Breaking Silos: Adaptive Model Fusion Unlocks Better Time Series Forecasting [64.45587649141842]
時系列予測は多くの現実世界のアプリケーションにおいて重要な役割を果たす。 1つのモデルは、異なるテストサンプルで一貫して他よりも優れていますが、(ii) それぞれのモデルは特定のケースで優れています。異種モデルのサンプルレベル適応融合による時系列予測のためのフレームワークであるTimeFuseを紹介する。
論文参考訳（メタデータ） (2025-05-24T00:45:07Z)
Monte Carlo Temperature: a robust sampling strategy for LLM's uncertainty quantification methods [1.3892342684177872]
本研究では,温度校正の必要性を解消するロバストサンプリング戦略を提案する。 MCTは、幅広い温度でより堅牢な不確実性推定を提供する。 MCTはオラクル温度と統計的に同等であり、これはよく調整されているが計算に費用がかかるHPOプロセスの理想的な結果である。
論文参考訳（メタデータ） (2025-02-25T17:33:20Z)
Adaptive Decoding via Latent Preference Optimization [55.70602730588745]
モデルに付加されたレイヤであるAdaptive Decodingを導入し、推論時にサンプリング温度を動的に選択する。我々の手法は、異なる温度を必要とする様々なタスクにおいて、すべての固定デコード温度を上回ります。
論文参考訳（メタデータ） (2024-11-14T18:31:39Z)
Uncertainty Aware Learning for Language Model Alignment [97.36361196793929]
異なるタスクシナリオのモデルアライメントを改善するために,不確実性認識学習(UAL)を提案する。トレーニングのラベルの平滑化値を個々のサンプルの不確実性に応じて適応的に設定する。広く使われているベンチマーク実験では、我々のUALは標準教師あり微調整よりも著しく優れています。
論文参考訳（メタデータ） (2024-06-07T11:37:45Z)
EDT: Improving Large Language Models' Generation by Entropy-based Dynamic Temperature Sampling [31.663507929452564]
生成品質と多様性のバランスをとるために,効率的なエントロピーに基づく動的温度サンプリング法を提案する。我々の実験によると、EDTは様々なタスクで既存の戦略を著しく上回ります。
論文参考訳（メタデータ） (2024-03-21T16:41:12Z)
Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。 EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文参考訳（メタデータ） (2023-12-10T15:22:30Z)
Temperature Balancing, Layer-wise Weight Analysis, and Neural Network Training [58.20089993899729]
本稿では,直感的で効果的な階層学習手法であるTempBalanceを提案する。我々は、TempBalanceが通常のSGDと注意深く調整されたスペクトルノルム正規化より著しく優れていることを示す。また、TempBalanceは最先端のメトリクスやスケジューラよりも優れています。
論文参考訳（メタデータ） (2023-12-01T05:38:17Z)
Self-Supervised Dataset Distillation for Transfer Learning [77.4714995131992]
ラベルなしデータセットを、効率的な自己教師付き学習(SSL)のための小さな合成サンプル群に蒸留する新しい問題を提案する。両レベル最適化におけるSSL目標に対する合成サンプルの勾配は、データ拡張やマスキングから生じるランダム性から、テキストバイアスを受けていることを最初に証明する。転送学習を含む様々な応用における本手法の有効性を実証的に検証する。
論文参考訳（メタデータ） (2023-10-10T10:48:52Z)
Capturing Local Temperature Evolution during Additive Manufacturing through Fourier Neural Operators [0.0]
本稿では, 加法製造過程における局所的な温度変化を捉えたデータ駆動モデルを提案する。直接エネルギー沈着過程における不連続なガレルキン有限要素法に基づく数値シミュレーションで検証した。その結果、このモデルはR2$で測定された高忠実度を実現し、トレーニングプロセスに含まれていない測地に対する一般化性を維持した。
論文参考訳（メタデータ） (2023-07-04T16:17:59Z)
Not All Semantics are Created Equal: Contrastive Self-supervised Learning with Automatic Temperature Individualization [51.41175648612714]
分散ロバスト最適化(DRO)に着想を得た新しい頑健なコントラスト損失を提案する。提案アルゴリズムは,各サンプルに対して適切な$tau$を自動で学習することを示す。提案手法は, 単モーダル・バイモーダル・データセットにおいて, 従来の強いベースラインよりも優れていた。
論文参考訳（メタデータ） (2023-05-19T19:25:56Z)
Long Horizon Temperature Scaling [90.03310732189543]
LHTS(Long Horizon Temperature Scaling)は、温度スケールの関節分布をサンプリングするための新しい手法である。温度依存性のLHTS目標を導出し, 温度範囲のモデルを微調整することで, 制御可能な長地平線温度パラメータで生成可能な単一モデルが得られることを示す。
論文参考訳（メタデータ） (2023-02-07T18:59:32Z)
Fine-tune your Classifier: Finding Correlations With Temperature [2.071516130824992]
我々は、データセットを表現に計算された統計の集合として記述することで、分類タスクに対する温度の影響を分析する。これらの抽出された統計値と観測された最適温度との相関について検討した。
論文参考訳（メタデータ） (2022-10-18T09:48:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。