Fugu-MT 論文翻訳(概要): Long Horizon Temperature Scaling

論文の概要: Long Horizon Temperature Scaling

arxiv url: http://arxiv.org/abs/2302.03686v2
Date: Fri, 29 Sep 2023 18:44:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-03 20:28:59.264987
Title: Long Horizon Temperature Scaling
Title（参考訳）: 長地平線温度スケーリング
Authors: Andy Shih, Dorsa Sadigh, Stefano Ermon
Abstract要約: LHTS(Long Horizon Temperature Scaling)は、温度スケールの関節分布をサンプリングするための新しい手法である。温度依存性のLHTS目標を導出し, 温度範囲のモデルを微調整することで, 制御可能な長地平線温度パラメータで生成可能な単一モデルが得られることを示す。
参考スコア（独自算出の注目度）: 90.03310732189543
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Temperature scaling is a popular technique for tuning the sharpness of a model distribution. It is used extensively for sampling likely generations and calibrating model uncertainty, and even features as a controllable parameter to many large language models in deployment. However, autoregressive models rely on myopic temperature scaling that greedily optimizes the next token. To address this, we propose Long Horizon Temperature Scaling (LHTS), a novel approach for sampling from temperature-scaled joint distributions. LHTS is compatible with all likelihood-based models, and optimizes for the long horizon likelihood of samples. We derive a temperature-dependent LHTS objective, and show that finetuning a model on a range of temperatures produces a single model capable of generation with a controllable long horizon temperature parameter. We experiment with LHTS on image diffusion models and character/language autoregressive models, demonstrating advantages over myopic temperature scaling in likelihood and sample quality, and showing improvements in accuracy on a multiple choice analogy task by $10\%$.
Abstract（参考訳）: 温度スケーリングはモデル分布のシャープネスをチューニングするための一般的な手法である。潜在的世代をサンプリングし、モデルの不確実性を校正するために広く使用され、デプロイ中の多くの大きな言語モデルに対する制御可能なパラメータとして機能する。しかし、自己回帰モデルは次のトークンを鮮やかに最適化する心筋温度のスケーリングに依存している。そこで本研究では, 温度スケールドジョイント分布からサンプリングする新しい手法であるlong horizon temperature scaling (lhts)を提案する。 LHTSは全ての可能性に基づくモデルと互換性があり、サンプルの長い地平線確率を最適化する。温度依存性のLHTS目標を導出し, 温度範囲のモデルを微調整することで, 制御可能な長地平線温度パラメータで生成可能な単一モデルが得られることを示す。画像拡散モデルとキャラクタ/言語自己回帰モデルについてLHTSを用いて実験を行い、ミオピック温度スケーリングの確率とサンプル品質に対する利点を示し、複数選択類似タスクにおける精度を10\%$で向上させた。

関連論文リスト

Understanding temperature tuning in energy-based models [5.75145367989177]
スパースデータからの学習は、モデルが体系的に高エネルギー状態の確率を過大評価する原因となることを示す。より一般的には、最適なサンプリング温度が、データサイズとシステムの根底にあるエネルギーランドスケープとの相互作用にどのように依存するかを特徴付ける。これにより,本フレームワークは,真のデータ分布の特性と学習モデルの限界を明らかにする診断ツールとして,高温後の温度調整を行う。
論文参考訳（メタデータ） (2025-12-09T22:06:30Z)
On the Role of Temperature Sampling in Test-Time Scaling [5.758728541863352]
大規模なKでは、さらなるスケーリングは利得を得られず、トレースの数に関係なく、ある種の難しい質問は未解決のままである。 Qwen3と5つの代表的な推論ベンチマークで評価された温度スケーリングは、単一温度のTSよりも7.3ポイント高い。温度スケーリングはまた、ベースモデルが強化学習(RL)でトレーニングされたモデルに匹敵するパフォーマンスに到達することを可能にする。
論文参考訳（メタデータ） (2025-10-02T23:09:56Z)
Progressive Inference-Time Annealing of Diffusion Models for Sampling from Boltzmann Densities [85.83359661628575]
拡散に基づくサンプル学習のために, PITA(Progressive Inference-Time Annealing)を提案する。 PITAはボルツマン分布のアナーリングと拡散平滑化という2つの相補的手法を組み合わせたものである。 N-体粒子系、アラニンジペプチド、トリペプチドの平衡サンプリングを可能にする。
論文参考訳（メタデータ） (2025-06-19T17:14:22Z)
Exploring the Impact of Temperature on Large Language Models:Hot or Cold? [9.70280446429164]
我々は,0から2の範囲の温度が6つの異なる能力を評価するために設計されたデータセットに与える影響を評価する。本研究は,最適温度選択の複雑さを浮き彫りにして,温度がモデル性能に与える影響を明らかにする。本稿では,これらの観測効果を利用して,所定のプロンプトの最適温度を推定するBERTに基づく温度セレクタを提案する。
論文参考訳（メタデータ） (2025-06-08T21:36:26Z)
Optimizing Temperature for Language Models with Multi-Sample Inference [47.14991144052361]
本稿では,異なる大言語モデルに対する(近傍)最適温度の自動同定という課題に対処する。モデルアーキテクチャ、データセット、タスクタイプ、モデルサイズ、予測精度の変動を考慮して、性能最適化における温度の役割を総合的に分析する。本稿では,温度自動最適化のためのエントロピーに基づく新しい計量法を提案する。
論文参考訳（メタデータ） (2025-02-07T19:35:25Z)
Decrypting the temperature field in flow boiling with latent diffusion models [1.9190568044682759]
本稿では,位相インジケータマップから温度場を生成するためにLDM(Latent Diffusion Models)を用いた革新的な手法を提案する。数値シミュレーションからBubbleMLデータセットを利用することで, LDM位相場データを対応する温度分布に変換する。結果として得られるモデルは、界面における複雑な温度場を効果的に再構成する。
論文参考訳（メタデータ） (2025-01-27T21:18:05Z)
Adaptive Decoding via Latent Preference Optimization [55.70602730588745]
モデルに付加されたレイヤであるAdaptive Decodingを導入し、推論時にサンプリング温度を動的に選択する。我々の手法は、異なる温度を必要とする様々なタスクにおいて、すべての固定デコード温度を上回ります。
論文参考訳（メタデータ） (2024-11-14T18:31:39Z)
Energy-Based Diffusion Language Models for Text Generation [126.23425882687195]
エネルギーベース拡散言語モデル(Energy-based Diffusion Language Model, EDLM)は、拡散ステップごとに全シーケンスレベルで動作するエネルギーベースモデルである。我々のフレームワークは、既存の拡散モデルよりも1.3$times$のサンプリングスピードアップを提供する。
論文参考訳（メタデータ） (2024-10-28T17:25:56Z)
Deep generative modelling of canonical ensemble with differentiable thermal properties [0.9421843976231371]
標準アンサンブルの温度の異なる変分モデルを提案する。深部生成モデルを用いて、連続した温度範囲で自由エネルギーを推定し、同時に最小化する。トレーニングプロセスはデータセットを必要とせず、任意の明示的な密度生成モデルで動作する。
論文参考訳（メタデータ） (2024-04-29T03:41:49Z)
EDT: Improving Large Language Models' Generation by Entropy-based Dynamic Temperature Sampling [31.663507929452564]
生成品質と多様性のバランスをとるために,効率的なエントロピーに基づく動的温度サンプリング法を提案する。我々の実験によると、EDTは様々なタスクで既存の戦略を著しく上回ります。
論文参考訳（メタデータ） (2024-03-21T16:41:12Z)
Temperature dependence of energy transport in the $\mathbb{Z}_3$ chiral clock model [0.0]
本研究では, 1次元$mathbbZ_3$キラルクロックモデルの非可積分状態におけるエネルギー輸送について検討した。本研究では, 比較的高温のモデルにおける輸送係数を, 空隙のない相と低温の相の両方よりも高い温度で抽出する。量子臨界スケーリングが観測される温度には到達できないが、我々のアプローチはモデルの輸送特性にアクセスすることができる。
論文参考訳（メタデータ） (2023-10-31T18:00:30Z)
Capturing Local Temperature Evolution during Additive Manufacturing through Fourier Neural Operators [0.0]
本稿では, 加法製造過程における局所的な温度変化を捉えたデータ駆動モデルを提案する。直接エネルギー沈着過程における不連続なガレルキン有限要素法に基づく数値シミュレーションで検証した。その結果、このモデルはR2$で測定された高忠実度を実現し、トレーニングプロセスに含まれていない測地に対する一般化性を維持した。
論文参考訳（メタデータ） (2023-07-04T16:17:59Z)
Bi-Noising Diffusion: Towards Conditional Diffusion Models with Generative Restoration Priors [64.24948495708337]
本研究では,事前訓練した非条件拡散モデルを用いて,予測サンプルをトレーニングデータ多様体に導入する手法を提案する。我々は,超解像,着色,乱流除去,画像劣化作業におけるアプローチの有効性を実証するための総合的な実験を行った。
論文参考訳（メタデータ） (2022-12-14T17:26:35Z)
On Distillation of Guided Diffusion Models [94.95228078141626]
そこで本研究では,分類器を含まない誘導拡散モデルから抽出し易いモデルへ抽出する手法を提案する。画素空間上で訓練された標準拡散モデルに対して,本手法は元のモデルに匹敵する画像を生成することができる。遅延空間で訓練された拡散モデル(例えば、安定拡散)に対して、我々の手法は1から4段階のデノナイジングステップで高忠実度画像を生成することができる。
論文参考訳（メタデータ） (2022-10-06T18:03:56Z)
VAE-LIME: Deep Generative Model Based Approach for Local Data-Driven Model Interpretability Applied to the Ironmaking Industry [70.10343492784465]
モデル予測だけでなく、その解釈可能性も、プロセスエンジニアに公開する必要があります。 LIMEに基づくモデルに依存しない局所的解釈可能性ソリューションが最近出現し、元の手法が改良された。本稿では, 燃焼炉で生成する高温金属の温度を推定するデータ駆動型モデルの局所的解釈可能性に関する新しいアプローチ, VAE-LIMEを提案する。
論文参考訳（メタデータ） (2020-07-15T07:07:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。