論文の概要: Estimating Text Temperature
- arxiv url: http://arxiv.org/abs/2601.02320v1
- Date: Mon, 05 Jan 2026 18:09:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:23.350812
- Title: Estimating Text Temperature
- Title(参考訳): テキスト温度の推定
- Authors: Nikolay Mikhaylovskiy,
- Abstract要約: 本研究では,人間によって書かれたテキストを含む任意のテキストの温度を推定する手法を提案する。
次に、最も優れたQwen3 14Bを用いて、一般的なコーパスの温度を推定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoregressive language models typically use temperature parameter at inference to shape the probability distribution and control the randomness of the text generated. After the text was generated, this parameter can be estimated using maximum likelihood approach. Following it, we propose a procedure to estimate the temperature of any text, including ones written by humans, with respect to a given language model. We evaluate the temperature estimation capability of a wide selection of small-to-medium LLMs. We then use the best-performing Qwen3 14B to estimate temperatures of popular corpora.
- Abstract(参考訳): 自己回帰言語モデルは通常、推測時の温度パラメータを使用して確率分布を形作り、生成されたテキストのランダム性を制御する。
テキストが生成されると、このパラメータは最大極大アプローチで推定できる。
次に,人間によって書かれたテキストを含む任意のテキストの温度を,与えられた言語モデルに対して推定する手法を提案する。
そこで本研究では,LLMの温度推定能力について検討した。
次に、最も優れたQwen3 14Bを用いて、一般的なコーパスの温度を推定する。
関連論文リスト
- Monte Carlo Temperature: a robust sampling strategy for LLM's uncertainty quantification methods [1.3892342684177872]
本研究では,温度校正の必要性を解消するロバストサンプリング戦略を提案する。
MCTは、幅広い温度でより堅牢な不確実性推定を提供する。
MCTはオラクル温度と統計的に同等であり、これはよく調整されているが計算に費用がかかるHPOプロセスの理想的な結果である。
論文 参考訳(メタデータ) (2025-02-25T17:33:20Z) - Optimizing Temperature for Language Models with Multi-Sample Inference [47.14991144052361]
本稿では,異なる大言語モデルに対する(近傍)最適温度の自動同定という課題に対処する。
モデルアーキテクチャ、データセット、タスクタイプ、モデルサイズ、予測精度の変動を考慮して、性能最適化における温度の役割を総合的に分析する。
本稿では,温度自動最適化のためのエントロピーに基づく新しい計量法を提案する。
論文 参考訳(メタデータ) (2025-02-07T19:35:25Z) - Adaptive Decoding via Latent Preference Optimization [55.70602730588745]
モデルに付加されたレイヤであるAdaptive Decodingを導入し、推論時にサンプリング温度を動的に選択する。
我々の手法は、異なる温度を必要とする様々なタスクにおいて、すべての固定デコード温度を上回ります。
論文 参考訳(メタデータ) (2024-11-14T18:31:39Z) - Calibrating Language Models with Adaptive Temperature Scaling [58.056023173579625]
本稿では,各トークンの温度スケーリングパラメータを予測するポストホックキャリブレーション法であるAdaptive Temperature Scaling (ATS)を紹介する。
ATSは、以前のキャリブレーション法と比較して、3つの下流自然言語評価ベンチマークで10-50%以上のキャリブレーションを改善する。
論文 参考訳(メタデータ) (2024-09-29T22:54:31Z) - Long Horizon Temperature Scaling [90.03310732189543]
LHTS(Long Horizon Temperature Scaling)は、温度スケールの関節分布をサンプリングするための新しい手法である。
温度依存性のLHTS目標を導出し, 温度範囲のモデルを微調整することで, 制御可能な長地平線温度パラメータで生成可能な単一モデルが得られることを示す。
論文 参考訳(メタデータ) (2023-02-07T18:59:32Z) - Fine-tune your Classifier: Finding Correlations With Temperature [2.071516130824992]
我々は、データセットを表現に計算された統計の集合として記述することで、分類タスクに対する温度の影響を分析する。
これらの抽出された統計値と観測された最適温度との相関について検討した。
論文 参考訳(メタデータ) (2022-10-18T09:48:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。