Fugu-MT 論文翻訳(概要): What do Language Model Probabilities Represent? From Distribution Estimation to Response Prediction

論文の概要: What do Language Model Probabilities Represent? From Distribution Estimation to Response Prediction

arxiv url: http://arxiv.org/abs/2505.02072v1
Date: Sun, 04 May 2025 11:46:48 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-06 18:49:35.411504
Title: What do Language Model Probabilities Represent? From Distribution Estimation to Response Prediction
Title（参考訳）: 言語モデル確率の表現法 : 分布推定から応答予測へ
Authors: Eitan Wagner, Omri Abend,
Abstract要約: 異なる設定が3つの異なる意図された出力分布につながると我々は主張する。 NLP研究はこれらの分布がよく似ていると仮定し、実験結果の誤解釈につながることを実証する。
参考スコア（独自算出の注目度）: 16.63148156570219
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The notion of language modeling has gradually shifted in recent years from a distribution over finite-length strings to general-purpose prediction models for textual inputs and outputs, following appropriate alignment phases. This paper analyzes the distinction between distribution estimation and response prediction in the context of LLMs, and their often conflicting goals. We examine the training phases of LLMs, which include pretraining, in-context learning, and preference tuning, and also the common use cases for their output probabilities, which include completion probabilities and explicit probabilities as output. We argue that the different settings lead to three distinct intended output distributions. We demonstrate that NLP works often assume that these distributions should be similar, which leads to misinterpretations of their experimental findings. Our work sets firmer formal foundations for the interpretation of LLMs, which will inform ongoing work on the interpretation and use of LLMs' induced distributions.
Abstract（参考訳）: 言語モデリングの概念は、有限長文字列上の分布から、適切なアライメントフェーズに従ってテキスト入力と出力の汎用予測モデルへと、近年徐々に移行してきた。本稿では,LLMの文脈における分布推定と応答予測の区別とその相反する目標について分析する。本研究は, 事前学習, 文脈内学習, 嗜好調整を含むLCMの学習段階と, 出力確率の一般的な利用形態について検討する。異なる設定は、3つの異なる意図された出力分布につながると我々は主張する。 NLP研究はこれらの分布がよく似ていると仮定し、実験結果の誤解釈につながることを実証する。本研究は, LLMの解釈に関する公式な基礎を定め, LLMの誘導分布の解釈と利用について現在進行中の成果を報告する。

関連論文リスト

Mitigating Spurious Correlations in LLMs via Causality-Aware Post-Training [57.03005244917803]
大規模言語モデル (LLMs) は、事前学習中に得られた素早い相関関係により、アウト・オブ・ディストリビューション (OOD) のサンプルで失敗することが多い。ここでは、因果認識後学習(CAPT)を通して、このような素因的相関を緩和することを目的とする。公式因果推論ベンチマークCLadderと論理推論データセットPrOntoQAの実験により、CAPTで微調整された3Bスケールの言語モデルでは、従来のSFTおよびより大きなLLMを分散処理(ID)およびOODタスクで上回る結果が得られた。
論文参考訳（メタデータ） (2025-06-11T06:30:28Z)
Statistical Hypothesis Testing for Auditing Robustness in Language Models [49.1574468325115]
本稿では,摂動解析を頻繁な仮説テスト問題として再検討するフレームワークである分布に基づく摂動解析を紹介する。モンテカルロサンプリングを用いて低次元意味的類似性空間内に経験的ヌルおよび代替出力分布を構築する。反応変化の定量化、正/偽の正率の測定、参照モデルとの整合性の評価について述べる。
論文参考訳（メタデータ） (2025-06-09T17:11:07Z)
LLM Generated Distribution-Based Prediction of US Electoral Results, Part I [0.0]
本稿では,Large Language Models (LLM) を予測ツールとして利用するための新しいアプローチである分布ベース予測を紹介する。我々は、近年のアメリカ合衆国大統領選挙の文脈において、分布に基づく予測の使用を実演する。
論文参考訳（メタデータ） (2024-11-05T20:10:25Z)
Evaluating the Correctness of Inference Patterns Used by LLMs for Judgment [53.17596274334017]
我々は,LLMの詳細な推論パターンの正確さを,その正しい出力の裏側で評価した。実験により、言語生成結果が正しそうであっても、LLMが法的な判断に用いた推論パターンのかなりの部分は、誤解を招く論理や無関係な論理を表す可能性があることが示された。
論文参考訳（メタデータ） (2024-10-06T08:33:39Z)
What Are the Odds? Language Models Are Capable of Probabilistic Reasoning [23.487484744911995]
本稿では,言語モデル(LM)の確率論的推論能力を,理想化および実世界の統計分布を用いて評価することに集中する。本研究では,パーセンタイルの推定,サンプルの描画,確率の計算という3つのタスクにおいて,最先端のLMの体系的評価を行う。
論文参考訳（メタデータ） (2024-06-18T17:51:24Z)
Cycles of Thought: Measuring LLM Confidence through Stable Explanations [53.15438489398938]
大規模言語モデル(LLM)は、様々なベンチマークで人間レベルの精度に到達し、さらに超えることができるが、不正確な応答における過度な自信は、依然として十分に文書化された障害モードである。本稿では,LLMの不確実性を測定するためのフレームワークを提案する。
論文参考訳（メタデータ） (2024-06-05T16:35:30Z)
Ensemble Learning for Heterogeneous Large Language Models with Deep Parallel Collaboration [39.35476224845088]
大規模言語モデル(LLM)は様々なタスクにおいて補完的な強みを示し、LLMアンサンブルの研究を動機付けている。本稿では,各復号ステップで異なるLLMから得られる情報的確率分布を融合した学習自由アンサンブルフレームワークDeePEnを提案する。
論文参考訳（メタデータ） (2024-04-19T08:52:22Z)
Do LLMs Play Dice? Exploring Probability Distribution Sampling in Large Language Models for Behavioral Simulation [73.58618024960968]
人間のシーケンシャルな意思決定過程をエミュレートするエージェントとして、大きな言語モデル(LLM)を採用する研究が増えている。このことは、確率分布を理解するためにLLMエージェントの容量に関する好奇心を喚起する。分析の結果, LLM エージェントは確率を理解できるが, 確率サンプリングに苦慮していることがわかった。
論文参考訳（メタデータ） (2024-04-13T16:59:28Z)
Learning to Generate Explainable Stock Predictions using Self-Reflective Large Language Models [54.21695754082441]
説明可能なストック予測を生成するために,LLM(Large Language Models)を教えるフレームワークを提案する。反射剤は自己推論によって過去の株価の動きを説明する方法を学ぶ一方、PPOトレーナーは最も可能性の高い説明を生成するためにモデルを訓練する。我々のフレームワークは従来のディープラーニング法とLLM法の両方を予測精度とマシューズ相関係数で上回ることができる。
論文参考訳（メタデータ） (2024-02-06T03:18:58Z)
Conformal Language Modeling [61.94417935386489]
生成言語モデル(LM)の共形予測のための新しい手法を提案する。標準共形予測は厳密で統計的に保証された予測セットを生成する。我々は,オープンドメイン質問応答,テキスト要約,ラジオロジーレポート生成において,複数のタスクに対するアプローチの約束を実証する。
論文参考訳（メタデータ） (2023-06-16T21:55:08Z)
ThinkSum: Probabilistic reasoning over sets using large language models [18.123895485602244]
本稿では,2段階の確率的推論パラダイムであるThinkSumを提案する。我々は,LLM評価タスクのBIGベンチスイートにおけるThinkSumの可能性とメリットを実証する。
論文参考訳（メタデータ） (2022-10-04T00:34:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。