論文の概要: Towards Generation-Efficient Uncertainty Estimation in Large Language Models
- arxiv url: http://arxiv.org/abs/2605.06053v1
- Date: Thu, 07 May 2026 11:39:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.730764
- Title: Towards Generation-Efficient Uncertainty Estimation in Large Language Models
- Title(参考訳): 大規模言語モデルにおける生成効率の良い不確かさ推定に向けて
- Authors: Mingcheng Zhu, Yu Liu, Tingting Zhu,
- Abstract要約: 医療やファイナンスといった高度なアプリケーションにLLMをデプロイする上で,不確実性評価が重要である。
既存の手法では、不確実性を推定するために1つ以上の完全な自己回帰世代が必要である。
部分生成や入力のみの情報を用いて有効不確実性を推定できるかどうかを検討する。
- 参考スコア(独自算出の注目度): 6.111244917760012
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Uncertainty estimation is important for deploying LLMs in high-stakes applications such as healthcare and finance, where hallucinations can appear fluent and plausible while being factually incorrect, making it difficult for users to judge whether an output should be trusted. Existing methods require one or more full autoregressive generations to estimate uncertainty, which introduces substantial inference cost and often delays uncertainty assessment. In this paper, we investigate whether effective uncertainty estimation can be achieved with partial generation or even input-only information. Specifically, we first develop a unified framework that formulates uncertainty estimation as an early estimation problem over the autoregressive generation process of LLMs. This framework organises existing and proposed estimators by the information they observe, ranging from multi-generation to input-only prediction, and clarifies the performance-cost trade-off underlying different uncertainty estimation methods. Building on this view, we study two largely underexplored low-cost settings: estimating uncertainty with part of the generation, and predicting uncertainty from the input prompt. We propose Logit Magnitude, which uses top-M logit evidence to estimate uncertainty from an early-stopped generation prefix, and MetaUE, which distils generation-based uncertainty into a lightweight input-only estimator trained with uncertainty scores. Extensive experiments on general and domain-specific benchmarks show that Logit Magnitude achieves strong performance, and partial generations of LLMs are often sufficient for effective uncertainty estimation. MetaUE further provides a competitive input-only approximation in several settings. These findings suggest that effective uncertainty estimation requires less generation than commonly assumed, enabling unreliable responses to be identified earlier.
- Abstract(参考訳): 不確実性の推定は、医療や金融などの高度なアプリケーションにLCMを配置する上で重要である。
既存の手法では、不確実性を推定するために1つ以上の完全な自己回帰世代が必要であり、これはかなりの推論コストをもたらし、しばしば不確実性評価を遅らせる。
本稿では,部分生成や入出力のみの情報による有効不確実性推定が可能であるかを検討する。
具体的には,LLMの自己回帰生成過程における初期推定問題として不確実性推定を定式化する統一フレームワークを開発する。
このフレームワークは,複数世代から入力のみの予測まで,観測した情報に基づいて既存の推定器と提案した推定器を編成し,異なる不確実性推定手法に基づく性能・コストトレードオフを明らかにする。
この観点から、我々は、主に過小評価されている2つの低コスト設定について、世代の一部を不確実性として推定し、入力プロンプトから不確実性を予測する。
本稿では,最上位のロジットエビデンスを用いて早期に停止した生成プレフィックスから不確実性を推定するLogit Magnitudeと,不確実性スコアをトレーニングした軽量入力専用推定器に生成ベースの不確実性を悪用するMetaUEを提案する。
一般およびドメイン固有のベンチマークに関する大規模な実験により、ロジトマグニチュードは高い性能を達成し、LLMの部分世代は効果的な不確実性推定に十分であることが示された。
MetaUEはさらに、いくつかの設定で競合する入力のみの近似を提供する。
これらの結果から, 有効不確実性推定は一般的に想定されるよりも少ない生成を必要としており, 信頼できない応答を早期に特定できることが示唆された。
関連論文リスト
- Towards Reliable LLM-based Robot Planning via Combined Uncertainty Estimation [68.106428321492]
大規模言語モデル (LLM) は高度な推論能力を示し、ロボットが自然言語の命令を理解し、適切な接地で高レベルな計画を生成することができる。
LLMの幻覚は重大な課題であり、しばしば過度に信頼され、不一致または安全でない計画に繋がる。
本研究は, 信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性・信頼性評価を別々に評価するものである。
論文 参考訳(メタデータ) (2025-10-09T10:26:58Z) - Addressing Pitfalls in the Evaluation of Uncertainty Estimation Methods for Natural Language Generation [20.726685669562496]
幻覚は、大きな言語モデル(LLM)の信頼性を損なう一般的な問題である。
近年の研究では、LLMの予測的不確実性によって生じる幻覚のサブセット、すなわち confabulations が特定されている。
衝突を検出するため,自然言語生成における予測不確かさを推定する様々な手法が開発されている。
論文 参考訳(メタデータ) (2025-10-02T17:54:09Z) - TokUR: Token-Level Uncertainty Estimation for Large Language Model Reasoning [27.449948943467163]
token-level Uncertainty Estimation framework for Reasoning (TokUR)を提案する。
TokURは、大規模言語モデルにおいて、数学的推論における応答を自己評価し、自己改善することを可能にする。
様々な難易度を持つ数学的推論データセットの実験により、TokURは答えの正しさとモデルロバストネスと強い相関を示すことが示された。
論文 参考訳(メタデータ) (2025-05-16T22:47:32Z) - Estimating LLM Uncertainty with Evidence [66.51144261657983]
本稿では,大規模言語モデルにおける非結合トークンの不確実性を推定するためのフレームワークとして,ロジッツ誘発トークン不確実性(LogTokU)を提案する。
我々は,LogTokUの実装にエビデンスモデリングを採用し,その不確実性を推定して下流タスクを導出する。
論文 参考訳(メタデータ) (2025-02-01T03:18:02Z) - Decomposing Uncertainty for Large Language Models through Input Clarification Ensembling [69.83976050879318]
大規模言語モデル(LLM)では、不確実性の原因を特定することが、信頼性、信頼性、解釈可能性を改善するための重要なステップである。
本稿では,LLMのための不確実性分解フレームワークについて述べる。
提案手法は,入力に対する一連の明確化を生成し,それらをLLMに入力し,対応する予測をアンサンブルする。
論文 参考訳(メタデータ) (2023-11-15T05:58:35Z) - Adaptive Uncertainty Estimation via High-Dimensional Testing on Latent
Representations [28.875819909902244]
不確実性推定は、訓練されたディープニューラルネットワークの信頼性を評価することを目的としている。
既存の不確実性推定アプローチは、低次元分布仮定に依存している。
本研究では,不確実性推定のためのデータ適応型高次元仮説テストを用いた新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-25T12:22:18Z) - Toward Reliable Human Pose Forecasting with Uncertainty [51.628234388046195]
我々は、複数のモデルを含む人間のポーズ予測のためのオープンソースのライブラリを開発し、複数のデータセットをサポートする。
我々は、パフォーマンスを高め、より良い信頼をもたらすために、問題の2つの不確実性を考案する。
論文 参考訳(メタデータ) (2023-04-13T17:56:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。