Fugu-MT 論文翻訳(概要): Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation

論文の概要: Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation

arxiv url: http://arxiv.org/abs/2302.09664v1
Date: Sun, 19 Feb 2023 20:10:07 GMT
ステータス: 翻訳完了
システム内更新日: 2023-02-21 17:14:19.544687
Title: Semantic Uncertainty: Linguistic Invariances for Uncertainty Estimation in Natural Language Generation
Title（参考訳）: 意味的不確かさ:自然言語生成における不確かさ推定のための言語的不変性
Authors: Lorenz Kuhn, Yarin Gal, Sebastian Farquhar
Abstract要約: 大規模言語モデルにおける不確実性を測定する手法を提案する。質問応答のようなタスクでは、ファンデーションモデルの自然言語出力をいつ信頼できるかを知ることが不可欠である。「自然言語の不確実性の測定は意味的等価性のため困難である。」
参考スコア（独自算出の注目度）: 37.37606905433334
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We introduce a method to measure uncertainty in large language models. For tasks like question answering, it is essential to know when we can trust the natural language outputs of foundation models. We show that measuring uncertainty in natural language is challenging because of `semantic equivalence' -- different sentences can mean the same thing. To overcome these challenges we introduce semantic entropy -- an entropy which incorporates linguistic invariances created by shared meanings. Our method is unsupervised, uses only a single model, and requires no modifications to `off-the-shelf' language models. In comprehensive ablation studies we show that the semantic entropy is more predictive of model accuracy on question answering data sets than comparable baselines.
Abstract（参考訳）: 大規模言語モデルにおける不確実性を測定する手法を提案する。質問応答のようなタスクでは、基礎モデルの自然言語出力をいつ信頼できるかを知ることが不可欠である。自然言語における不確実性を測定することは「意味的同値性」によって困難であることが示され、異なる文が同じ意味を持つ可能性がある。これらの課題を克服するためには、共通意味によって生成された言語的不変性を組み込んだ意味的エントロピーを導入する。我々の手法は教師なしであり、単一のモデルのみを使用し、 'off-the-shelf'言語モデルを変更する必要はない。包括的アブレーション研究において,semantic entropyは,質問応答データセットにおけるモデルの精度を,同等のベースラインよりも予測できることを示した。

関連論文リスト

A statistically consistent measure of Semantic Variability using Language Models [3.4933610074113464]
軽度の仮定の下で統計的に一貫した意味変数の尺度を示す。この測度は意味スペクトルエントロピー(semantic spectrum entropy, 意味スペクトルエントロピー)と呼ばれ、棚外の言語モデルを必要とするアルゴリズムの実装が容易である。
論文参考訳（メタデータ） (2025-02-01T17:55:58Z)
Trustworthy Alignment of Retrieval-Augmented Large Language Models via Reinforcement Learning [84.94709351266557]
検索強化に関して,言語モデルの信頼性に焦点をあてる。検索強化言語モデルには,文脈的知識とパラメトリック的知識の両方に応じて応答を供給できる本質的な能力があると考えられる。言語モデルと人間の嗜好の整合性に着想を得て,検索強化言語モデルを外部証拠にのみ依存する状況に整合させるための第一歩を踏み出した。
論文参考訳（メタデータ） (2024-10-22T09:25:21Z)
QUITE: Quantifying Uncertainty in Natural Language Text in Bayesian Reasoning Scenarios [15.193544498311603]
本稿では,カテゴリー的確率変数と複雑な関係を持つ実世界のベイズ推論シナリオのデータセットであるQUITEを提案する。我々は幅広い実験を行い、論理ベースのモデルが全ての推論型において、アウト・オブ・ボックスの大規模言語モデルより優れていることを発見した。以上の結果から,ニューロシンボリックモデルが複雑な推論を改善する上で有望な方向であることを示す。
論文参考訳（メタデータ） (2024-10-14T12:44:59Z)
Perceptions of Linguistic Uncertainty by Language Models and Humans [26.69714008538173]
言語モデルが不確実性の言語表現を数値応答にどうマッピングするかを検討する。 10モデル中7モデルで不確実性表現を確率的応答に人間的な方法でマッピングできることが判明した。この感度は、言語モデルは以前の知識に基づいてバイアスの影響を受けやすいことを示している。
論文参考訳（メタデータ） (2024-07-22T17:26:12Z)
On Subjective Uncertainty Quantification and Calibration in Natural Language Generation [2.622066970118316]
大規模言語モデルは多くの場合、不確実な定量化が困難になるような自由形式の応答を生成する。この研究はベイズ決定論の観点からこれらの課題に対処する。本稿では,モデルの主観的不確実性とそのキャリブレーションを原理的に定量化する方法について論じる。提案手法はブラックボックス言語モデルに適用できる。
論文参考訳（メタデータ） (2024-06-07T18:54:40Z)
Kernel Language Entropy: Fine-grained Uncertainty Quantification for LLMs from Semantic Similarities [79.9629927171974]
大規模言語モデル(LLM)の不確実性は、安全性と信頼性が重要であるアプリケーションには不可欠である。ホワイトボックスとブラックボックス LLM における不確実性評価手法である Kernel Language Entropy (KLE) を提案する。
論文参考訳（メタデータ） (2024-05-30T12:42:05Z)
Distributional Semantics, Holism, and the Instability of Meaning [0.0]
ホリズムの意味に対する標準的な反対は不安定さの代償である。本稿では,不安定性が意味の分布モデルに問題をもたらすかどうかを考察する。
論文参考訳（メタデータ） (2024-05-20T14:53:25Z)
How often are errors in natural language reasoning due to paraphrastic variability? [29.079188032623605]
本稿では,自然言語推論モデルのパラフラスティック一貫性を評価するための指標を提案する。我々は、この計量をパラフレーズ化に起因するモデルの正しさの分散の比率に数学的に結合する。そこで我々は,7,782人の人間による記述・検証された推論問題のデータセットであるParaNLUを収集した。
論文参考訳（メタデータ） (2024-04-17T20:11:32Z)
Transparency Helps Reveal When Language Models Learn Meaning [71.96920839263457]
合成データを用いた体系的な実験により,すべての表現が文脈に依存しない意味を持つ言語では,自己回帰型とマスキング型の両方の言語モデルが,表現間の意味的関係をエミュレートする。自然言語に目を向けると、特定の現象(参照不透明さ)による実験は、現在の言語モデルが自然言語の意味論をうまく表現していないという証拠を増大させる。
論文参考訳（メタデータ） (2022-10-14T02:35:19Z)
Provable Limitations of Acquiring Meaning from Ungrounded Form: What will Future Language Models Understand? [87.20342701232869]
未知のシステムが意味を習得する能力について検討する。アサーションによってシステムが等価性のような意味関係を保存する表現をエミュレートできるかどうか検討する。言語内のすべての表現が参照的に透明であれば,アサーションによってセマンティックエミュレーションが可能になる。しかし、言語が変数バインディングのような非透過的なパターンを使用する場合、エミュレーションは計算不能な問題になる可能性がある。
論文参考訳（メタデータ） (2021-04-22T01:00:17Z)
Unnatural Language Inference [48.45003475966808]
我々は、RoBERTaやBARTのような最先端のNLIモデルは、ランダムに並べ替えられた単語の例に不変であり、時にはよりよく機能することさえあります。我々の発見は、自然言語理解モデルと、その進捗を測定するために使われるタスクが、本当に人間のような構文理解を必要とするという考えに疑問を投げかけている。
論文参考訳（メタデータ） (2020-12-30T20:40:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。