Fugu-MT 論文翻訳(概要): LoGU: Long-form Generation with Uncertainty Expressions

論文の概要: LoGU: Long-form Generation with Uncertainty Expressions

arxiv url: http://arxiv.org/abs/2410.14309v1
Date: Fri, 18 Oct 2024 09:15:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:37.406486
Title: LoGU: Long-form Generation with Uncertainty Expressions
Title（参考訳）: LoGU:不確かさ表現による長文生成
Authors: Ruihan Yang, Caiqi Zhang, Zhisong Zhang, Xinting Huang, Sen Yang, Nigel Collier, Dong Yu, Deqing Yang,
Abstract要約: 不確実性を伴う長文生成(LoGU)の課題について紹介する。不確実性抑制と不確実性誤認の2つの主要な課題を特定します。当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。
参考スコア（独自算出の注目度）: 49.76417603761989
License: http://creativecommons.org/licenses/by/4.0/
Abstract: While Large Language Models (LLMs) demonstrate impressive capabilities, they still struggle with generating factually incorrect content (i.e., hallucinations). A promising approach to mitigate this issue is enabling models to express uncertainty when unsure. Previous research on uncertainty modeling has primarily focused on short-form QA, but realworld applications often require much longer responses. In this work, we introduce the task of Long-form Generation with Uncertainty(LoGU). We identify two key challenges: Uncertainty Suppression, where models hesitate to express uncertainty, and Uncertainty Misalignment, where models convey uncertainty inaccurately. To tackle these challenges, we propose a refinement-based data collection framework and a two-stage training pipeline. Our framework adopts a divide-and-conquer strategy, refining uncertainty based on atomic claims. The collected data are then used in training through supervised fine-tuning (SFT) and direct preference optimization (DPO) to enhance uncertainty expression. Extensive experiments on three long-form instruction following datasets show that our method significantly improves accuracy, reduces hallucinations, and maintains the comprehensiveness of responses.
Abstract（参考訳）: LLM(Large Language Models)は印象的な能力を示すが、実際には誤ったコンテンツ(幻覚)を生成することに苦戦している。この問題を緩和するための有望なアプローチは、モデルが不確実性を示すことを可能にすることである。不確実性モデリングに関するこれまでの研究は、主に短期的なQAに焦点を当ててきたが、現実のアプリケーションはより長い応答を必要とすることが多い。本稿では,不確実性を伴うLong-form Generation(LoGU)の課題を紹介する。モデルが不確実性を表現しようとする不確実性抑圧と、不確実性を不正確な方法で伝達する不確実性誤認の2つの主要な課題を特定します。これらの課題に対処するため,改良型データ収集フレームワークと2段階トレーニングパイプラインを提案する。当社のフレームワークでは,原子的クレームに基づく不確実性を改善するため,分割・分散戦略を採用している。収集したデータは、教師付き微調整(SFT)と直接選好最適化(DPO)を通じてトレーニングに使用される。提案手法が精度を向上し,幻覚を低減し,応答の包括性を維持できることを示す。

関連論文リスト

Advancing Reliable Test-Time Adaptation of Vision-Language Models under Visual Variations [67.35596444651037]
視覚言語モデル(VLM)は、素晴らしいゼロショット機能を示すが、ラベル付きデータが利用できない場合、下流タスクの分散シフトに苦慮する。本稿では,信頼性を両面から高めるReliable Test-Time Adaptation (ReTA)法を提案する。
論文参考訳（メタデータ） (2025-07-13T05:37:33Z)
Seeing is Believing? Mitigating OCR Hallucinations in Multimodal Large Language Models [22.43132625619281]
劣化文書理解におけるOCR幻覚評価のための最初のベンチマークであるKIE-HVQAを提案する。このデータセットには、IDカードと請求書にまたがるテストサンプルが含まれており、OCR信頼性のための実世界の劣化をシミュレートしている。 Qwen2.5-VL 実験により,GPT-4o に対して 7B-パラメータモデルでは幻覚のない精度が 22% 向上していることが示された。
論文参考訳（メタデータ） (2025-06-25T06:44:07Z)
UNCLE: Uncertainty Expressions in Long-Form Generation [48.7696074873262]
大型言語モデル(LLM)は幻覚を起こす傾向があり、特に長期の世代では顕著である。長文と短文の問合せ(QA)における不確実性評価のためのベンチマークであるUNCLEを紹介する。私たちのデータセットは、ペアの質問とゴールドスタンダードの回答で、ショートとロングフォームのQAを直接ブリッジする最初のものです。
論文参考訳（メタデータ） (2025-05-22T17:16:08Z)
Are vision language models robust to uncertain inputs? [5.249651874118556]
より新しい視覚言語モデルでは、従来のモデルに比べて頑健性が向上したが、それでも厳密な指示に従う傾向にあることを示す。 ImageNetのような自然なイメージでは、パイプラインの変更なしにこの制限を克服することができる。モデルの内部不確実性を明らかにするために,キャプションの多様性に基づく新しいメカニズムを提案する。
論文参考訳（メタデータ） (2025-05-17T03:16:49Z)
Enhancing LLM Reliability via Explicit Knowledge Boundary Modeling [48.15636223774418]
大きな言語モデル(LLM)は、不一致の自己認識のためにしばしば幻覚する。既存のアプローチは、不確実性推定やクエリの拒否を通じて幻覚を緩和する。高速かつ低速な推論システムを統合するための明示的知識境界モデリングフレームワークを提案する。
論文参考訳（メタデータ） (2025-03-04T03:16:02Z)
Enhancing Trust in Large Language Models with Uncertainty-Aware Fine-Tuning [10.457661605916435]
大規模言語モデル(LLM)は、その印象的な推論と質問応答能力によって自然言語処理の分野に革命をもたらした。 LLMは時に、幻覚として知られる、信頼できるが誤った情報を生成する傾向にある。本稿では,決定論の原理に基づく不確実性を考慮した因果的言語モデリング損失関数を提案する。
論文参考訳（メタデータ） (2024-12-03T23:14:47Z)
Fine-Tuning Large Language Models to Appropriately Abstain with Semantic Entropy [31.05551799523973]
大型言語モデル (LLM) は幻覚として知られており、妥当だが不正確なテキストを生成する。この現象は、医学や法学などの重要な応用に重大なリスクをもたらし、堅牢な幻覚緩和戦略を必要とする。本稿では,外部ラベルを必要としないモデルへのイントロスペクションから導出される不確実性尺度であるセマンティックエントロピーを用いた微調整を提案する。
論文参考訳（メタデータ） (2024-10-22T17:54:03Z)
UncertaintyRAG: Span-Level Uncertainty Enhanced Long-Context Modeling for Retrieval-Augmented Generation [93.38604803625294]
IncertaintyRAG, a novel approach for long-context Retrieval-Augmented Generation (RAG)について紹介する。我々は、SNR(Signal-to-Noise Ratio)ベースのスパン不確実性を用いて、テキストチャンク間の類似性を推定する。不確かさRAGはLLaMA-2-7Bでベースラインを2.03%上回り、最先端の結果を得る。
論文参考訳（メタデータ） (2024-10-03T17:39:38Z)
Unconditional Truthfulness: Learning Conditional Dependency for Uncertainty Quantification of Large Language Models [96.43562963756975]
対象変数が条件と非条件生成信頼度のギャップである回帰モデルを訓練する。この学習条件依存モデルを用いて、前のステップの不確実性に基づいて、現在の生成ステップの不確かさを変調する。
論文参考訳（メタデータ） (2024-08-20T09:42:26Z)
Uncertainty Estimation of Large Language Models in Medical Question Answering [60.72223137560633]
大規模言語モデル(LLM)は、医療における自然言語生成の約束を示すが、事実的に誤った情報を幻覚させるリスクがある。医学的問合せデータセットのモデルサイズが異なる人気不確実性推定(UE)手法をベンチマークする。以上の結果から,本領域における現在のアプローチは,医療応用におけるUEの課題を浮き彫りにしている。
論文参考訳（メタデータ） (2024-07-11T16:51:33Z)
Error-Driven Uncertainty Aware Training [7.702016079410588]
Error-Driven Uncertainty Aware Trainingは、ニューラル分類器が不確実性を正確に推定する能力を高めることを目的としている。 EUATアプローチは、モデルのトレーニングフェーズ中に、トレーニング例が正しく予測されているか、あるいは正しく予測されているかによって、2つの損失関数を選択的に使用することによって機能する。画像認識領域における多様なニューラルモデルとデータセットを用いてEUATを評価する。
論文参考訳（メタデータ） (2024-05-02T11:48:14Z)
Spurious Feature Eraser: Stabilizing Test-Time Adaptation for Vision-Language Foundation Model [86.9619638550683]
視覚言語基礎モデルは、画像とテキストのペアデータに拡張性があるため、多数の下流タスクで顕著な成功を収めている。しかし、これらのモデルは、決定ショートカットの結果、きめ細かな画像分類などの下流タスクに適用した場合に重大な制限を呈する」。
論文参考訳（メタデータ） (2024-03-01T09:01:53Z)
Improving the Reliability of Large Language Models by Leveraging Uncertainty-Aware In-Context Learning [76.98542249776257]
大規模言語モデルはしばしば「ハロシン化」の課題に直面している本研究では,不確実性に応答してモデルが出力を拡張あるいは拒否することを可能にする,不確実性を考慮したコンテキスト内学習フレームワークを提案する。
論文参考訳（メタデータ） (2023-10-07T12:06:53Z)
Discretization-Induced Dirichlet Posterior for Robust Uncertainty Quantification on Regression [17.49026509916207]
不確実性定量化は、現実世界のアプリケーションにディープニューラルネットワーク(DNN)をデプロイするために重要である。視覚回帰タスクでは、現在のAuxUE設計は、主にアレタリック不確実性推定に採用されている。回帰タスクにおけるより堅牢な不確実性定量化のための一般化されたAuxUEスキームを提案する。
論文参考訳（メタデータ） (2023-08-17T15:54:11Z)
ALUM: Adversarial Data Uncertainty Modeling from Latent Model Uncertainty Compensation [25.67258563807856]
本稿では,モデル不確実性とデータ不確実性を扱うALUMという新しい手法を提案する。提案するALUMはモデルに依存しないため,オーバーヘッドの少ない既存のディープモデルに容易に実装できる。
論文参考訳（メタデータ） (2023-03-29T17:24:12Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。