論文の概要: Hallucination Detection-Guided Preference Optimization for Clinical Summarization
- arxiv url: http://arxiv.org/abs/2605.28910v2
- Date: Mon, 01 Jun 2026 13:38:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 18:24:16.640603
- Title: Hallucination Detection-Guided Preference Optimization for Clinical Summarization
- Title(参考訳): 幻覚検出ガイドを用いた臨床要約のための選好最適化
- Authors: Shamanth Kuthpadi Seethakantha, Dung Ngoc Thai, Vara Prasad Gudi, Simran Tiwari, Rami Matar, Avijit Mitra, Wenlong Zhao, Andrew McCallum, Wael Salloum,
- Abstract要約: 大規模言語モデル(LLM)は要約タスクを約束するが、幻覚を生成することが多い。
幻覚検出器を用いて反復的なリビジョンを導出する推論時間法であるitermodelfull(itermodel)を導入する。
そこで本研究では,検出器誘導精製軌道をモデルファインタニングのための選好ペアに変換する優先学習(Preference Learning, モデル)のイテラーモデルを提案する。
- 参考スコア(独自算出の注目度): 16.75280184390529
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models (LLMs) have shown promise on summarization tasks, but they often produce hallucinations, which are unsupported or incorrect statements that limit their reliability in specialized healthcare applications. We introduce \itermodelfull (\itermodel), an inference-time method that leverages hallucination detectors to guide iterative summary revisions toward factual corrections. Building on this, we propose \itermodel for Preference Learning (\model), which converts detector-guided refinement trajectories into preference pairs for model finetuning. Extensive experiments show that our methods substantially reduce hallucinations for Llama and Gemma models in summarizing real-world clinical notes from \MimicIV. For example, \itermodel reduces 24\% and \model reduces 48\% hallucinations in Llama-3.1-8B-Instruct. Importantly, both methods preserve summary fluency, coherence, and relevance according to human expert and LLM-Jury evaluations. Together, these results demonstrate that detection-informed refinement and preference learning offer an automated solution for improving factual faithfulness in clinical summarization.
- Abstract(参考訳): 大規模言語モデル(LLM)は要約タスクを約束しているが、しばしば幻覚を生じさせる。
本稿では,幻覚検出器を利用した実写修正に向けて反復的なリビジョンを導出する推論時間法である \itermodelfull (\itermodel) を紹介する。
そこで本研究では,検出器誘導精製軌道をモデル微調整のための選好ペアに変換するPreference Learning (\model) のための‘itermodel for Preference Learning’を提案する。
広汎な実験により,本手法は実際の臨床メモを<MimicIV>から要約する上で,LlamaモデルとGemmaモデルに対する幻覚を著しく低減することが示された。
例えば、 \itermodel は 24\% を減少させ、 \model は Llama-3.1-8B-Instruct において 48\% の幻覚を減少させる。
重要な点として、これらの手法は、人間の専門家およびLLM-Juryの評価に基づいて、要約流布、コヒーレンス、および関連性を保存している。
これらの結果から,検出インフォームド・リファインメントと選好学習は,臨床要約における事実忠実性を改善するための自動解法であることが示された。
関連論文リスト
- A novel hallucination classification framework [0.0]
本研究では,大規模言語モデル(LLM)における幻覚の自動検出手法を提案する。
提案手法は,素早い工学的手法による系統分類と多様な幻覚の再現制御に基づく。
論文 参考訳(メタデータ) (2025-10-06T09:54:20Z) - Mitigating Hallucinations in Large Vision-Language Models by Self-Injecting Hallucinations [73.37711261605271]
幻覚緩和法は主に嗜好アライメントに基づいており、嗜好データ収集には外部の人間のアノテーションや補助モデルが必要である。
本稿では,外部依存を伴わない幻覚を緩和する新規で一般化可能な手法である自己注入による自律的選好アライメント(APASI)を提案する。
APASIはターゲットのLVLMを利用して、生成した応答に幻覚を自己注入し、好みのレベルが異なるペアの応答を生成する。
論文 参考訳(メタデータ) (2025-09-14T14:26:53Z) - Mitigating Image Captioning Hallucinations in Vision-Language Models [13.707454974844095]
視覚言語モデルの幻覚は、信頼性と現実の応用性を妨げている。
本稿では,推論中の幻覚を緩和するための強化学習を用いた新しいテスト時間適応フレームワークを提案する。
本手法は, 幻覚緩和効果が68.3%向上し, 最先端のベースラインを上回った。
論文 参考訳(メタデータ) (2025-05-06T10:55:21Z) - Generate, but Verify: Reducing Hallucination in Vision-Language Models with Retrospective Resampling [78.78822033285938]
VLM(Vision-Language Models)は視覚的理解に優れ、視覚幻覚に悩まされることが多い。
本研究では,幻覚を意識したトレーニングとオンザフライの自己検証を統合した統合フレームワークREVERSEを紹介する。
論文 参考訳(メタデータ) (2025-04-17T17:59:22Z) - HuDEx: Integrating Hallucination Detection and Explainability for Enhancing the Reliability of LLM responses [0.12499537119440242]
本稿では,HuDExと命名された幻覚検出モデルについて説明する。
提案モデルでは,検出を説明と統合する新たなアプローチを提供し,ユーザとLLM自体がエラーを理解し,低減することができる。
論文 参考訳(メタデータ) (2025-02-12T04:17:02Z) - Iter-AHMCL: Alleviate Hallucination for Large Language Model via Iterative Model-level Contrastive Learning [16.883679810267342]
幻覚に対処するための反復モデルレベルのコントラスト学習(Iter-AHMCL)
本稿では,幻覚に対処するイテレーティブモデルレベルのコントラスト学習(Iter-AHMCL)を提案する。
論文 参考訳(メタデータ) (2024-10-16T00:15:40Z) - Alleviating Hallucinations of Large Language Models through Induced
Hallucinations [67.35512483340837]
大規模言語モデル(LLM)は、不正確な情報や製造された情報を含む応答を生成するために観察されている。
幻覚を緩和するための単純なtextitInduce-then-Contrast Decoding (ICD) 戦略を提案する。
論文 参考訳(メタデータ) (2023-12-25T12:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。