論文の概要: Constrained Paraphrase Consistency for LLM Hallucination Detection
- arxiv url: http://arxiv.org/abs/2606.08158v1
- Date: Sat, 06 Jun 2026 13:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:05.88429
- Title: Constrained Paraphrase Consistency for LLM Hallucination Detection
- Title(参考訳): LLM幻覚検出のための制約付きパラフレーズ整合性
- Authors: Shanshan Lin, Dongsheng Hong, Sibo Ju, Chao Chen, Xi Zhang, Xiangwen Liao,
- Abstract要約: 大規模言語モデル(LLM)は、正確でスケーラブルな幻覚検出装置を動機付け、現実的に矛盾するクレームを生成することができる。
制約付き最適化問題としてトレーニングを定式化するCCHD(Consistency-Constrained Hallucination Detector)を提案する。
- 参考スコア(独自算出の注目度): 11.075787335043238
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) can generate factually inconsistent claims, motivating accurate and scalable hallucination detectors. Prior work largely enlarges training sets via synthesis or new annotations, introducing increasing cost and potential bias while underusing the consistency implied by semantically equivalent paraphrases. We propose Consistency-Constrained Hallucination Detector (CCHD), which formulates training as a constrained optimization problem. The standard cross-entropy on original document-claim pairs is complemented by (i) paraphrase-consistency constraints bounding divergence across paraphrased views, and (ii) label-preservation constraints tying paraphrases to ground truth. We solve the problem by gradient descent-ascent over model parameters and per-view Lagrange multipliers, adding only a few scalar dual variables and no inference-time overhead. With DeBERTa and Flan-T5 backbones, CCHD consistently outperforms strong baselines (FactCG, MiniCheck, and AlignScore) on standard factuality benchmarks, demonstrating its superiority on hallucination detection.
- Abstract(参考訳): 大規模言語モデル(LLM)は、正確でスケーラブルな幻覚検出装置を動機付け、現実的に矛盾するクレームを生成することができる。
それまでの作業は、合成や新しいアノテーションを通じてトレーニングセットを大きくし、コストと潜在的なバイアスを増大させ、セマンティックに等価なパラフレーズによって示唆される一貫性を弱めている。
制約付き最適化問題としてトレーニングを定式化するCCHD(Consistency-Constrained Hallucination Detector)を提案する。
文書定義ペアの標準的なクロスエントロピーは補足される
一 言い換えられた見解の相違を拘束する言い換え-一貫性の制約
(二)真理を根拠とする言い換えを結び付けるラベル保存の制約。
モデルパラメータとビュー毎のラグランジュ乗算器の勾配勾配勾配による問題を解き、スカラーな双対変数をわずかに加え、推論時間オーバーヘッドを伴わない。
DeBERTaとFlan-T5のバックボーンでは、CCHDは標準の事実性ベンチマークにおいて強いベースライン(FactCG、MiniCheck、AlignScore)を一貫して上回り、幻覚検出の優位性を示している。
関連論文リスト
- Chain-based Adaptive Reconfiguration Over Lattices for Hallucination Reduction [0.0]
CAROLは、大規模言語モデルにおけるテスト時幻覚の低減のための確率的フレームワークである。
CAROLは、生成された応答と信頼できるコンテキストの間の一貫性に基づいた意味的不確実性尺度を定義する。
CAROLは単一のフレームワーク内で幻覚の検出と緩和を統一する。
論文 参考訳(メタデータ) (2026-05-26T21:28:51Z) - A Multimodal Dataset for Visually Grounded Ambiguity in Machine Translation [53.06004926782424]
VIDA(Visually-Dependent Ambiguity)は2500の慎重にキュレートされたインスタンスのデータセットで、注釈付きソーススパンの解決には視覚的証拠が必要である。
また,LLM-as-a-judge分類器を用いて,アノテートされた曖昧な表現がスパンレベルで正しく解決されているかどうかを検証する。
論文 参考訳(メタデータ) (2026-05-03T19:55:06Z) - HTDC: Hesitation-Triggered Differential Calibration for Mitigating Hallucination in Large Vision-Language Models [0.7252027234425333]
Hesitation-Triggered Differential Inference (HTDC)は、標準のフルブランチ推論を保存するトレーニング不要のデコードフレームワークである。
Hesitation-Triggered Differential Inference は、強いタスク精度を維持しながら、常に幻覚を減少させる。
論文 参考訳(メタデータ) (2026-04-13T22:47:27Z) - Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination [60.197429875410286]
大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
論文 参考訳(メタデータ) (2026-03-20T02:07:10Z) - Seeing Through the Chain: Mitigate Hallucination in Multimodal Reasoning Models via CoT Compression and Contrastive Preference Optimization [78.94590726578014]
マルチモーダル推論モデル (Multimodal reasoning model, MLRM) は幻覚の傾向が強く, 効果的な解はいまだ未発見のままである。
textbfCompression と textbfPreference textbfOptimization を組み合わせたトレーニングベースの緩和フレームワーク C3PO を提案する。
論文 参考訳(メタデータ) (2026-02-03T11:00:55Z) - HADSF: Aspect Aware Semantic Control for Explainable Recommendation [4.75127493865044]
大規模言語モデル(LLM)の最近の進歩は、推薦システムに対してより効果的な情報抽出を約束している。
本稿では,適応選択によるコンパクトなコーパスレベルのアスペクトボキャブラリを誘導し,構造化アスペクトオピニオン三重項のボキャブラリ誘導,明示的に制約された抽出を行う2段階アプローチを提案する。
1.5B-70Bパラメータにまたがる約300万のレビューに関する実験では、標準評価予測器に統合された場合、HADSFは予測エラーを一貫して減少させる。
論文 参考訳(メタデータ) (2025-10-30T20:49:33Z) - Mitigating Multimodal Hallucinations via Gradient-based Self-Reflection [49.26064449816502]
本研究では,テキスト・視覚バイアスと共起バイアスに対処するために,グラディエントベースのインフルエンス・アウェア制約付きデコーディング(GACD)手法を提案する。
GACDは幻覚を効果的に低減し、MLLM出力の視覚的接地を改善する。
論文 参考訳(メタデータ) (2025-09-03T08:13:52Z) - Verify when Uncertain: Beyond Self-Consistency in Black Box Hallucination Detection [25.176984317213858]
大型言語モデル(LLM)は幻覚に悩まされ、センシティブなアプリケーションにおける信頼性を損なう。
本稿では,検証モデルを一部のケースに対してのみ呼び出す,予算に優しい2段階検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-20T21:06:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。