論文の概要: Logical Consistency as a Bridge: Improving LLM Hallucination Detection via Label Constraint Modeling between Responses and Self-Judgments
- arxiv url: http://arxiv.org/abs/2605.03971v1
- Date: Tue, 05 May 2026 16:53:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:44.04802
- Title: Logical Consistency as a Bridge: Improving LLM Hallucination Detection via Label Constraint Modeling between Responses and Self-Judgments
- Title(参考訳): 橋梁としての論理的一貫性:応答と自己判断のラベル制約モデリングによるLCM幻覚検出の改善
- Authors: Hao Mi, Qiang Sheng, Shaofei Wang, Beizhe Hu, Yifan Sun, Zhengjia Wang, Hengqi Zeng, Yang Li, Danding Wang, Juan Cao,
- Abstract要約: 大規模言語モデル(LLM)は、現実の幻覚の傾向があり、現実のアプリケーションにおいてその信頼性を損なう。
既存の幻覚検出装置は、不確実性定量化やマクロレベルの自己判断を口頭で行うために、主にマイクロレベルの内在パターンを抽出する。
幻覚検出のための神経特徴と象徴的判断を橋渡しするフレームワークであるLaaBを提案する。
- 参考スコア(独自算出の注目度): 19.486391934670028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) are prone to factual hallucinations, risking their reliability in real-world applications. Existing hallucination detectors mainly extract micro-level intrinsic patterns for uncertainty quantification or elicit macro-level self-judgments through verbalized prompts. However, these methods address only a single facet of the hallucination, focusing either on implicit neural uncertainty or explicit symbolic reasoning, thereby treating these inherently coupled behaviors in isolation and failing to exploit their interdependence for a holistic view. In this paper, we propose LaaB (Logical Consistency-as-a-Bridge), a framework that bridges neural features and symbolic judgments for hallucination detection. LaaB introduces a "meta-judgment" process to map symbolic labels back into the feature space. By leveraging the inherent logical bridge where response and meta-judgment labels are either the same or opposite based on the self-judgment's semantics, LaaB aligns and integrates dual-view signals via mutual learning and enhances the hallucination detection. Extensive experiments on 4 public datasets, across 4 LLMs, against 8 baselines demonstrate the superiority of LaaB.
- Abstract(参考訳): 大規模言語モデル(LLM)は、現実の幻覚の傾向があり、現実のアプリケーションにおいてその信頼性を損なう。
既存の幻覚検出装置は、不確実性定量化やマクロレベルの自己判断を口頭で行うために、主にマイクロレベルの内在パターンを抽出する。
しかしながら、これらの手法は、暗黙の神経不確実性または明示的な象徴的推論に焦点をあてて、幻覚の1つの面のみに対処し、それによってこれらの本質的に結合した振る舞いを単独で処理し、それらの相互依存性を全体観に活用することができない。
本稿では,幻覚検出のための神経的特徴と記号的判断を橋渡しするフレームワークであるLaaB(Logical Consistency-as-a-Bridge)を提案する。
LaaBは、象徴的なラベルを特徴空間にマッピングする"meta-judgment"プロセスを導入した。
自己判断のセマンティクスに基づいて、応答とメタ判断ラベルが同一または反対である固有の論理的ブリッジを活用することにより、LaaBは相互学習を通じて双対ビュー信号を調整、統合し、幻覚検出を強化する。
4つのLLMにまたがる4つの公開データセットに対する8つのベースラインに対する大規模な実験は、LaaBの優位性を示している。
関連論文リスト
- Exposing Hallucinations To Suppress Them: VLMs Representation Editing With Generative Anchors [8.089908150148554]
マルチモーダル大規模言語モデル (MLLM) は様々な視覚言語タスクにおいて顕著な成功を収めている。
MLLMは幻覚に非常に敏感であり、視覚的証拠とは相容れない内容を生み出す。
本研究では,幻覚の緩和のための訓練不要で自己指導的な方法を提案する。
論文 参考訳(メタデータ) (2025-09-26T07:24:28Z) - SHALE: A Scalable Benchmark for Fine-grained Hallucination Evaluation in LVLMs [52.03164192840023]
LVLM(Large Vision-Language Models)は、いまだ幻覚に悩まされている。
本稿では,スケーラブルで制御可能で多様な評価データを生成する自動データ構築パイプラインを提案する。
我々は,忠実度と事実性幻覚の両方を評価するためのベンチマークであるSHALEを構築した。
論文 参考訳(メタデータ) (2025-08-13T07:58:01Z) - MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM [58.2298313720146]
マルチモーダル幻覚は多源性であり、様々な原因から生じる。
既存のベンチマークでは、知覚誘発幻覚と推論誘発幻覚を適切に区別することができない。
論文 参考訳(メタデータ) (2025-05-30T05:54:36Z) - HalluLens: LLM Hallucination Benchmark [49.170128733508335]
大規模言語モデル(LLM)は、しばしばユーザ入力やトレーニングデータから逸脱する応答を生成する。
本稿では,新たな内因性評価タスクと既存内因性評価タスクを併用した総合幻覚ベンチマークを提案する。
論文 参考訳(メタデータ) (2025-04-24T13:40:27Z) - Why and How LLMs Hallucinate: Connecting the Dots with Subsequence Associations [82.42811602081692]
本稿では,幻覚を体系的に追跡・理解するサブシーケンス・アソシエーション・フレームワークを提案する。
主要な洞察は、支配的な幻覚協会が忠実なものを上回るときに生じる幻覚である。
ランダムな入力コンテキストにおける幻覚の確率を解析することにより因果列を同定するトレースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T06:34:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。