論文の概要: Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination
- arxiv url: http://arxiv.org/abs/2603.19562v3
- Date: Fri, 27 Mar 2026 04:47:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-30 21:49:48.10553
- Title: Neural Uncertainty Principle: A Unified View of Adversarial Fragility and LLM Hallucination
- Title(参考訳): 神経不確実性原理 : 対向的脆弱性とLLM幻覚の統一的視点
- Authors: Dong-Xiao Zhang, Hu Lou, Jun-Jie Zhang, Jun Zhu, Deyu Meng,
- Abstract要約: 大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別の問題と見なされている。
損失誘起状態下でのニューラル不確実性原理(NUP)の定式化により, ほぼバウンド状態においては, さらなる圧縮は感度分散の増大を伴うことが判明した。
視覚では、高度に結合したコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
言語では、任意の応答トークンを生成する前に、同じプレフィルステージプローブが幻覚リスクを検出する。
- 参考スコア(独自算出の注目度): 60.197429875410286
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Adversarial vulnerability in vision and hallucination in large language models are conventionally viewed as separate problems, each addressed with modality-specific patches. This study first reveals that they share a common geometric origin: the input and its loss gradient are conjugate observables subject to an irreducible uncertainty bound. Formalizing a Neural Uncertainty Principle (NUP) under a loss-induced state, we find that in near-bound regimes, further compression must be accompanied by increased sensitivity dispersion (adversarial fragility), while weak prompt-gradient coupling leaves generation under-constrained (hallucination). Crucially, this bound is modulated by an input-gradient correlation channel, captured by a specifically designed single-backward probe. In vision, masking highly coupled components improves robustness without costly adversarial training; in language, the same prefill-stage probe detects hallucination risk before generating any answer tokens. NUP thus turns two seemingly separate failure taxonomies into a shared uncertainty-budget view and provides a principled lens for reliability analysis. Guided by this NUP theory, we propose ConjMask (masking high-contribution input components) and LogitReg (logit-side regularization) to improve robustness without adversarial training, and use the probe as a decoding-free risk signal for LLMs, enabling hallucination detection and prompt selection. NUP thus provides a unified, practical framework for diagnosing and mitigating boundary anomalies across perception and generation tasks.
- Abstract(参考訳): 大規模言語モデルにおける視覚と幻覚の対立的脆弱性は、伝統的に別個の問題と見なされ、それぞれがモダリティ固有のパッチで対処される。
入力と損失勾配は、既約不確実性境界の下の共役可観測物である。
ニューラル不確実性原理 (NUP) を損失誘起状態下で定式化すると, ほぼバウンド状態においては, さらなる圧縮には感度分散(逆方向の不安定性)が伴わなければならない。
重要なことに、この境界は入力勾配の相関チャネルによって変調され、特別に設計された単一後方プローブによってキャプチャされる。
視覚では、高度に結合されたコンポーネントをマスキングすることで、コストのかかる敵の訓練なしに堅牢性を向上させる。
したがって、NUPは2つの一見独立した失敗分類を共通の不確実性予算のビューに変換し、信頼性分析のための原則化されたレンズを提供する。
この NUP 理論で導かれる手法は,高コントリビューション入力成分をマッピングする ConjMask と LogitReg (ロジット側正規化) を提案し,そのプローブを LLM の復号自由リスク信号として使用し,幻覚検出と迅速な選択を可能にする。
したがって、NUPは認識と生成タスクをまたいだ境界異常の診断と緩和のための統一的で実用的なフレームワークを提供する。
関連論文リスト
- Anatomy of a Lie: A Multi-Stage Diagnostic Framework for Tracing Hallucinations in Vision-Language Models [62.932580559941414]
VLM(Vision-Language Models)は、しばしば「ハロシン化(hallucinate)」する。
本稿では,静的な出力誤差からモデル計算認知の動的病理へ再キャストし,幻覚を診断するための新しいパラダイムを提案する。
論文 参考訳(メタデータ) (2026-03-16T17:20:38Z) - The Phenomenology of Hallucinations [2.5782420501870296]
言語モデルが幻覚の原因となるのは、不確実性の検出に失敗するだけでなく、出力生成への統合に失敗するためである。
アーキテクチャ全体では、不確実な入力が確実に特定され、2-3$timesの高次元領域を実数入力の本質的な次元として占有する。
しかし、この内部信号は出力層と弱い結合であり、不確実性は低感度な部分空間に移行し、幾何学的に増幅されるが機能的にサイレントになる。
論文 参考訳(メタデータ) (2026-03-14T11:55:55Z) - Hallucination Begins Where Saliency Drops [18.189047289404325]
幻覚は、前の出力トークンが次のトークンの予測に対して低い正当性を示すときにしばしば起こる。
LVLMs-Saliencyは,各出力トークンの視覚的グラウンドリング強度を定量化する,勾配認識型診断フレームワークである。
本手法は, 流速とタスク性能を保ちながら幻覚率を大幅に低減し, 堅牢かつ解釈可能なソリューションを提供する。
論文 参考訳(メタデータ) (2026-01-28T05:50:52Z) - Agentic Uncertainty Quantification [76.94013626702183]
本稿では,言語化された不確実性をアクティブな双方向制御信号に変換する統合されたデュアルプロセスエージェントUQ(AUQ)フレームワークを提案する。
システム1(Uncertainty-Aware Memory, UAM)とシステム2(Uncertainty-Aware Reflection, UAR)は、これらの説明を合理的な手段として利用し、必要な時にのみターゲットの推論時間解決をトリガーする。
論文 参考訳(メタデータ) (2026-01-22T07:16:26Z) - FaithSCAN: Model-Driven Single-Pass Hallucination Detection for Faithful Visual Question Answering [14.550872089352943]
FaithSCANは視覚言語モデルの豊富な内部信号を利用して幻覚を検出する軽量ネットワークである。
本稿では,LLM-as-a-JudgeパラダイムをVQA幻覚に拡張し,モデル依存型監視信号の自動生成のための低コスト戦略を提案する。
深い分析により、幻覚は視覚知覚、相互モーダル推論、言語復号における系統的な内部状態の変化から生じることが示された。
論文 参考訳(メタデータ) (2026-01-01T09:19:39Z) - HaluNet: Multi-Granular Uncertainty Modeling for Efficient Hallucination Detection in LLM Question Answering [12.183015986299438]
マルチグラニュラートークンレベルの不確実性を統合する軽量でトレーニング可能なニューラルネットワークフレームワークである textbfHaluNet を提案する。
SQuAD、TriviaQA、Natural Questionsの実験は、HaluNetが強力な検出性能と良好な計算効率を提供することを示している。
論文 参考訳(メタデータ) (2025-12-31T02:03:10Z) - Semantic Energy: Detecting LLM Hallucination Beyond Entropy [106.92072182161712]
大規模言語モデル(LLM)は、現実のアプリケーションにますますデプロイされているが、幻覚の影響を受けやすいままである。
不確実性推定は、そのような幻覚を検出するための実現可能なアプローチである。
本稿では,新しい不確実性推定フレームワークであるセマンティック・エナジーを紹介する。
論文 参考訳(メタデータ) (2025-08-20T07:33:50Z) - Weakly-Supervised Cross-Domain Adaptation for Endoscopic Lesions
Segmentation [79.58311369297635]
異なるデータセットにまたがるトランスファー可能なドメイン不変知識を探索できる,新しい弱い教師付き病巣移動フレームワークを提案する。
wasserstein quantified transferability frameworkは、広い範囲の転送可能なコンテキスト依存性を強調するために開発されている。
新規な自己監督型擬似ラベル生成器は、送信困難かつ転送容易なターゲットサンプルの両方に対して、確実な擬似ピクセルラベルを等しく提供するように設計されている。
論文 参考訳(メタデータ) (2020-12-08T02:26:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。