論文の概要: Hallucination Basins: A Dynamic Framework for Understanding and Controlling LLM Hallucinations
- arxiv url: http://arxiv.org/abs/2604.04743v1
- Date: Mon, 06 Apr 2026 15:08:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-07 15:49:19.242583
- Title: Hallucination Basins: A Dynamic Framework for Understanding and Controlling LLM Hallucinations
- Title(参考訳): Hallucination Basins: LLM Hallucinationの理解と制御のための動的フレームワーク
- Authors: Kalyan Cherukuri, Lav R. Varshney,
- Abstract要約: 潜在空間におけるタスク依存型盆地構造から幻覚が生じることを示す。
我々は,この動作をタスク複雑度とマルチベース定理で形式化し,L層変圧器における盆地の出現を特徴付けるとともに,幾何学的なステアリングが再学習を伴わずに幻覚の確率を低減できることを示す。
- 参考スコア(独自算出の注目度): 13.629487815782355
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models (LLMs) hallucinate: they produce fluent outputs that are factually incorrect. We present a geometric dynamical systems framework in which hallucinations arise from task-dependent basin structure in latent space. Using autoregressive hidden-state trajectories across multiple open-source models and benchmarks, we find that separability is strongly task-dependent rather than universal: factoid settings can show clearer basin separation, whereas summarization and misconception-heavy settings are typically less stable and often overlap. We formalize this behavior with task-complexity and multi-basin theorems, characterize basin emergence in L-layer transformers, and show that geometry-aware steering can reduce hallucination probability without retraining.
- Abstract(参考訳): 大型言語モデル (LLM) は幻覚を与える: 実際に正しくない流動的な出力を生成する。
本稿では,潜在空間におけるタスク依存型盆地構造から幻覚が生じる幾何学力学系の枠組みを提案する。
複数のオープンソースモデルとベンチマークにまたがる自己回帰的隠れ状態軌跡を用いて、分離性は普遍性よりもタスク依存に強く依存していることが分かる。
我々は,L層変圧器における盆地の出現を特徴付けるとともに,この挙動をタスク複雑性やマルチベース定理で定式化し,幾何学的なステアリングが再学習を伴わずに幻覚の確率を減少させることを示した。
関連論文リスト
- Locate-then-Sparsify: Attribution Guided Sparse Strategy for Visual Hallucination Mitigation [68.41785694664011]
機能ステアリングのためのLate-Then-Sparsify(LTS-FS)と呼ばれるプラグアンドプレイフレームワークを提案する。
各層の幻覚関係に応じて操舵強度を制御する。
我々の枠組みは、強い性能を維持しながら幻覚を効果的に緩和する。
論文 参考訳(メタデータ) (2026-03-17T09:16:50Z) - Lyapunov Probes for Hallucination Detection in Large Foundation Models [27.51972811669081]
幻覚は、安定ゾーンと不安定ゾーンを分ける知識遷移領域の境界で生じる傾向がある。
Lyapunov Probes: デリバティブベースの安定性制約で訓練された軽量ネットワークを提案する。
多様なデータセットとモデルの実験は、既存のベースラインよりも一貫した改善を示している。
論文 参考訳(メタデータ) (2026-03-06T09:32:59Z) - HalluShift++: Bridging Language and Vision through Internal Representation Shifts for Hierarchical Hallucinations in MLLMs [17.130698952440316]
大規模言語モデル(MLLM)における幻覚は、モデル開発プロセスにおいてますます重要になっている。
本稿では,幻覚がMLLMの内部層力学における測定可能な不規則性として現れるという仮説を提案する。
このような修正を導入することで、textsctextscHalluShift++は、テキストベースの大規模言語モデルからの幻覚検出の有効性を広げる。
論文 参考訳(メタデータ) (2025-12-08T16:24:46Z) - Mitigating Diffusion Model Hallucinations with Dynamic Guidance [75.90458880492054]
拡散モデルはしばしば、真のデータ分布の支持外にある構造上の矛盾のある幻覚サンプルを生成する。
本稿では,事前に決められた方向に沿ってのみスコア関数を選択的に研ぎ澄まし,幻覚を緩和する動的誘導法を提案する。
私たちの知る限り、これはポストホックフィルタリングではなく、世代毎の幻覚に対処する最初のアプローチである。
論文 参考訳(メタデータ) (2025-10-06T20:31:13Z) - Review of Hallucination Understanding in Large Language and Vision Models [65.29139004945712]
本稿では,多様なアプリケーションにまたがる画像とテキストの幻覚を特徴付けるフレームワークを提案する。
我々の調査によると、幻覚はデータ分布や遺伝バイアスの予測可能なパターンから生じることが多い。
この調査は、現実世界の生成AIシステムにおける幻覚に対するより堅牢で効果的なソリューションを開発する基盤を提供する。
論文 参考訳(メタデータ) (2025-09-26T09:23:08Z) - Grounding the Ungrounded: A Spectral-Graph Framework for Quantifying Hallucinations in Multimodal LLMs [19.099044165107696]
MLLMの幻覚を定量化する拡散力学における厳密な情報幾何学的枠組みを提案する。
我々は、温度依存の幻覚エネルギーに基づいてCourant-Fischer境界を導出し、RKHS固有モデムを用いて、モダリティを意識した解釈可能な測定値を得る。
論文 参考訳(メタデータ) (2025-08-26T18:54:52Z) - MIRAGE: Assessing Hallucination in Multimodal Reasoning Chains of MLLM [58.2298313720146]
マルチモーダル幻覚は多源性であり、様々な原因から生じる。
既存のベンチマークでは、知覚誘発幻覚と推論誘発幻覚を適切に区別することができない。
論文 参考訳(メタデータ) (2025-05-30T05:54:36Z) - Triggering Hallucinations in LLMs: A Quantitative Study of Prompt-Induced Hallucination in Large Language Models [0.0]
大規模言語モデル(LLM)における幻覚は、現実世界のアプリケーションにまたがる課題が増えていることを示している。
幻覚を系統的に引き起こし定量化するプロンプトベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-01T14:33:47Z) - Why and How LLMs Hallucinate: Connecting the Dots with Subsequence Associations [82.42811602081692]
本稿では,幻覚を体系的に追跡・理解するサブシーケンス・アソシエーション・フレームワークを提案する。
主要な洞察は、支配的な幻覚協会が忠実なものを上回るときに生じる幻覚である。
ランダムな入力コンテキストにおける幻覚の確率を解析することにより因果列を同定するトレースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T06:34:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。