論文の概要: LLM Hallucination Detection: HSAD
- arxiv url: http://arxiv.org/abs/2509.23580v2
- Date: Wed, 08 Oct 2025 03:34:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-09 14:21:18.160725
- Title: LLM Hallucination Detection: HSAD
- Title(参考訳): LLM幻覚検出:HSAD
- Authors: JinXin Li, Gang Tu, JunJie Hu,
- Abstract要約: 幻覚検出方法は、事実整合性検証や静的な隠蔽層機能に依存する。
本稿では,隠蔽層時間信号の周波数領域解析に基づく幻覚検出手法を提案する。
この手法は、知識カバレッジと推論バイアスの検出の観点から、既存のアプローチの限界を克服する。
- 参考スコア(独自算出の注目度): 6.306213519424463
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although Large Language Models have demonstrated powerful capabilities in a wide range of tasks such as language understanding and code generation, the frequent occurrence of hallucinations during the generation process has become a significant impediment to their deployment in critical application scenarios. Current mainstream hallucination detection methods rely on factual consistency verification or static hidden layer features. The former is constrained by the scope of knowledge coverage, while the latter struggles to capture reasoning biases during the inference process. To address these issues, and inspired by signal analysis methods in cognitive neuroscience, this paper proposes a hallucination detection method based on the frequency-domain analysis of hidden layer temporal signals, named HSAD (\textbf{H}idden \textbf{S}ignal \textbf{A}nalysis-based \textbf{D}etection). First, by treating the LLM's reasoning process as a cognitive journey that unfolds over time, we propose modeling and simulating the human process of signal perception and discrimination in a deception-detection scenario through hidden layer temporal signals. Next, The Fast Fourier Transform is applied to map these temporal signals into the frequency domain to construct spectral features, which are used to capture anomalies that arise during the reasoning process; analysis experiments on these spectral features have proven the effectiveness of this approach. Finally, a hallucination detection algorithm is designed based on these spectral features to identify hallucinations in the generated content. By effectively combining the modeling of the reasoning process with frequency-domain feature extraction, the HSAD method overcomes the limitations of existing approaches in terms of knowledge coverage and the detection of reasoning biases, demonstrating higher detection accuracy and robustness.
- Abstract(参考訳): 大きな言語モデルは、言語理解やコード生成といった幅広いタスクにおいて強力な能力を示してきたが、生成プロセスにおける幻覚の頻繁な発生は、重要なアプリケーションシナリオへの展開に重大な障害となっている。
現在主流の幻覚検出法は、事実整合性検証や静的な隠蔽層機能に依存している。
前者は知識カバレッジの範囲に制約され、後者は推論プロセス中に推論バイアスを捉えるのに苦労する。
これらの問題に対処し,認知神経科学における信号解析手法に触発されて,HSAD(\textbf{H}idden \textbf{S}ignal \textbf{A}nalysis-based \textbf{D}etection)と呼ばれる隠蔽層時間信号の周波数領域解析に基づく幻覚検出法を提案する。
まず,LLMの推論過程を時間とともに展開する認知的旅路として扱うことにより,隠された時間的信号を通しての誤検出シナリオにおいて,人間の知覚と識別の過程をモデル化し,シミュレーションする。
次に、これらの時相信号を周波数領域にマッピングしてスペクトル特性を構築するために、高速フーリエ変換を適用する。
最後に、これらのスペクトル特徴に基づいて幻覚検出アルゴリズムを設計し、生成したコンテンツの幻覚を識別する。
周波数領域の特徴抽出と推論プロセスのモデリングを効果的に組み合わせることで、HSAD法は知識カバレッジと推論バイアスの検出において既存のアプローチの限界を克服し、高い検出精度とロバスト性を示す。
関連論文リスト
- LUMINA: Detecting Hallucinations in RAG System with Context-Knowledge Signals [19.38878193608028]
Retrieval-Augmented Generation (RAG) は、検索した文書に応答を接地することで、大規模言語モデル(LLM)における幻覚を軽減することを目的としている。
しかし、RAGベースのLLMは、正確で十分なコンテキストが提供されても、まだ幻覚的である。
本稿では,RAGシステムにおける幻覚を検出する新しいフレームワークLUMINAを提案する。
論文 参考訳(メタデータ) (2025-09-26T04:57:46Z) - A Novel Differential Feature Learning for Effective Hallucination Detection and Classification [3.9060143123877844]
本稿では,適応的な層間特徴重み付けと差分特徴学習機構に,Projected Fusionブロックを統合したデュアルモデルアーキテクチャを提案する。
幻覚信号が高度にスパースな特徴部分集合に集中していることを示し,質問応答や対話タスクの精度を大幅に向上させることを実証した。
論文 参考訳(メタデータ) (2025-09-20T06:48:22Z) - LLM Hallucination Detection: A Fast Fourier Transform Method Based on Hidden Layer Temporal Signals [10.85580316542761]
幻覚は、信頼性に敏感なアプリケーションに大規模言語モデル(LLM)をデプロイする上で、依然として重要な障壁である。
隠れ表現の時間的ダイナミクスをモデル化する新しい幻覚検出フレームワークであるHSAD(Hidden Signal Analysis-based Detection)を提案する。
TruthfulQAを含む複数のベンチマークにおいて、HSADは従来の最先端手法に比べて10パーセント以上の改善を実現している。
論文 参考訳(メタデータ) (2025-09-16T15:08:19Z) - Beyond ROUGE: N-Gram Subspace Features for LLM Hallucination Detection [5.0106565473767075]
大規模言語モデル(LLM)は、自然言語を含む様々なタスクにおいて有効性を示す。
幻覚の根本的な問題は依然としてこれらのモデルに悩まされており、一貫性のある真正な情報を生成する際の信頼性を制限している。
LLM生成テキストからN-Gram周波数テンソルを構成するROUGEにインスパイアされた新しい手法を提案する。
このテンソルは共起パターンを符号化することでよりリッチな意味構造を捉え、事実と幻覚的コンテンツをよりよく区別することができる。
論文 参考訳(メタデータ) (2025-09-03T18:52:24Z) - ICR Probe: Tracking Hidden State Dynamics for Reliable Hallucination Detection in LLMs [50.18087419133284]
隠れた状態を活用する幻覚検出法は、主に静的および孤立した表現に焦点を当てている。
隠れ状態の更新に対するモジュールの寄与を定量化する新しいメトリック ICR Score を導入する。
本稿では,隠れ状態の層間進化を捉えた幻覚検出手法 ICR Probe を提案する。
論文 参考訳(メタデータ) (2025-07-22T11:44:26Z) - Learning Auxiliary Tasks Improves Reference-Free Hallucination Detection in Open-Domain Long-Form Generation [78.78421340836915]
オープンドメイン長文応答における参照なし幻覚検出を系統的に検討する。
その結果,内的状態は事実と幻覚的内容とを確実に区別するには不十分であることが判明した。
RATE-FTと呼ばれる新しいパラダイムを導入し、モデルが幻覚検出のメインタスクと共同で学習するための補助的なタスクで微調整を強化する。
論文 参考訳(メタデータ) (2025-05-18T07:10:03Z) - Why and How LLMs Hallucinate: Connecting the Dots with Subsequence Associations [82.42811602081692]
本稿では,幻覚を体系的に追跡・理解するサブシーケンス・アソシエーション・フレームワークを提案する。
主要な洞察は、支配的な幻覚協会が忠実なものを上回るときに生じる幻覚である。
ランダムな入力コンテキストにおける幻覚の確率を解析することにより因果列を同定するトレースアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-04-17T06:34:45Z) - From Vision to Sound: Advancing Audio Anomaly Detection with Vision-Based Algorithms [6.643376250301589]
我々は、オーディオ異常検出(AAD)の問題に対処するために、そのようなアルゴリズムのオーディオ領域への適応について検討する。
主に異常サンプルを分類する既存のAAD法とは異なり,本手法ではスペクトル内における異常の微細な時間周波数局在を導入している。
本研究では,産業用および環境用ベンチマークに対するアプローチを評価し,音声信号の異常検出におけるVAD手法の有効性を実証した。
論文 参考訳(メタデータ) (2025-02-25T16:22:42Z) - A New Benchmark and Reverse Validation Method for Passage-level
Hallucination Detection [63.56136319976554]
大きな言語モデル(LLM)は幻覚を発生させ、ミッションクリティカルなタスクにデプロイすると大きなダメージを与える可能性がある。
本稿では,逆検証に基づく自己チェック手法を提案し,ゼロリソース方式で事実誤りを自動的に検出する。
提案手法と既存のゼロリソース検出手法を2つのデータセット上で実証的に評価した。
論文 参考訳(メタデータ) (2023-10-10T10:14:59Z) - Provable RL with Exogenous Distractors via Multistep Inverse Dynamics [85.52408288789164]
実世界の強化学習(RL)の応用は、メガピクセルカメラから生成されたような高次元の観察にエージェントが対処する必要がある。
従来の研究は表現学習でこのような問題に対処しており、エージェントは生の観察から内因性、潜伏状態の情報を確実に抽出することができる。
しかし、このような手法は観測において時間的に相関するノイズの存在下では失敗する可能性がある。
論文 参考訳(メタデータ) (2021-10-17T15:21:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。