論文の概要: Quickest Detection of Hallucination Onset: Delay Bounds and Learned CUSUM Statistics
- arxiv url: http://arxiv.org/abs/2606.12476v2
- Date: Fri, 12 Jun 2026 13:24:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 13:53:03.591392
- Title: Quickest Detection of Hallucination Onset: Delay Bounds and Learned CUSUM Statistics
- Title(参考訳): 幻覚の早期検出:遅延境界と学習CUSUM統計
- Authors: Igor Itkin,
- Abstract要約: 幻覚のオンセット検出は 最も急激な変化検出問題です
因果リカレントラベル装置は、学習インクリメントを伴うCUSUMとして機能する。
低速アラームオンセット検出は困難である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Token-level hallucination detectors are evaluated as classifiers, by AUC over all tokens, yet a streaming monitor is judged by its reaction time: the number of tokens that pass between the onset of a hallucination and the alarm. We formulate hallucination onset detection as a quickest change detection problem. A first-order Markov model of the latent faithful/hallucinated state, validated on RAGTruth, places the task inside classical change-point theory and yields Lorden's lower bound on detection delay: about 1.3 tokens at a false-alarm rate of 0.01. We then show that a causal recurrent labeler acts as a CUSUM with a learned increment. Among the onsets it catches it detects in 11-13 tokens, against 31 for a linear per-token baseline, though at this false-alarm budget every detector catches under a third of onsets and the recall-honest delay is 56-66 tokens: low-false-alarm onset detection is hard. A controlled decomposition attributes the speed advantage mostly to a better per-token score rather than to temporal accumulation. An information-rate optimality theorem of Donsker-Varadhan type explains the remaining order-of-magnitude gap: the learned score realizes only 1/4.5 of the divergence the features carry, a deficit that recalibration cannot remove, with the remainder a finite-horizon effect. Classification metrics conceal this delay structure; sequential analysis makes it measurable.
- Abstract(参考訳): トークンレベルの幻覚検出器は、すべてのトークンに対してAUCによって分類器として評価されるが、ストリーミングモニターはその反応時間によって判断される。
我々は、最も急激な変化検出問題として幻覚検出を定式化する。
RAGTruthで検証された潜在忠実/幻覚状態の1次マルコフモデルでは、タスクを古典的変化点理論の中に配置し、検出遅延(英語版)でローレンの下限(英語版)(約1.3トークン)を得る。
次に、因果リカレントラベルが学習インクリメントを伴うCUSUMとして機能することを示す。
しかしこの偽アラーム予算では、全ての検出器はオンセットの3分の1以下でキャッチされ、リコールとリコールの遅延は56-66トークンであり、低ファローのアラームのオンセット検出は難しい。
制御された分解は、時間的蓄積よりも、主にトーケン毎のスコアが優れているという、速度の優位性に起因している。
Donsker-Varadhan型の情報レート最適性定理は、残りの次数-次数ギャップを説明している: 学習されたスコアは、特徴が持つ発散の1/4.5しか認識せず、再校正できない欠陥は、残りは有限水平効果である。
分類基準はこの遅延構造を隠蔽し、シーケンシャル分析により測定可能である。
関連論文リスト
- The Hiremath Early Detection (HED) Score: A Measure-Theoretic Evaluation Standard for Temporal Intelligence [0.0]
非定常プロセス上で動作するシステム評価のための原理的理論的基準であるHiremath Early Detection (HED) Scoreを導入する。
HEDスコアは、ベースラインニュートラルで指数関数的に崩壊するカーネルをターゲット状態の後続確率ストリーム上に統合し、正確には状態シフトの開始時に始まる。
論文 参考訳(メタデータ) (2026-04-05T14:22:20Z) - Early Rug Pull Warning for BSC Meme Tokens via Multi-Granularity Wash-Trading Pattern Profiling [3.1262100364392205]
分散型金融(DeFi)におけるミームトークンの高頻度発行と短サイクル投機は、ルーグプルリスクを著しく増幅した。
既存のアプローチは、わずかな異常、不完全なラベル、限定的な解釈可能性の下で安定した早期警告を提供するのに依然として苦労している。
この問題に対処するために、データセットの構築とラベル付け、ハッシュトレーディングパターンの特徴モデリング、リスク予測、エラー解析の4段階からなるBSCミームトークンに対して、エンドツーエンドの警告フレームワークが提案されている。
論文 参考訳(メタデータ) (2026-03-14T08:25:42Z) - LEFT: Learnable Fusion of Tri-view Tokens for Unsupervised Time Series Anomaly Detection [53.191369031661885]
教師なし時系列異常検出は、アノテーションの可用性を前提とせず、異常なタイムスタンプを識別するモデルを構築することを目的としている。
本稿では,非教師付きTSADフレームワークであるLearnable Fusion of Tri-view Tokens(LEFT)について述べる。
実世界のベンチマーク実験では、LEFTはSOTAベースラインに対して最高の検出精度を示し、FLOPの5倍、トレーニングの8倍のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-09T13:33:49Z) - Probability-Entropy Calibration: An Elastic Indicator for Adaptive Fine-tuning [55.2818264614932]
RankTunerは確率エントロピーキャリブレーション信号、相対ランクインジケータを導入し、予測分布の下で接地トラストークンのランクと期待ランクを比較する。
逆インジケータはトークン単位の相対尺度として使用され、微調整の目的を再重み付けし、真に未学習のトークンを更新する。
論文 参考訳(メタデータ) (2026-02-02T07:27:19Z) - Finite-Horizon Quickest Change Detection Balancing Latency with False Alarm Probability [20.918853345531375]
非定常環境における学習に関連のあるQCD問題の有限水平変種について検討した。
誤報を特徴づける計量は、地平線が終わる前に発生する誤報の確率である。
目的は、(所定のレイテンシレベルで)レイテンシを最小限に抑えながら、偽のアラームの確率を低く抑えることである。
論文 参考訳(メタデータ) (2025-11-16T22:16:33Z) - Uncertainty-Aware Attention Heads: Efficient Unsupervised Uncertainty Quantification for LLMs [129.79394562739705]
大型言語モデル(LLM)は、顕著な流布を示すが、しばしば「幻覚」として知られる致命的な誤りを引き起こす。
本稿では,非教師的アプローチであるRAUQ(Recurrent Attention-based Uncertainty Quantification)を提案する。
4つのLLMと12の質問応答、要約、翻訳タスクにわたる実験は、RAUQが優れた結果をもたらすことを示した。
論文 参考訳(メタデータ) (2025-05-26T14:28:37Z) - MTRE: Multi-Token Reliability Estimation for Hallucination Detection in VLMs [2.6076093883457454]
視覚言語モデル(VLM)は、今や多くのマルチモーダルタスクにおいて人間のパフォーマンスと競合するが、それでもオブジェクトを幻覚させるか、安全でないテキストを生成する。
初期ロジットの完全配列を解析することで,診断情報が大幅に向上することが実証された。
マルチトークンの信頼性評価(MTRE, Multi-Token Reliability Estimation)は, マルチトークンの対数比と自己アテンションを用いて, 最初の10トークンからログを集約する軽量なホワイトボックス手法である。
論文 参考訳(メタデータ) (2025-05-16T23:00:19Z) - CARLA: Self-supervised Contrastive Representation Learning for Time Series Anomaly Detection [53.83593870825628]
時系列異常検出(TSAD)の主な課題は、多くの実生活シナリオにおいてラベル付きデータの欠如である。
既存の異常検出手法の多くは、教師なしの方法で非ラベル時系列の正常な振る舞いを学習することに焦点を当てている。
本稿では,時系列異常検出のためのエンドツーエンドの自己教師型コントラアスティブ表現学習手法を提案する。
論文 参考訳(メタデータ) (2023-08-18T04:45:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。