論文の概要: Detecting LLM Hallucinations via Embedding Cluster Geometry: A Three-Type Taxonomy with Measurable Signatures
- arxiv url: http://arxiv.org/abs/2602.14259v1
- Date: Sun, 15 Feb 2026 18:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 16:22:49.849268
- Title: Detecting LLM Hallucinations via Embedding Cluster Geometry: A Three-Type Taxonomy with Measurable Signatures
- Title(参考訳): 埋め込みクラスタ幾何学によるLLM幻覚の検出:測定可能なシグナチャを持つ3型分類法
- Authors: Matic Korun,
- Abstract要約: トークン埋め込みクラスタ構造における観測可能なシグネチャに基づく大規模言語モデル幻覚の幾何学的分類法を提案する。
そこで本研究では,弱い環境下での1型(中心ドリフト)と,局所的コヒーレントだが文脈的に不正確なクラスタ領域への2型(ロングウェルコンバージェンス)と,クラスター構造が存在しない3型(カバーギャップ)の3つの機能的に異なる幻覚型を同定した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a geometric taxonomy of large language model hallucinations based on observable signatures in token embedding cluster structure. By analyzing the static embedding spaces of 11 transformer models spanning encoder (BERT, RoBERTa, ELECTRA, DeBERTa, ALBERT, MiniLM, DistilBERT) and decoder (GPT-2) architectures, we identify three operationally distinct hallucination types: Type 1 (center-drift) under weak context, Type 2 (wrong-well convergence) to locally coherent but contextually incorrect cluster regions, and Type 3 (coverage gaps) where no cluster structure exists. We introduce three measurable geometric statistics: α (polarity coupling), \b{eta} (cluster cohesion), and λ_s (radial information gradient). Across all 11 models, polarity structure (α > 0.5) is universal (11/11), cluster cohesion (\b{eta} > 0) is universal (11/11), and the radial information gradient is significant (9/11, p < 0.05). We demonstrate that the two models failing λ_s significance -- ALBERT and MiniLM -- do so for architecturally explicable reasons: factorized embedding compression and distillation-induced isotropy, respectively. These findings establish the geometric prerequisites for type-specific hallucination detection and yield testable predictions about architecture-dependent vulnerability profiles.
- Abstract(参考訳): トークン埋め込みクラスタ構造における観測可能なシグネチャに基づく大規模言語モデル幻覚の幾何学的分類法を提案する。
エンコーダ (BERT, RoBERTa, ELECTRA, DeBERTa, ALBERT, MiniLM, DistilBERT) およびデコーダ (GPT-2) アーキテクチャにまたがる11種類のトランスフォーマーモデルの静的埋め込み空間を解析することにより, クラスタ構造が存在しない3つの運用上の異なる幻覚型を同定した。
本稿では, α(極性結合), \b{eta}(クラスター凝集), λ_s(放射情報勾配)の3つの測定可能な幾何学統計値を紹介する。
全11モデルにおいて、極性構造(α > 0.5)は普遍(11/11)、クラスター凝集(\b{eta} > 0)は普遍(11/11)、放射情報勾配(9/11, p < 0.05)が重要(9/11, p < 0.05)である。
我々は, λ_s の有意性を損なう2つのモデル (ALBERT と MiniLM) が, それぞれ, 分解的埋め込み圧縮と蒸留誘起等方性(等方性)という, アーキテクチャ的に説明可能な理由で実現可能であることを実証した。
これらの知見は,タイプ特異的幻覚検出のための幾何学的前提条件を確立し,アーキテクチャ依存の脆弱性プロファイルに関する検証可能な予測を与える。
関連論文リスト
- Latent Sculpting for Zero-Shot Generalization: A Manifold Learning Approach to Out-of-Distribution Anomaly Detection [2.8547732086436306]
教師付きディープラーニングの基本的限界は「一般化崩壊」である
階層型2段階表現学習フレームワークであるLatent Sculptingを提案する。
我々は「浸潤」のシナリオについて88.89%の検知率を報告した。
論文 参考訳(メタデータ) (2025-12-19T11:37:02Z) - Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - How high is `high'? Rethinking the roles of dimensionality in topological data analysis and manifold learning [8.397730500554047]
我々は、一般化されたハンソン・ライトの不等式を示し、それをデータポイントクラウドの幾何学に関する新しい統計的知見を確立するために利用する。
ガードナーらによる格子細胞活動における等尺トロイダル構造の画期的な神経科学的な発見を再考する。
我々の発見は、この構造が実際に物理空間にあるという証拠を初めて明らかにし、格子状細胞活動が現実世界の幾何学的に忠実な表現を伝達していることを意味する。
論文 参考訳(メタデータ) (2025-05-22T16:34:15Z) - (Deep) Generative Geodesics [57.635187092922976]
2つのデータポイント間の類似性を評価するために,新しい測定基準を導入する。
我々の計量は、生成距離と生成測地学の概念的定義に繋がる。
彼らの近似は、穏やかな条件下で真の値に収束することが証明されている。
論文 参考訳(メタデータ) (2024-07-15T21:14:02Z) - Curved Geometric Networks for Visual Anomaly Recognition [39.91252195360767]
データ分布の根底にある性質を理解するために潜伏埋め込みを学ぶことは、曲率ゼロのユークリッド空間でしばしば定式化される。
本研究では,データ中の異常やアウト・オブ・ディストリビューション・オブジェクトを解析するための曲線空間の利点について検討する。
論文 参考訳(メタデータ) (2022-08-02T01:15:39Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - Linear Connectivity Reveals Generalization Strategies [54.947772002394736]
微調整されたモデルのいくつかは、それらの間の線形経路における損失を増大させる大きな障壁を持つ。
テスト損失面上で線形に接続されているが、クラスタ外のモデルから切り離されている異なるモデルのクラスタが見つかる。
我々の研究は、損失面の幾何学がモデルを異なる関数へと導く方法を示している。
論文 参考訳(メタデータ) (2022-05-24T23:43:02Z) - Multiway Spherical Clustering via Degree-Corrected Tensor Block Models [8.147652597876862]
推定精度を保証した次数補正ブロックモデルを開発した。
特に,3次以上のテンソルに対してのみ,本質的な統計的-計算的ギャップが生じることを示す。
本手法の有効性を2つのデータアプリケーションを用いて実証した。
論文 参考訳(メタデータ) (2022-01-19T03:40:22Z) - Mitigating Generation Shifts for Generalized Zero-Shot Learning [52.98182124310114]
一般化ゼロショット学習(英: Generalized Zero-Shot Learning、GZSL)は、学習中に見知らぬクラスが観察できない、見つからないサンプルを認識するために意味情報(属性など)を活用するタスクである。
本稿では,未知のデータ合成を効率よく,効率的に学習するための新しい生成シフト緩和フローフレームワークを提案する。
実験結果から,GSMFlowは従来のゼロショット設定と一般化されたゼロショット設定の両方において,最先端の認識性能を実現することが示された。
論文 参考訳(メタデータ) (2021-07-07T11:43:59Z) - Quantum anomalous Hall phase in synthetic bilayers via twistless
twistronics [58.720142291102135]
我々は超低温原子と合成次元に基づく「ツイストロン様」物理学の量子シミュレータを提案する。
本研究では,適切な条件下でのトポロジカルバンド構造を示す。
論文 参考訳(メタデータ) (2020-08-06T19:58:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。