論文の概要: From Prerequisites to Predictions: Validating a Geometric Hallucination Taxonomy Through Controlled Induction
- arxiv url: http://arxiv.org/abs/2603.00307v1
- Date: Fri, 27 Feb 2026 20:56:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:56.138004
- Title: From Prerequisites to Predictions: Validating a Geometric Hallucination Taxonomy Through Controlled Induction
- Title(参考訳): 前提条件から予測へ:制御誘導による幾何学的幻覚分類の検証
- Authors: Matic Korun,
- Abstract要約: 幾何学的幻覚分類法が幻覚のタイプを識別できるかどうかを検証する。
1 と 2 はどちらの空間でも分離しない。
Type1/2非分離は124Mパラメータで真である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We test whether a geometric hallucination taxonomy -- classifying failures as center-drift (Type~1), wrong-well convergence (Type~2), or coverage gaps (Type~3) -- can distinguish hallucination types through controlled induction in GPT-2. Using a two-level statistical design with prompts ($N = 15$/group) as the unit of inference, we run each experiment 20 times with different generation seeds to quantify result stability. In static embeddings, Type~3 norm separation is robust (significant in 18/20 runs, Holm-corrected in 14/20, median $r = +0.61$). In contextual hidden states, the Type~3 norm effect direction is stable (19/20 runs) but underpowered at $N = 15$ (significant in 4/20, median $r = -0.28$). Types~1 and~2 do not separate in either space (${\leq}\,3/20$ runs). Token-level tests inflate significance by 4--16$\times$ through pseudoreplication -- a finding replicated across all 20 runs. The results establish coverage-gap hallucinations as the most geometrically distinctive failure mode, carried by magnitude rather than direction, and confirm the Type~1/2 non-separation as genuine at 124M parameters.
- Abstract(参考訳): 幾何学的幻覚分類法 -- 障害を中心ドリフト(Type~1)、誤ウェル収束(Type~2)、あるいはカバレッジギャップ(Type~3)に分類することで、GPT-2の制御誘導によって幻覚を識別できるかどうかを検証した。
推論単位としてプロンプト(N = 15$/group)を持つ2段階の統計設計を用いて、各実験を異なる世代種で20回行い、結果の安定性を定量化する。
静的埋め込みでは、タイプ~3のノルム分離は堅牢である(18/20ラン、ホルム補正14/20、中央値$r = +0.61$)。
文脈的に隠された状態において、タイプ~3のノルム効果方向は安定(19/20ラン)であるが、$N = 15$(4/20では重要、中央値$r = -0.28$)で弱出力である。
1 と 2 はどちらの空間でも分離しない({\leq}\,3/20$ run)。
トークンレベルのテストは、擬似レプリケーションを通じて4-16$\times$で重要性を増す。
その結果,1400M のパラメータにおいて,約1/2 の非分離が真であることを確認するとともに,最も幾何学的に特徴的な障害モードとしてカバレッジギャップ幻覚が確立された。
関連論文リスト
- Witness wedges in fidelity-deviation plane: separating teleportation advantage and Bell-inequality violation [0.0]
我々は、2つの相補的なメリットの図形の合同幾何学を通して量子テレポーテーションを解析するための統一的な枠組みを開発する。
特に、任意の測定ペア$(F D)$は、等方性資源の可視性推定に移植することができる。
論文 参考訳(メタデータ) (2025-11-26T05:43:31Z) - Transformer Injectivity & Geometric Robustness - Analytic Margins and Bi-Lipschitz Uniformity of Sequence-Level Hidden States [0.0]
離散的プロンプトから終点隠れ状態への写像は、有限プロンプト集合に対して一般射影的であることを示す。
本研究では, 層間, シーケンス長, モデルスケール, 8ビットおよび4ビットのアクティベーション量子化について検討した。
論文 参考訳(メタデータ) (2025-11-17T19:39:15Z) - Shrinkage to Infinity: Reducing Test Error by Inflating the Minimum Norm Interpolator in Linear Models [0.0]
Hastie et al. (2022) は高次元線形回帰 $y=betaTx + epsilon$ においてリッジ正則化が必須であることを発見した。
高い異方性共分散と$d/n$の線形回帰を正確に観測する。
最小$ell$補間器を1より大きい定数でスケールアップ(または膨らませる)するだけで一般化誤差が改善できることが分かる。
論文 参考訳(メタデータ) (2025-10-22T03:30:27Z) - Mesoscopic Fluctuations and Multifractality at and across Measurement-Induced Phase Transition [46.176861415532095]
二次元自由フェルミオンモデルにおける量子軌道のアンサンブルに関する統計的揺らぎについて検討する。
この結果はアンダーソンの局所化に顕著な類似性を示し、G_AB$は2末端の導電率に対応する。
監視システムのメソスコピック理論の基礎を築き,様々な拡張への道を開いた。
論文 参考訳(メタデータ) (2025-07-15T13:44:14Z) - Improved Learning via k-DTW: A Novel Dissimilarity Measure for Curves [48.84313029960523]
k$-Dynamic Time Warping(k$-DTW)と呼ばれる多角曲線に対する新しい相似性尺度を導入する。
$k$-DTW は Dynamic Time Warping (DTW) よりも強いメトリック特性を持ち、Fr'echet 距離よりも外れ値に対して堅牢である。
1+varepsilon)$-approximation algorithm for $k$-DTW。
論文 参考訳(メタデータ) (2025-05-29T13:25:45Z) - Learning with Norm Constrained, Over-parameterized, Two-layer Neural Networks [54.177130905659155]
近年の研究では、再生カーネルヒルベルト空間(RKHS)がニューラルネットワークによる関数のモデル化に適した空間ではないことが示されている。
本稿では,有界ノルムを持つオーバーパラメータ化された2層ニューラルネットワークに適した関数空間について検討する。
論文 参考訳(メタデータ) (2024-04-29T15:04:07Z) - Clustered Switchback Designs for Experimentation Under Spatio-temporal Interference [44.644520116360106]
我々は, 平均治療効果 (GATE) を推定し, 全単位を常に治療やコントロールに曝露した平均結果の差を推定した。
そこで我々は,単位をクラスタにグループ化し,時間ステップをブロックにグループ化する,クラスタ化されたスイッチバック設計を提案する。
良好なクラスタリングを許容するグラフに対して, トラッピングされたHorvitz-Thompson推定器が$tilde O(1/NT)$平均二乗誤差(MSE)を達成することを示す。
我々の結果は、citethu2022switchback、ugander2013graph、citetleung2022rateの結果を同時に一般化する。
論文 参考訳(メタデータ) (2023-12-25T01:00:58Z) - TIC-TAC: A Framework for Improved Covariance Estimation in Deep Heteroscedastic Regression [109.69084997173196]
奥行き回帰は、予測分布の平均と共分散を負の対数類似度を用いて共同最適化する。
近年の研究では, 共分散推定に伴う課題により, 準最適収束が生じる可能性が示唆されている。
1)予測共分散は予測平均のランダム性を真に捉えているか?
その結果, TICは共分散を正確に学習するだけでなく, 負の対数類似性の収束性の向上も促進することがわかった。
論文 参考訳(メタデータ) (2023-10-29T09:54:03Z) - Kernel-Based Tests for Likelihood-Free Hypothesis Testing [21.143798051525646]
2つのバランスの取れたクラスから$n$の観測が与えられたとき、追加の$m$入力をラベル付けするタスクを考える。
この問題の特別なケースはよく知られており、$m=1$はバイナリ分類に対応し、$mapprox n$は2サンプルテストに相当する。
最近の研究で、$m$と$n$の間に根本的なトレードオフがあることが判明した。
論文 参考訳(メタデータ) (2023-08-17T15:24:03Z) - Towards Faster Non-Asymptotic Convergence for Diffusion-Based Generative
Models [49.81937966106691]
我々は拡散モデルのデータ生成過程を理解するための非漸近理論のスイートを開発する。
従来の研究とは対照的に,本理論は基本的だが多目的な非漸近的アプローチに基づいて開発されている。
論文 参考訳(メタデータ) (2023-06-15T16:30:08Z) - Topology-aware Generalization of Decentralized SGD [91.59494285490784]
D-SGDの一般化性はスペクトルギャップと正の相関関係を示す。
我々の知る限り、これはD-SGDの一般化に関する最初の研究である。
論文 参考訳(メタデータ) (2022-06-25T16:03:48Z) - Dimension-agnostic inference using cross U-statistics [33.17951971728784]
本稿では,サンプル分割と自己正規化とともに,既存のテスト統計の変分表現を用いた手法を提案する。
結果の統計学は、縮退したU統計を慎重に修正し、対角ブロックを落とし、対角ブロックを外したままにすると見なすことができる。
論文 参考訳(メタデータ) (2020-11-10T12:21:34Z) - A Random Matrix Analysis of Random Fourier Features: Beyond the Gaussian
Kernel, a Precise Phase Transition, and the Corresponding Double Descent [85.77233010209368]
本稿では、データサンプルの数が$n$である現実的な環境で、ランダムフーリエ(RFF)回帰の正確さを特徴付けます。
この分析はまた、大きな$n,p,N$のトレーニングとテスト回帰エラーの正確な推定も提供する。
論文 参考訳(メタデータ) (2020-06-09T02:05:40Z) - Minimum optical depth multiport interferometers for approximating arbitrary unitary operations and pure states [37.69303106863453]
我々は、マルチポート干渉計を用いて、純状態の準備とユニタリ操作を与えられた不忠実さで近似する問題に対処する。
数値計算により、任意の次元$d$の純粋な状態が不忠実で作成できることが示される。
論文 参考訳(メタデータ) (2020-02-04T15:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。