論文の概要: Semantic Grounding Index: Geometric Bounds on Context Engagement in RAG Systems
- arxiv url: http://arxiv.org/abs/2512.13771v1
- Date: Mon, 15 Dec 2025 18:09:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.439903
- Title: Semantic Grounding Index: Geometric Bounds on Context Engagement in RAG Systems
- Title(参考訳): 意味的接地指数:RAGシステムにおける文脈エンゲージメントの幾何学的境界
- Authors: Javier Marín,
- Abstract要約: 質問に対する応答と文脈との角度距離の比として定義される意味的接地指数(SGI)を導入する。
幻覚応答は、回収された文脈に向けて出発するよりも、質問に対して角的に近づいたままである。
- 参考スコア(独自算出の注目度): 0.2538209532048866
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: When retrieval-augmented generation (RAG) systems hallucinate, what geometric trace does this leave in embedding space? We introduce the Semantic Grounding Index (SGI), defined as the ratio of angular distances from the response to the question versus the context on the unit hypersphere $\mathbb{S}^{d-1}$.Our central finding is \emph{semantic laziness}: hallucinated responses remain angularly proximate to questions rather than departing toward retrieved contexts. On HaluEval ($n$=5,000), we observe large effect sizes (Cohen's $d$ ranging from 0.92 to 1.28) across five embedding models with mean cross-model correlation $r$=0.85. Crucially, we derive from the spherical triangle inequality that SGI's discriminative power should increase with question-context angular separation $θ(q,c)$-a theoretical prediction confirmed empirically: effect size rises monotonically from $d$=0.61 -low $θ(q,c)$, to $d$=1.27 -high $θ(q,c)$, with AUC improving from 0.72 to 0.83. Subgroup analysis reveals that SGI excels on long responses ($d$=2.05) and short questions ($d$=1.22), while remaining robust across context lengths. Calibration analysis yields ECE=0.10, indicating SGI scores can serve as probability estimates, not merely rankings. A critical negative result on TruthfulQA (AUC=0.478) establishes that angular geometry measures topical engagement rather than factual accuracy. SGI provides computationally efficient, theoretically grounded infrastructure for identifying responses that warrant verification in production RAG deployments.
- Abstract(参考訳): 検索増強生成系(RAG)が幻覚する時、埋め込み空間に何の幾何学的痕跡が残るか?
問題に対する応答と単位超球面$\mathbb{S}^{d-1}$の文脈との角距離の比として定義されるセマンティックグラウンドリング指数(SGI)を導入する。
我々の中心的な発見は「emph{semantic laziness}」である。
HaluEval(n$=5,000)では、平均モデルの相関がr$=0.85である5つの埋め込みモデルに対して大きな効果(コーエンの$d$は0.92から1.28まで)を観測する。
重要なことに、SGIの識別力は、質問コンテキストの角分離で増加するべき球面三角形の不等式から導かれる$θ(q,c)$-理論的な予測が実証的に確認された: 効果の大きさは単調に$d$=0.61 -low $θ(q,c)$, $d$=1.27 -high $θ(q,c)$, $d$=1.27 -high $θ(q,c)$, with AUC improve to 0.72 to 0.83。
サブグループ分析によると、SGIは長い応答($d$=2.05)と短い質問($d$=1.22)に優れ、コンテキストの長さにわたって堅牢である。
キャリブレーション解析によりECE=0.10が得られ、SGIスコアが単なるランキングではなく確率推定として機能することを示している。
TruthfulQA (AUC=0.478) における批判的な負の結果は、角幾何学が事実の精度よりもトピックのエンゲージメントを測定することを証明している。
SGIは、実運用RAGデプロイメントにおける検証を保証する応答を特定するために、計算効率が良く理論的に基盤化されたインフラを提供する。
関連論文リスト
- Constant Stepsize Local GD for Logistic Regression: Acceleration by Instability [13.332982107151434]
我々は,任意の段数 $eta > 0$ を用いて,分離可能な異種データを用いたロジスティック回帰のための局所勾配 Descent の解析を行った。
我々の分析は、非常に大きなステップサイズによって不安定が引き起こされる、citewu2024largeの単一マシン解析と並行して行われる。
論文 参考訳(メタデータ) (2025-06-16T20:29:00Z) - Convergence Rate Analysis of LION [54.28350823319057]
LION は、勾配カルシュ=クーン=T (sqrtdK-)$で測定された $cal(sqrtdK-)$ の反復を収束する。
従来のSGDと比較して,LIONは損失が小さく,性能も高いことを示す。
論文 参考訳(メタデータ) (2024-11-12T11:30:53Z) - Measurement-induced phase transition for free fermions above one dimension [46.176861415532095]
自由フェルミオンモデルに対する$d>1$次元における測定誘起エンタングルメント相転移の理論を開発した。
臨界点は、粒子数と絡み合いエントロピーの第2累積のスケーリング$$elld-1 ln ell$でギャップのない位相を分離する。
論文 参考訳(メタデータ) (2023-09-21T18:11:04Z) - Topology-aware Generalization of Decentralized SGD [91.59494285490784]
D-SGDの一般化性はスペクトルギャップと正の相関関係を示す。
我々の知る限り、これはD-SGDの一般化に関する最初の研究である。
論文 参考訳(メタデータ) (2022-06-25T16:03:48Z) - Decentralized Sparse Linear Regression via Gradient-Tracking: Linear Convergence and Statistical Guarantees [23.256961881716595]
エージェントネットワーク上の疎線形回帰を非指向グラフとしてモデル化し,サーバノードを持たない。
分布予測勾配追跡に基づくアルゴリズムの収束率と統計的保証を解析する。
論文 参考訳(メタデータ) (2022-01-21T01:26:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。