論文の概要: Geodesic Semantic Search: Learning Local Riemannian Metrics for Citation Graph Retrieval
- arxiv url: http://arxiv.org/abs/2602.23665v1
- Date: Fri, 27 Feb 2026 04:17:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-02 19:48:24.24648
- Title: Geodesic Semantic Search: Learning Local Riemannian Metrics for Citation Graph Retrieval
- Title(参考訳): Geodesic Semantic Search: Citation Graph Retrievalのための局所リーマン計量の学習
- Authors: Brandon Yee, Lucas Wang, Kundana Kommini, Krishna Sharma,
- Abstract要約: gss はローランク計量テンソル $mL_i を各ノードの Rd 倍 r$ で学習し、局所正の半定計量 $mG_i mL_itop + eps mI$ を誘導する。
169Kの論文による引用予測ベンチマークでは、gssはSPECTER+FAISSベースラインに対するRecall@20の相対的な改善を23%達成している。
k平均プールによる階層的粗粒度探索は計算コストを4$times$比較する
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present Geodesic Semantic Search (GSS), a retrieval system that learns node-specific Riemannian metrics on citation graphs to enable geometry-aware semantic search. Unlike standard embedding-based retrieval that relies on fixed Euclidean distances, \gss{} learns a low-rank metric tensor $\mL_i \in \R^{d \times r}$ at each node, inducing a local positive semi-definite metric $\mG_i = \mL_i \mL_i^\top + \eps \mI$. This parameterization guarantees valid metrics while keeping the model tractable. Retrieval proceeds via multi-source Dijkstra on the learned geodesic distances, followed by Maximal Marginal Relevance reranking and path coherence filtering. On citation prediction benchmarks with 169K papers, \gss{} achieves 23\% relative improvement in Recall@20 over SPECTER+FAISS baselines while providing interpretable citation paths. Our hierarchical coarse-to-fine search with k-means pooling reduces computational cost by 4$\times$ compared to flat geodesic search while maintaining 97\% retrieval quality. We provide theoretical analysis of when geodesic distances outperform direct similarity, characterize the approximation quality of low-rank metrics, and validate predictions empirically. Code and trained models are available at https://github.com/YCRG-Labs/geodesic-search.
- Abstract(参考訳): 提案するGeodesic Semantic Search(GSS)は,引用グラフ上のノード固有リーマン測度を学習して,幾何学的意味探索を可能にする検索システムである。
固定ユークリッド距離に依存する標準的な埋め込みベースの検索とは異なり、 \gss{} は各ノードでローランク計量テンソル $\mL_i \in \R^{d \times r}$ を学習し、局所正半定計量 $\mG_i = \mL_i \mL_i^\top + \eps \mI$ を誘導する。
このパラメータ化は、モデルをトラクタブルに保ちながら有効なメトリクスを保証する。
Retrievalは、学習された測地線距離でマルチソースのDijkstraを経由して進行し、次いでMaximal Marginal Relevanceが再ランクされ、パスコヒーレンスフィルタリングが続く。
169Kの論文による引用予測ベンチマークでは、 \gss{} は解釈可能な引用パスを提供しながら、SPECTER+FAISSベースラインに対する Recall@20 の相対的な改善を 23 % 達成している。
k平均プールによる階層的粗大な探索は,99%の検索品質を維持しつつ,平坦な測地探索と比較して計算コストを4$\times$に削減する。
測地線距離が直接類似性を上回った場合の理論解析を行い、低ランクメトリクスの近似品質を特徴付けるとともに、経験的に予測を検証する。
コードとトレーニングされたモデルはhttps://github.com/YCRG-Labs/geodesic-searchで入手できる。
関連論文リスト
- Riemannian Zeroth-Order Gradient Estimation with Structure-Preserving Metrics for Geodesically Incomplete Manifolds [57.179679246370114]
測地的に完備な測度を構築し、新しい測度の下での静止点が元の測度の下で定常であることを保証する。
構成された計量$g'$の下の$-固定点もまた、元の計量$g'$の下の$-定常点に対応する。
実用的なメッシュ最適化タスクの実験は、測地的完全性がない場合でも、我々のフレームワークが安定した収束を維持することを示した。
論文 参考訳(メタデータ) (2026-01-12T22:08:03Z) - MCGI: Manifold-Consistent Graph Indexing for Billion-Scale Disk-Resident Vector Search [0.9179857807576733]
MCGIは、探索戦略をデータ固有の幾何学に適応させる幾何学的・ディスクレジデントインデックス法である。
MCGIは5.8$times$高スループットを高次元GIST1Mでの95%リコールで達成し、最先端のDiskANNと比較した。
数十億ドル規模のSIFT1Bデータセット上では、MCGIは、標準の低次元データセットにおけるパフォーマンスの同等性を保ちながら、ハイリコールクエリレイテンシを3$times$に削減することで、そのスケーラビリティをさらに検証する。
論文 参考訳(メタデータ) (2026-01-05T09:23:48Z) - Fast $k$-means clustering in Riemannian manifolds via Fréchet maps: Applications to large-dimensional SPD matrices [4.958499383330019]
鍵となるイノベーションは、$p$-Fréchet map $Fp : MathcalM to mathbbRell$である。
ユークリッド空間における$Fp$の数学的性質を厳密に解析する。
本手法は, 固有多様体に基づく手法と比較して, 実行時間を最大2桁削減する。
論文 参考訳(メタデータ) (2025-11-12T05:28:31Z) - Infinity Search: Approximate Vector Search with Projections on q-Metric Spaces [94.12116458306916]
我々は、$q$の測度空間において、計量木は三角形の不等式のより強いバージョンを活用でき、正確な探索の比較を減らすことができることを示した。
任意の異方性測度を持つデータセットを$q$-metric空間に埋め込む新しい射影法を提案する。
論文 参考訳(メタデータ) (2025-06-06T22:09:44Z) - Don't Get Lost in the Trees: Streamlining LLM Reasoning by Overcoming Tree Search Exploration Pitfalls [83.89771461061903]
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
検証者による木探索アルゴリズムの最近の進歩は、大規模言語モデル(LLM)の推論能力を大幅に向上させた。
意味論的に等価なコンテンツを持つ冗長な状態による$textitover-Exploration$と、検証器のスコアリングにおける高いばらつきに起因する$textitunder-Exploration$である。
各種木探索アルゴリズムに適合するフレキシブルなプラグアンドプレイシステムであるFETCHを提案する。
論文 参考訳(メタデータ) (2025-02-16T16:12:01Z) - Neural network learns low-dimensional polynomials with SGD near the information-theoretic limit [75.4661041626338]
単一インデックス対象関数 $f_*(boldsymbolx) = textstylesigma_*left(langleboldsymbolx,boldsymbolthetarangleright)$ の勾配勾配勾配学習問題について検討する。
SGDに基づくアルゴリズムにより最適化された2層ニューラルネットワークは、情報指数に支配されない複雑さで$f_*$を学習する。
論文 参考訳(メタデータ) (2024-06-03T17:56:58Z) - Revisiting Evaluation Metrics for Semantic Segmentation: Optimization
and Evaluation of Fine-grained Intersection over Union [113.20223082664681]
そこで本研究では,mIoUsの微細化と,それに対応する最悪の指標を提案する。
これらのきめ細かいメトリクスは、大きなオブジェクトに対するバイアスの低減、よりリッチな統計情報、モデルとデータセット監査に関する貴重な洞察を提供する。
ベンチマークでは,1つの測定値に基づかないことの必要性を強調し,微細なmIoUsが大きな物体への偏りを減少させることを確認した。
論文 参考訳(メタデータ) (2023-10-30T03:45:15Z) - Towards Multiple References Era -- Addressing Data Leakage and Limited
Reference Diversity in NLG Evaluation [55.92852268168816]
BLEUやchrFのようなN-gramマッチングに基づく評価指標は、自然言語生成(NLG)タスクで広く利用されている。
近年の研究では、これらのマッチングベースの指標と人間の評価との間には弱い相関関係が示されている。
本稿では,これらの指標と人的評価の整合性を高めるために,テキストマルチプル参照を利用することを提案する。
論文 参考訳(メタデータ) (2023-08-06T14:49:26Z) - Identifying latent distances with Finslerian geometry [6.0188611984807245]
生成モデルにより、データ空間と測地学は最も非現実的であり、操作が不可能である。
本研究では,引き戻し距離の期待値が明示的に最小となる別の測度を提案する。
高次元では、どちらの測度も$Oleft(frac1Dright)$の速度で収束することが証明される。
論文 参考訳(メタデータ) (2022-12-20T05:57:27Z) - Parametric Classification for Generalized Category Discovery: A Baseline
Study [70.73212959385387]
Generalized Category Discovery (GCD)は、ラベル付きサンプルから学習した知識を用いて、ラベルなしデータセットで新しいカテゴリを発見することを目的としている。
パラメトリック分類器の故障を調査し,高品質な監視が可能であった場合の過去の設計選択の有効性を検証し,信頼性の低い疑似ラベルを重要課題として同定する。
エントロピー正規化の利点を生かし、複数のGCDベンチマークにおける最先端性能を実現し、未知のクラス数に対して強いロバスト性を示す、単純で効果的なパラメトリック分類法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:47:11Z) - Towards Meta-learned Algorithm Selection using Implicit Fidelity
Information [13.750624267664156]
IMFASは、計算コストの低い任意のメタ機能によって容易に豊かになる情報的ランドマークを生産する。
テスト期間中に、ほぼ半分の忠実度シーケンスでSuccessive Halvingを破ることができることを示す。
論文 参考訳(メタデータ) (2022-06-07T09:14:24Z) - A metric on directed graphs and Markov chains based on hitting
probabilities [0.0]
エルゴード的、有限状態、時間均質なマルコフ連鎖の状態空間に関する計量を導入する。
提案手法は,あるノードから別のノードへのランダムウォーカーの移動に伴う距離空間の近さを仮定して構築した。
特に、私たちのメトリクスは、最も短くて平均的な歩行距離に敏感であり、既存のメトリクスと比較して新しい情報を与えます。
論文 参考訳(メタデータ) (2020-06-25T15:25:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。