論文の概要: HyEm: Query-Adaptive Hyperbolic Retrieval for Biomedical Ontologies via Euclidean Vector Indexing
- arxiv url: http://arxiv.org/abs/2604.09550v1
- Date: Mon, 26 Jan 2026 07:04:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-26 16:03:36.86737
- Title: HyEm: Query-Adaptive Hyperbolic Retrieval for Biomedical Ontologies via Euclidean Vector Indexing
- Title(参考訳): HyEm:ユークリッドベクトルインデクシングによる生物医学的オントロジーに対するクエリ適応型ハイパーボリック検索
- Authors: Ou Deng, Shoji Nishimura, Atsushi Ogihara, Qun Jin,
- Abstract要約: 本稿では,ハイパーボリック埋め込みを既存のユークリッドANNインフラに組み込む軽量検索層HyEmを提案する。
HyEm 94-98% のユークリッドベースライン性能をエンティティ中心のクエリ上で実証した。
- 参考スコア(独自算出の注目度): 3.362526994670267
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Retrieval-augmented generation (RAG) for biomedical knowledge faces a hierarchy-aware ontology grounding challenge: resources like HPO, DO, and MeSH use deep ``is-a" taxonomies, yet production stacks rely on Euclidean embeddings and ANN indexes. While hyperbolic embeddings suit hierarchical representation, they face two barriers: (i) lack of native vector database support, and (ii) risk of underperforming on entity-centric queries where hierarchy is irrelevant. We present HyEm, a lightweight retrieval layer integrating hyperbolic ontology embeddings into existing Euclidean ANN infrastructure. HyEm learns radius-controlled hyperbolic embeddings, stores origin log-mapped vectors in standard Euclidean databases for candidate retrieval, then applies exact hyperbolic reranking. A query-adaptive gate outputs continuous mixing weights, combining Euclidean semantic similarity with hyperbolic hierarchy distance at reranking time. Our bi-Lipschitz analysis under radius constraints provides practical guidance for ANN oversampling and dimensionality.Experiments on biomedical ontology subsets demonstrate HyEm preserves 94-98% of Euclidean baseline performance on entity-centric queries while substantially improving hierarchy-navigation and mixed-intent queries, maintaining indexability at moderate oversampling.
- Abstract(参考訳): HPO、DO、MeSHといったリソースは深い 'is-a' 分類を用いるが、生産スタックはユークリッドの埋め込みとANNインデックスに依存している。
双曲的埋め込みは階層的表現に適しているが、それらは2つの障壁に直面している。
(i)ネイティブベクターデータベースのサポートの欠如、
(II)階層構造が無関係なエンティティ中心のクエリでパフォーマンスが低下するリスク。
既存のユークリッドANNインフラにハイパーボリック・オントロジーを組み込んだ軽量検索層HyEmを提案する。
HyEmは半径制御された双曲埋め込みを学習し、元のログマップベクターを標準ユークリッドデータベースに格納して候補探索を行い、正確な双曲再ランクを適用する。
問合せ適応ゲートは連続混合重みを出力し、ユークリッド意味的類似性と再ランク時間における双曲的階層距離を結合する。
バイオメディカル・オントロジー・サブセットの実験では、HyEmは、エンティティ中心のクエリにおいてユークリッドのベースライン性能の94-98%を保ちながら、階層ナビゲーションと混合インテントクエリを大幅に改善し、中等なオーバーサンプリングにおけるインデックス可能性を維持している。
関連論文リスト
- Differentiable Geometric Indexing for End-to-End Generative Retrieval [32.54110566819413]
Generative Retrieval (GR) は単一の確率的フレームワーク内でインデックスと検索を統合するための有望なパラダイムとして登場した。
既存のアプローチは2つの本質的な対立に悩まされている。
本稿では,これらの誤りを解消するために,DGI(Dariable Geometric Indexing)を提案する。
論文 参考訳(メタデータ) (2026-03-11T04:46:42Z) - HypRAG: Hyperbolic Dense Retrieval for Retrieval Augmented Generation [30.711145880382286]
HyTE-FHとHyTE-Hは、事前訓練されたユークリッド埋め込みを双曲空間に投影する双曲表現である。
外向きアインシュタイン中間点(英: Outward Einstein Midpoint)は、階層構造を確実に保存する幾何学的なプーリング作用素である。
また,本分析により,ハイパボリック表現はノルムに基づく分離によって文書の特異性を符号化することが明らかとなった。
論文 参考訳(メタデータ) (2026-02-08T00:18:05Z) - HyperTopo-Adapters: Geometry- and Topology-Aware Segmentation of Leaf Lesions on Frozen Encoders [0.14323566945483493]
葉配列のセグメンテーションはトポロジーに敏感であり、小さなマージ、分裂、または偽の穴は生化学経路の有意義な記述である。
HyperTopo-Adaptersは、凍結した視覚エンコーダの上で訓練された軽量でパラメータ効率のよいヘッドだ。
初期の結果は、Kaggleのリーフ-レセオンデータセット上で境界とトポロジーのメトリクスが一貫した増加を示している。
論文 参考訳(メタデータ) (2025-12-29T04:27:26Z) - Hyperbolic Residual Quantization: Discrete Representations for Data with Latent Hierarchies [48.72319569157807]
残留量子化(Residual Quantization, RQ)は階層データに対する離散的マルチトークン表現を生成するために広く用いられている。
本稿では,双曲多様体にデータを埋め込むハイパーボリック残留量子化(HRQ)を提案する。
HRQは、自然に階層的な分岐と整合する帰納的バイアスを与える。
論文 参考訳(メタデータ) (2025-05-18T13:14:07Z) - Hyperbolic Category Discovery [12.654574453480635]
Generalized Category Discovery (GCD) は、既知のクラスや未知のクラスに属するかに関わらず、未ラベルのサブセット内のすべてのイメージを分類することを目的としている。
GCDのための階層認識表現と分類器を学習するためのハイパーボリックフレームワークを提案する。
論文 参考訳(メタデータ) (2025-04-08T15:12:33Z) - From Semantics to Hierarchy: A Hybrid Euclidean-Tangent-Hyperbolic Space Model for Temporal Knowledge Graph Reasoning [1.1372536310854844]
時間的知識グラフ(TKG)推論は、過去のデータに基づいて将来の出来事を予測する。
既存のユークリッドモデルはセマンティクスを捉えるのに優れているが、階層構造に苦しむ。
ユークリッドモデルと双曲モデルの両方の強みを利用する新しいハイブリッド幾何空間アプローチを提案する。
論文 参考訳(メタデータ) (2024-08-30T10:33:08Z) - Semi-Parametric Retrieval via Binary Bag-of-Tokens Index [71.78109794895065]
SemI-parametric Disentangled Retrieval (SiDR)は、ニューラルパラメータから検索インデックスを分離するバイエンコーダ検索フレームワークである。
SiDRは、検索のための非パラメトリックトークン化インデックスをサポートし、BM25のようなインデックス化の複雑さを著しく改善した。
論文 参考訳(メタデータ) (2024-05-03T08:34:13Z) - HRCF: Enhancing Collaborative Filtering via Hyperbolic Geometric
Regularization [52.369435664689995]
HRCF (textitHyperbolic Regularization powered Collaborative Filtering) を導入し,幾何認識型双曲正規化器を設計する。
具体的には、ルートアライメントとオリジン認識ペナルティによる最適化手順を強化する。
提案手法は,双曲的凝集による過度な平滑化問題に対処でき,モデルの識別能力も向上する。
論文 参考訳(メタデータ) (2022-04-18T06:11:44Z) - Adaptive Linear Span Network for Object Skeleton Detection [56.78705071830965]
本研究では,適応線形スパンネットワーク(AdaLSN)を提案する。
AdaLSNは、精度とレイテンシのトレードオフを著しく高めることで、その汎用性を裏付ける。
また、エッジ検出や道路抽出といったイメージ・ツー・マスクのタスクに適用可能であることも示している。
論文 参考訳(メタデータ) (2020-11-08T12:51:14Z) - Joint and Progressive Subspace Analysis (JPSA) with Spatial-Spectral
Manifold Alignment for Semi-Supervised Hyperspectral Dimensionality Reduction [48.73525876467408]
本稿では,超スペクトル部分空間解析のための新しい手法を提案する。
この手法はジョイント・アンド・プログレッシブ・サブスペース分析(JPSA)と呼ばれる。
2つの広帯域超スペクトルデータセットに対して提案したJPSAの優位性と有効性を示す実験を行った。
論文 参考訳(メタデータ) (2020-09-21T16:29:59Z) - Simple and Effective Prevention of Mode Collapse in Deep One-Class
Classification [93.2334223970488]
深部SVDDにおける超球崩壊を防止するための2つの正則化器を提案する。
第1の正則化器は、標準のクロスエントロピー損失によるランダムノイズの注入に基づいている。
第2の正規化器は、小さすぎるとミニバッチ分散をペナライズする。
論文 参考訳(メタデータ) (2020-01-24T03:44:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。