論文の概要: GATHER: Convergence-Centric Hyper-Entity Retrieval for Zero-Shot Cell-Type Annotation
- arxiv url: http://arxiv.org/abs/2605.06403v1
- Date: Thu, 07 May 2026 15:11:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.93441
- Title: GATHER: Convergence-Centric Hyper-Entity Retrieval for Zero-Shot Cell-Type Annotation
- Title(参考訳): GATHER:zero-Shot cell-type Annotationのための収束中心ハイパーエンティティ検索
- Authors: Zhonghui Zhang, Feng Jiang, Shaowei Qin, Jiahao Zhao, Min Yang,
- Abstract要約: ゼロショット単細胞細胞型アノテーションは、与えられた発現された遺伝子のセットから細胞の種類を訓練なしで決定することを目的としている。
既存の知識グラフに基づくRAGアプローチは、情報源から拡張することで証拠を回収する。
本稿では,ハイパーエンタリティクエリに適した収束中心のレトリバーであるGATHERを提案する。
- 参考スコア(独自算出の注目度): 15.557353868200687
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Zero-shot single-cell cell-type annotation aims to determine a cell's type from a given set of expressed genes without any training. Existing knowledge-graph-based RAG approaches retrieve evidence by expanding from source entities and relying on iterative LLM reasoning. However, in this setting each query contains tens to hundreds of genes, where no single gene is decisive and the label emerges only from their collective co-occurrence. Such hyper-entity queries fundamentally challenge local, entity-wise exploration strategies, which reason from individual genes, leading to poor scalability and substantial LLM cost. We propose GATHER (Graph-Aware Traversal with Hyper-Entity Retrieval), a convergence-centric retriever tailored to hyper-entity queries. It performs global multi-source graph traversal and identifies topological convergence points -- nodes jointly reachable from many input genes. These convergence nodes act as high-information hyper-entities that capture entity synergy. By incorporating node- and path-importance scoring, GATHER selects informative evidence entirely without LLM involvement during retrieval. Instantiated on a self-constructed cell-centric biological knowledge graph (VCKG), GATHER outperforms strong KG-RAG baselines (ToG, ToG-2, RoG, PoG) on two datasets (Immune and Lung), achieving the highest exact-match accuracy (27.45% and 59.64%) with only a single LLM call per sample, compared to 2--61 calls for KG-RAG baselines. Our results demonstrate that convergence nodes compress multi-entity signals into compact, high-information evidence that conveys more per item than multi-hop paths, providing an efficient global alternative to local entity-wise reasoning.
- Abstract(参考訳): ゼロショット単細胞細胞型アノテーションは、与えられた発現された遺伝子のセットから細胞の種類を訓練なしで決定することを目的としている。
既存の知識グラフに基づくRAGアプローチは、ソースエンティティから拡張し、反復LSM推論に依存することによって証拠を検索する。
しかし、この設定では、各クエリには数十から数百の遺伝子が含まれており、単一の遺伝子は決定的ではなく、ラベルはその集団的共起からのみ現れる。
このようなハイパーエンタリティクエリは、個々の遺伝子から引き起こされる局所的、エンティティワイドな探索戦略に基本的に挑戦し、スケーラビリティが低下し、LLMコストが大幅に低下する。
本稿では,ハイパーエンタリティクエリに適した収束中心のレトリバーであるGATHER(Graph-Aware Traversal with Hyper-Entity Retrieval)を提案する。
グローバルなマルチソースグラフトラバーサルを実行し、多くの入力遺伝子から連続して到達可能なトポロジ的収束点を識別する。
これらの収束ノードは、エンティティのシナジーを捉える高情報ハイパーエンティティとして機能する。
GATHERは、ノードとパスの重要度スコアを組み込むことにより、検索中にLLMが関与することなく、情報的証拠を完全に選択する。
自己構築された細胞中心の生物学的知識グラフ(VCKG)に基づいて、GATHERは強力なKG-RAGベースライン(ToG、ToG-2、RoG、PoG)を2つのデータセット(Immune、Lung)で上回り、KG-RAGベースラインに対する2-61の呼び出しに比べて最高精度(27.45%、59.64%)を達成する。
コンバージェンスノードは,マルチホップパスよりもアイテムあたりの情報を伝達する,コンパクトで高情報な証拠に圧縮し,局所的なエンティティワイド推論に代わる効率的なグローバルな代替手段を提供することを示した。
関連論文リスト
- HELP: HyperNode Expansion and Logical Path-Guided Evidence Localization for Accurate and Efficient GraphRAG [53.30561659838455]
大きな言語モデル(LLM)は、しばしば固有の知識境界と幻覚に苦しむ。
Retrieval-Augmented Generation (RAG) は、マルチホップ推論に不可欠な構造的相互依存性をしばしば見落としている。
ヘルプは、複数の単純でマルチホップなQAベンチマークで競合性能を達成し、グラフベースのRAGベースラインよりも28.8$times$のスピードアップを実現している。
論文 参考訳(メタデータ) (2026-02-24T14:05:29Z) - EcphoryRAG: Re-Imagining Knowledge-Graph RAG via Human Associative Memory [0.0]
本稿では,エンティティ中心の知識グラフRAGフレームワークであるEcphoryRAGを紹介する。
インデックス作成中、EcphoryRAGは対応するメタデータを持つコアエンティティのみを抽出し、格納する。
検索には、まずクエリからキューエンティティを抽出し、スケーラブルなマルチホップ連想検索を実行する。
論文 参考訳(メタデータ) (2025-10-10T03:07:27Z) - Divide-Then-Rule: A Cluster-Driven Hierarchical Interpolator for Attribute-Missing Graphs [51.13363550716544]
ディープグラフクラスタリングは、不完全な属性を持つノードを異なるクラスタに分割することを目的とした教師なしのタスクである。
既存の属性欠落グラフの計算法は、ノード近傍で利用可能な情報の量が異なることを説明できないことが多い。
この問題に対処するために、DTRGC(Divide-Then-Rule Graph Completion)を提案する。
論文 参考訳(メタデータ) (2025-07-12T03:33:19Z) - Clue-RAG: Towards Accurate and Cost-Efficient Graph-based RAG via Multi-Partite Graph and Query-Driven Iterative Retrieval [15.599544326509436]
Retrieval-Augmented Generation (RAG) は、しばしばグラフ構造化データから外部情報を統合することで制限に対処する。
本稿では,マルチパーティグラフインデックスとクエリ駆動反復検索戦略を導入した新しいアプローチであるClue-RAGを提案する。
3つのQAベンチマークの実験により、Clue-RAGは最先端のベースラインを著しく上回っている。
論文 参考訳(メタデータ) (2025-07-11T09:36:45Z) - Divide by Question, Conquer by Agent: SPLIT-RAG with Question-Driven Graph Partitioning [62.640169289390535]
SPLIT-RAGは、質問駆動セマンティックグラフ分割と協調サブグラフ検索による制限に対処するマルチエージェントRAGフレームワークである。
革新的なフレームワークは、まずリンク情報のセマンティック分割を作成し、次にタイプ特化知識ベースを使用してマルチエージェントRAGを実現する。
属性対応グラフセグメンテーションは、知識グラフを意味的に一貫性のあるサブグラフに分割し、サブグラフが異なるクエリタイプと整合することを保証する。
階層的なマージモジュールは、論理的検証を通じて、部分グラフ由来の解答間の矛盾を解消する。
論文 参考訳(メタデータ) (2025-05-20T06:44:34Z) - ScaleGNN: Towards Scalable Graph Neural Networks via Adaptive High-order Neighboring Feature Fusion [73.85920403511706]
スケーラブルで効果的なグラフ学習のためのマルチホップノード機能を適応的に融合する新しいフレームワークであるScaleGNNを提案する。
予測精度と計算効率の両面で,ScaleGNNは最先端のGNNよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2025-04-22T14:05:11Z) - Hypergraph Neural Networks Reveal Spatial Domains from Single-cell Transcriptomics Data [0.0]
空間的クラスタリングは、組織サンプルを細胞の様々なサブ集団に分類するために重要である。
ILISIスコアは,他の手法と比較して1.843と高い結果が得られた。
我々のモデルは下流クラスタリングにおいて他の手法よりも優れており、最高ARI値は0.51、スコアは0.60である。
論文 参考訳(メタデータ) (2024-10-23T23:32:50Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - UniKG: A Benchmark and Universal Embedding for Large-Scale Knowledge
Graphs [19.13467673464939]
我々はWikidataからUniKGという大規模な異種グラフベンチマークデータセットを構築した。
UniKGには7700万以上のマルチ属性エンティティと2000の多様なアソシエーションタイプが含まれている。
本稿では, 効率的なマルチホップ異方性伝搬カーネルを学習するための, プラグアンドプレイ異方性伝搬モジュール (APM) を提案する。
論文 参考訳(メタデータ) (2023-09-11T06:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。