論文の概要: Contextual Tokenization for Graph Inverted Indices
- arxiv url: http://arxiv.org/abs/2510.22479v1
- Date: Sun, 26 Oct 2025 01:38:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-28 19:54:32.522423
- Title: Contextual Tokenization for Graph Inverted Indices
- Title(参考訳): グラフ反転指標の文脈的トークン化
- Authors: Pritish Chakraborty, Indradyumna Roy, Soumen Chakrabarti, Abir De,
- Abstract要約: CORGIIは、効率的な逆リストへの離散トークンマッピングを用いた高密度グラフ表現のインデクサである。
私たちは、グラフ上のトークン'の古典的で固定されたインパクトウェイトを、データ駆動でトレーニング可能なインパクトウェイトで置き換えます。
我々の知る限り、CORGIIは効率的な逆リストへの離散トークンマッピングを用いた高密度グラフ表現の最初のインデクサである。
- 参考スコア(独自算出の注目度): 38.641973640693585
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieving graphs from a large corpus, that contain a subgraph isomorphic to a given query graph, is a core operation in many real-world applications. While recent multi-vector graph representations and scores based on set alignment and containment can provide accurate subgraph isomorphism tests, their use in retrieval remains limited by their need to score corpus graphs exhaustively. We introduce CORGII (Contextual Representation of Graphs for Inverted Indexing), a graph indexing framework in which, starting with a contextual dense graph representation, a differentiable discretization module computes sparse binary codes over a learned latent vocabulary. This text document-like representation allows us to leverage classic, highly optimized inverted indices, while supporting soft (vector) set containment scores. Pushing this paradigm further, we replace the classical, fixed impact weight of a `token' on a graph (such as TFIDF or BM25) with a data-driven, trainable impact weight. Finally, we explore token expansion to support multi-probing the index for smoother accuracy-efficiency tradeoffs. To our knowledge, CORGII is the first indexer of dense graph representations using discrete tokens mapping to efficient inverted lists. Extensive experiments show that CORGII provides better trade-offs between accuracy and efficiency, compared to several baselines.
- Abstract(参考訳): 与えられたクエリグラフに同型な部分グラフを含む大きなコーパスからグラフを取得することは、多くの実世界のアプリケーションにおいて中核的な操作である。
最近の多ベクトルグラフ表現と集合アライメントと包含に基づくスコアは、正確な部分グラフ同型テストを提供することができるが、その検索における使用は、コーパスグラフを徹底的にスコアする必要性によって制限されている。
グラフインデックス化フレームワークであるCORGII(Contextual Representation of Graphs for Inverted Indexing)を導入し、文脈密度グラフ表現から始めると、識別可能な離散化モジュールが学習された潜在語彙上でスパースバイナリコードを演算する。
このテキスト文書のような表現は、ソフト(ベクター)セットの保持スコアをサポートしながら、古典的で高度に最適化された逆インデックスを活用できます。
このパラダイムをさらに推し進めると、グラフ上の'token'(TFIDFやBM25など)の古典的で固定された衝撃重みを、データ駆動でトレーニング可能な衝撃重みに置き換えます。
最後に、よりスムーズな精度と効率のトレードオフのためのインデックスの多重化を支援するトークン拡張について検討する。
我々の知る限り、CORGIIは効率的な逆リストへの離散トークンマッピングを用いた高密度グラフ表現の最初のインデクサである。
大規模な実験により、CORGIIはいくつかのベースラインに比べて精度と効率のトレードオフが優れていることが示された。
関連論文リスト
- A Flexible, Equivariant Framework for Subgraph GNNs via Graph Products and Graph Coarsening [18.688057947275112]
サブグラフGNNはグラフをサブグラフの集合として表現することで、メッセージパッシングGNNの表現性を高める。
以前のアプローチでは、ランダムまたは学習可能なサンプリングによって、サブグラフの小さなサブセットを生成する試みがあった。
本稿では,これらの問題に対処する新しいSubgraph GNNフレームワークを提案する。
論文 参考訳(メタデータ) (2024-06-13T16:29:06Z) - Discrete Graph Auto-Encoder [52.50288418639075]
離散グラフオートエンコーダ(DGAE)という新しいフレームワークを導入する。
まず、置換同変オートエンコーダを用いてグラフを離散潜在ノード表現の集合に変換する。
2番目のステップでは、離散潜在表現の集合をソートし、特別に設計された自己回帰モデルを用いてそれらの分布を学習する。
論文 参考訳(メタデータ) (2023-06-13T12:40:39Z) - Seq-HGNN: Learning Sequential Node Representation on Heterogeneous Graph [57.2953563124339]
本稿では,シーケンシャルノード表現,すなわちSeq-HGNNを用いた新しい異種グラフニューラルネットワークを提案する。
Heterogeneous Graph Benchmark (HGB) と Open Graph Benchmark (OGB) の4つの広く使われているデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2023-05-18T07:27:18Z) - NESS: Node Embeddings from Static SubGraphs [0.0]
本稿では,グラフオートエンコーダ(GAE)を用いて静的サブグラフ(NESS)からノード埋め込みをトランスダクティブに学習するフレームワークを提案する。
NESSは2つの主要なアイデアに基づいている。 i) トレーニンググラフをデータ前処理中にランダムなエッジ分割を使用して、重複しないエッジを持つ複数の静的でスパースなサブグラフに分割する。
我々はNESSがリンク予測タスクに対して、グラフ全体またはサブグラフのいずれかを使用する現在の自動符号化手法と比較して、より良いノード表現を提供することを示した。
論文 参考訳(メタデータ) (2023-03-15T22:14:28Z) - Learning to Count Isomorphisms with Graph Neural Networks [16.455234748896157]
グラフ上の部分グラフ同型カウントは重要な問題である。
本稿では,グラフアイソモーフィズムカウントのための新しいグラフニューラルネットワークであるCount-GNNを提案する。
論文 参考訳(メタデータ) (2023-02-07T05:32:11Z) - FactGraph: Evaluating Factuality in Summarization with Semantic Graph
Representations [114.94628499698096]
文書と要約を構造化された意味表現(MR)に分解するFactGraphを提案する。
MRは、コアセマンティックの概念とその関係を記述し、文書と要約の両方の主要な内容を標準形式で集約し、データの疎結合を減少させる。
事実性を評価するための異なるベンチマークの実験では、FactGraphは以前のアプローチよりも最大15%優れていた。
論文 参考訳(メタデータ) (2022-04-13T16:45:33Z) - Interactive Visual Pattern Search on Graph Data via Graph Representation
Learning [20.795511688640296]
視覚分析システムGraphQは、ループ内、サンプルベース、サブグラフパターン検索をサポートする。
高速で対話的なクエリをサポートするために、グラフニューラルネットワーク(GNN)を使用して、グラフを固定長潜在ベクトル表現としてエンコードする。
また,NuroAlignと呼ばれるノードアライメントのための新しいGNNを提案し,クエリ結果の検証と解釈を容易にする。
論文 参考訳(メタデータ) (2022-02-18T22:30:28Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Accurate Learning of Graph Representations with Graph Multiset Pooling [45.72542969364438]
本稿では,その構造的依存関係に応じてノード間の相互作用をキャプチャするグラフマルチセットトランス (GMT) を提案する。
実験の結果,GMTはグラフ分類ベンチマークにおいて,最先端のグラフプーリング法を著しく上回っていることがわかった。
論文 参考訳(メタデータ) (2021-02-23T07:45:58Z) - Graph Pooling with Node Proximity for Hierarchical Representation
Learning [80.62181998314547]
本稿では,ノード近接を利用したグラフプーリング手法を提案し,そのマルチホップトポロジを用いたグラフデータの階層的表現学習を改善する。
その結果,提案したグラフプーリング戦略は,公開グラフ分類ベンチマークデータセットの集合において,最先端のパフォーマンスを達成できることが示唆された。
論文 参考訳(メタデータ) (2020-06-19T13:09:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。