論文の概要: CITE: A Comprehensive Benchmark for Heterogeneous Text-Attributed Graphs on Catalytic Materials
- arxiv url: http://arxiv.org/abs/2508.15392v1
- Date: Thu, 21 Aug 2025 09:28:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-22 16:26:46.264778
- Title: CITE: A Comprehensive Benchmark for Heterogeneous Text-Attributed Graphs on Catalytic Materials
- Title(参考訳): CITE: 触媒材料上の不均一テキスト分散グラフの総合ベンチマーク
- Authors: Chenghao Zhang, Qingqing Long, Ludi Wang, Wenjuan Cui, Jianjun Yu, Yi Du,
- Abstract要約: 触媒材料に対する不均一なテキスト分散引用グラフベンチマークであるCITEを紹介する。
CITEは438Kノードと1.2Mエッジで構成され、4つのリレーショナルタイプにまたがる。
我々は,同種グラフモデル,異種グラフモデル,LLM(Large Language Model)中心モデル,LLM+Graphモデルなど,学習パラダイムの4つのクラスを比較した。
- 参考スコア(独自算出の注目度): 7.08105954189442
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Text-attributed graphs(TAGs) are pervasive in real-world systems,where each node carries its own textual features. In many cases these graphs are inherently heterogeneous, containing multiple node types and diverse edge types. Despite the ubiquity of such heterogeneous TAGs, there remains a lack of large-scale benchmark datasets. This shortage has become a critical bottleneck, hindering the development and fair comparison of representation learning methods on heterogeneous text-attributed graphs. In this paper, we introduce CITE - Catalytic Information Textual Entities Graph, the first and largest heterogeneous text-attributed citation graph benchmark for catalytic materials. CITE comprises over 438K nodes and 1.2M edges, spanning four relation types. In addition, we establish standardized evaluation procedures and conduct extensive benchmarking on the node classification task, as well as ablation experiments on the heterogeneous and textual properties of CITE. We compare four classes of learning paradigms, including homogeneous graph models, heterogeneous graph models, LLM(Large Language Model)-centric models, and LLM+Graph models. In a nutshell, we provide (i) an overview of the CITE dataset, (ii) standardized evaluation protocols, and (iii) baseline and ablation experiments across diverse modeling paradigms.
- Abstract(参考訳): テキスト分散グラフ(TAG)は実世界のシステムで広く普及しており、各ノードには独自のテキスト機能がある。
多くの場合、これらのグラフは本質的に不均一であり、複数のノードタイプと多様なエッジタイプを含む。
このような異種TAGの普及にもかかわらず、大規模なベンチマークデータセットが不足している。
この不足は重要なボトルネックとなり、不均一なテキスト属性グラフ上での表現学習手法の開発と公正な比較を妨げている。
本稿では,触媒材料を対象とした異種テキスト分散引用グラフベンチマークCITE - Catalytic Information Textual Entities Graphを紹介する。
CITEは438Kノードと1.2Mエッジで構成され、4つのリレーショナルタイプにまたがる。
さらに、我々は標準化された評価手順を確立し、ノード分類タスクの広範なベンチマークを行い、CITEの不均一性およびテキスト特性に関するアブレーション実験を行った。
我々は,同種グラフモデル,異種グラフモデル,LLM(Large Language Model)中心モデル,LLM+Graphモデルなど,学習パラダイムの4つのクラスを比較した。
簡単に言えば、私たちは
i) CITEデータセットの概要
(ii)標準化された評価プロトコル、及び
3) 多様なモデリングパラダイムにわたるベースラインおよびアブレーション実験。
関連論文リスト
- H$^2$GFM: Towards unifying Homogeneity and Heterogeneity on Text-Attributed Graphs [6.601515580215021]
H$2$GFM は HoTAG と HeTAG の両方にまたがって一般化するために設計された新しいフレームワークである。
我々のモデルは、統一テキスト空間下でのグラフ間の多様なメタ関係を計画する。
グラフ型間の構造パターンの不均一性を捉えるために,CGT専門家の混在を用いる。
論文 参考訳(メタデータ) (2025-06-10T00:03:56Z) - HeTGB: A Comprehensive Benchmark for Heterophilic Text-Attributed Graphs [38.79574338268996]
グラフニューラルネットワーク(GNN)は、ホモフィリーを前提とした関係データのモデリングに成功している。
多くの実世界のグラフはヘテロフィリーを示し、連結ノードは異なるカテゴリに属したり、多様な属性を持つ。
Heterophilic Text-attributed Graph Benchmark (HeTGB) は、多様なドメインから5つの実世界の異種グラフデータセットからなる新しいベンチマークである。
論文 参考訳(メタデータ) (2025-03-05T02:00:32Z) - When Heterophily Meets Heterogeneity: Challenges and a New Large-Scale Graph Benchmark [18.253578434782103]
大規模ノード分類グラフベンチマークであるH2GBを導入する。
これは、実世界のグラフのヘテロフィリー性質とヘテロフィリー性質の両方の複雑さを結合させる。
また、この挑戦的なベンチマークで優れているモデルであるH2G-formerを新たに提案する。
論文 参考訳(メタデータ) (2024-07-15T17:18:42Z) - The Heterophilic Graph Learning Handbook: Benchmarks, Models, Theoretical Analysis, Applications and Challenges [101.83124435649358]
ホモフィリ原理では、同じラベルや類似属性を持つieノードが接続される可能性が高い。
最近の研究で、GNNのパフォーマンスとNNのパフォーマンスが満足できない非自明なデータセットが特定されている。
論文 参考訳(メタデータ) (2024-07-12T18:04:32Z) - A Survey on Learning from Graphs with Heterophily: Recent Advances and Future Directions [35.544281678888986]
連結ノードが異なるラベルや異種特徴を持つ傾向があるヘテロ親和性グラフは、最近大きな注目を集めている。
さまざまなグラフヘテロフィリ測度、ベンチマークデータセット、学習パラダイムが急速に発展しています。
論文 参考訳(メタデータ) (2024-01-18T07:36:38Z) - Geometry Contrastive Learning on Heterogeneous Graphs [50.58523799455101]
本稿では,幾何学コントラスト学習(Geometry Contrastive Learning, GCL)と呼ばれる,新しい自己指導型学習手法を提案する。
GCLはユークリッドと双曲的な視点からヘテロジニアスグラフを同時に見ることができ、リッチな意味論と複雑な構造をモデル化する能力の強い融合を目指している。
4つのベンチマークデータセットの大規模な実験は、提案手法が強いベースラインよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-25T03:54:53Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - Structure-Augmented Text Representation Learning for Efficient Knowledge
Graph Completion [53.31911669146451]
人為的な知識グラフは、様々な自然言語処理タスクに重要な支援情報を提供する。
これらのグラフは通常不完全であり、自動補完を促す。
グラフ埋め込みアプローチ(例えばTransE)は、グラフ要素を密度の高い埋め込みに表現することで構造化された知識を学ぶ。
テキストエンコーディングアプローチ(KG-BERTなど)は、グラフトリプルのテキストとトリプルレベルの文脈化表現を利用する。
論文 参考訳(メタデータ) (2020-04-30T13:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。