論文の概要: Rethinking Graph-Based Document Classification: Learning Data-Driven Structures Beyond Heuristic Approaches
- arxiv url: http://arxiv.org/abs/2508.00864v1
- Date: Fri, 18 Jul 2025 12:05:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-10 09:30:49.274713
- Title: Rethinking Graph-Based Document Classification: Learning Data-Driven Structures Beyond Heuristic Approaches
- Title(参考訳): グラフベースの文書分類を再考する: ヒューリスティックなアプローチを越えてデータ駆動型構造を学ぶ
- Authors: Margarita Bugueño, Gerard de Melo,
- Abstract要約: 本稿では,データ駆動型グラフ構造を学習し,手動設計の必要性を排除し,ドメイン依存を減らす手法を提案する。
提案手法は,文の重み付きグラフをノードとして構築し,エッジは文ペア間の依存関係を識別する自己認識モデルを用いて学習する。
- 参考スコア(独自算出の注目度): 21.922739597512955
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In document classification, graph-based models effectively capture document structure, overcoming sequence length limitations and enhancing contextual understanding. However, most existing graph document representations rely on heuristics, domain-specific rules, or expert knowledge. Unlike previous approaches, we propose a method to learn data-driven graph structures, eliminating the need for manual design and reducing domain dependence. Our approach constructs homogeneous weighted graphs with sentences as nodes, while edges are learned via a self-attention model that identifies dependencies between sentence pairs. A statistical filtering strategy aims to retain only strongly correlated sentences, improving graph quality while reducing the graph size. Experiments on three document classification datasets demonstrate that learned graphs consistently outperform heuristic-based graphs, achieving higher accuracy and $F_1$ score. Furthermore, our study demonstrates the effectiveness of the statistical filtering in improving classification robustness. These results highlight the potential of automatic graph generation over traditional heuristic approaches and open new directions for broader applications in NLP.
- Abstract(参考訳): 文書分類において、グラフベースのモデルは、文書構造を効果的に捉え、シーケンス長制限を克服し、文脈理解を強化する。
しかし、既存のグラフ文書表現のほとんどはヒューリスティックス、ドメイン固有のルール、専門家の知識に依存している。
従来の手法とは異なり,データ駆動型グラフ構造を学習し,手動設計の必要性を排除し,ドメイン依存を減らす手法を提案する。
提案手法は,文の重み付きグラフをノードとして構築し,エッジは文ペア間の依存関係を識別する自己認識モデルを用いて学習する。
統計的フィルタリング戦略は、強い相関文のみを保持することを目的としており、グラフサイズを小さくしながら、グラフ品質を向上させる。
3つの文書分類データセットの実験により、学習されたグラフはヒューリスティックなグラフを一貫して上回り、より高い精度とF_1$スコアを得ることを示した。
さらに, 分類ロバスト性向上における統計的フィルタリングの有効性について検討した。
これらの結果は、従来のヒューリスティックなアプローチよりもグラフの自動生成の可能性を強調し、NLPの幅広い応用に向けて新たな方向性を開く。
関連論文リスト
- Self-supervised Learning and Graph Classification under Heterophily [4.358149865548289]
我々は,Metric(PGM)に基づく,事前学習型グラフニューラルネットワーク(GNN)のための新しい自己教師型戦略を提案する。
我々の戦略は、分子特性予測とタンパク質機能予測のための最先端性能を実現する。
論文 参考訳(メタデータ) (2023-06-14T12:32:38Z) - Spectral Augmentations for Graph Contrastive Learning [50.149996923976836]
コントラスト学習は、監督の有無にかかわらず、表現を学習するための第一の方法として現れてきた。
近年の研究では、グラフ表現学習における事前学習の有用性が示されている。
本稿では,グラフの対照的な目的に対する拡張を構築する際に,候補のバンクを提供するためのグラフ変換操作を提案する。
論文 参考訳(メタデータ) (2023-02-06T16:26:29Z) - State of the Art and Potentialities of Graph-level Learning [54.68482109186052]
グラフレベルの学習は、比較、回帰、分類など、多くのタスクに適用されている。
グラフの集合を学習する伝統的なアプローチは、サブストラクチャのような手作りの特徴に依存している。
ディープラーニングは、機能を自動的に抽出し、グラフを低次元表現に符号化することで、グラフレベルの学習をグラフの規模に適応させるのに役立っている。
論文 参考訳(メタデータ) (2023-01-14T09:15:49Z) - Joint Graph Learning and Matching for Semantic Feature Correspondence [69.71998282148762]
本稿では,グラフマッチングを向上するための信頼度の高いグラフ構造を探索するために,GLAMという共用電子グラフ学習とマッチングネットワークを提案する。
提案手法は,3つの人気ビジュアルマッチングベンチマーク (Pascal VOC, Willow Object, SPair-71k) で評価される。
すべてのベンチマークにおいて、従来の最先端のグラフマッチング手法よりも大きなマージンを達成している。
論文 参考訳(メタデータ) (2021-09-01T08:24:02Z) - Hierarchical Adaptive Pooling by Capturing High-order Dependency for
Graph Representation Learning [18.423192209359158]
グラフニューラルネットワーク(GNN)はノードレベルのグラフ表現学習タスクでグラフ構造化データを扱うのに十分成熟していることが証明されている。
本稿では,グラフ構造に適応する階層型グラフレベルの表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2021-04-13T06:22:24Z) - Line Graph Neural Networks for Link Prediction [71.00689542259052]
実世界の多くのアプリケーションにおいて古典的なグラフ解析問題であるグラフリンク予測タスクについて検討する。
このフォーマリズムでは、リンク予測問題をグラフ分類タスクに変換する。
本稿では,線グラフをグラフ理論に用いて,根本的に異なる新しい経路を求めることを提案する。
特に、線グラフの各ノードは、元のグラフのユニークなエッジに対応するため、元のグラフのリンク予測問題は、グラフ分類タスクではなく、対応する線グラフのノード分類問題として等価に解決できる。
論文 参考訳(メタデータ) (2020-10-20T05:54:31Z) - Hierarchical and Unsupervised Graph Representation Learning with
Loukas's Coarsening [9.12816196758482]
本稿では,属性グラフを用いた教師なしグラフ表現学習法を提案する。
このアルゴリズムは,教師なし表現学習手法における最先端技術と競合することを示す。
論文 参考訳(メタデータ) (2020-07-07T12:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。