論文の概要: Continual Graph Convolutional Network for Text Classification
- arxiv url: http://arxiv.org/abs/2304.04152v1
- Date: Sun, 9 Apr 2023 03:59:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-11 17:29:46.009635
- Title: Continual Graph Convolutional Network for Text Classification
- Title(参考訳): テキスト分類のための連続グラフ畳み込みネットワーク
- Authors: Tiandeng Wu, Qijiong Liu, Yi Cao, Yao Huang, Xiao-Ming Wu, Jiandong
Ding
- Abstract要約: 観測された文書から観測されていない文書への推論を一般化するための連続GCNモデル(ContGCN)を提案する。
Huaweiの世論分析システムにおける3ヶ月のA/Bテストでは、ContGCNは最先端の手法と比較して8.86%のパフォーマンス向上を達成した。
- 参考スコア(独自算出の注目度): 10.976420052914534
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Graph convolutional network (GCN) has been successfully applied to capture
global non-consecutive and long-distance semantic information for text
classification. However, while GCN-based methods have shown promising results
in offline evaluations, they commonly follow a seen-token-seen-document
paradigm by constructing a fixed document-token graph and cannot make
inferences on new documents. It is a challenge to deploy them in online systems
to infer steaming text data. In this work, we present a continual GCN model
(ContGCN) to generalize inferences from observed documents to unobserved
documents. Concretely, we propose a new all-token-any-document paradigm to
dynamically update the document-token graph in every batch during both the
training and testing phases of an online system. Moreover, we design an
occurrence memory module and a self-supervised contrastive learning objective
to update ContGCN in a label-free manner. A 3-month A/B test on Huawei public
opinion analysis system shows ContGCN achieves 8.86% performance gain compared
with state-of-the-art methods. Offline experiments on five public datasets also
show ContGCN can improve inference quality. The source code will be released at
https://github.com/Jyonn/ContGCN.
- Abstract(参考訳): グラフ畳み込みネットワーク (GCN) は, テキスト分類のためのグローバルな非連続的・長距離意味情報の取得に成功している。
しかし、gcnベースの手法はオフライン評価で有望な結果を示したが、それらは一般に、固定されたドキュメントトケングラフを構築することによって見掛けられる文書パラダイムに従っており、新しいドキュメントでは推論できない。
テキストデータを送受信するためにオンラインシステムに展開することは困難である。
本稿では,観測文書から観測されていない文書への推論を一般化する連続型gcnモデル(contgcn)を提案する。
具体的には,オンラインシステムのトレーニングフェーズとテストフェーズの両方において,各バッチの文書トリミンググラフを動的に更新する,新たな全トリミングドキュメントパラダイムを提案する。
さらに,ContGCNをラベル無しで更新するために,発生記憶モジュールと自己教師付きコントラスト学習目標を設計する。
Huaweiの世論分析システムにおける3ヶ月のA/Bテストでは、ContGCNは最先端の手法と比較して8.86%のパフォーマンス向上を達成した。
5つの公開データセットのオフライン実験でも、ContGCNは推論品質を改善することができる。
ソースコードはhttps://github.com/Jyonn/ContGCNで公開される。
関連論文リスト
- Word Grounded Graph Convolutional Network [24.6338889954789]
グラフ畳み込みネットワーク(GCN)は、テキスト分類などの様々なタスクにおけるテキスト表現の学習において、高いパフォーマンスを示している。
本稿では,文書非依存グラフを用いて,文書グラフをワードグラフに変換し,データサンプルとGCNモデルを分離することを提案する。
提案したWord-level Graph(WGraph)は、コーパスで一般的に使われている単語共起による単語表現を暗黙的に学習するだけでなく、さらにグローバルなセマンティック依存も含んでいる。
論文 参考訳(メタデータ) (2023-05-10T19:56:55Z) - InducT-GCN: Inductive Graph Convolutional Networks for Text
Classification [5.448684866061923]
本稿では,新しいインダクティブグラフベースのテキスト分類フレームワークInducT-GCNを紹介する。
試験用文書を必要とするトランスダクティブモデルと比較して,トレーニング用文書の統計情報のみに基づくグラフを構築した。
InducT-GCNは、本質的にトランスダクティブであるか、事前訓練された追加リソースのいずれかである最先端の手法より優れています。
論文 参考訳(メタデータ) (2022-06-01T06:47:47Z) - ME-GCN: Multi-dimensional Edge-Embedded Graph Convolutional Networks for
Semi-supervised Text Classification [6.196387205547024]
本稿では,半教師付きテキスト分類のためのME-GCN (Multi-dimensional Edge-enhanced Graph Convolutional Networks)を提案する。
提案モデルでは,8つのベンチマークデータセット間で最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-04-10T07:05:12Z) - Neural Graph Matching for Pre-training Graph Neural Networks [72.32801428070749]
グラフニューラルネットワーク(GNN)は、構造データのモデリングにおいて強力な能力を示している。
GMPTと呼ばれる新しいグラフマッチングベースのGNN事前学習フレームワークを提案する。
提案手法は,完全自己指導型プレトレーニングと粗粒型プレトレーニングに適用できる。
論文 参考訳(メタデータ) (2022-03-03T09:53:53Z) - Training Free Graph Neural Networks for Graph Matching [103.45755859119035]
TFGMは、グラフニューラルネットワーク(GNN)ベースのグラフマッチングのパフォーマンスをトレーニングなしで向上するフレームワークである。
TFGMをさまざまなGNNに適用することは、ベースラインよりも有望な改善を示している。
論文 参考訳(メタデータ) (2022-01-14T09:04:46Z) - General-Purpose OCR Paragraph Identification by Graph Convolutional
Neural Networks [1.5960546024967326]
OCRテキストボックスに適用した空間グラフ畳み込みニューラルネットワーク(GCN)による段落識別のための新しい手法を提案する。
行分割と行クラスタリングという2つのステップを行い、OCR結果の行から段落を抽出する。
GCNモデルは、合成トレーニングデータから実世界の画像への優れた一般化と、可変文書スタイルに対する優れた適応性を示す。
論文 参考訳(メタデータ) (2021-01-29T18:54:53Z) - Attention-Driven Dynamic Graph Convolutional Network for Multi-Label
Image Recognition [53.17837649440601]
本稿では,各画像の特定のグラフを動的に生成するアテンション駆動型動的グラフ畳み込みネットワーク(ADD-GCN)を提案する。
パブリックなマルチラベルベンチマーク実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-12-05T10:10:12Z) - On the Equivalence of Decoupled Graph Convolution Network and Label
Propagation [60.34028546202372]
いくつかの研究は、カップリングがデカップリングよりも劣っていることを示している。
有効性にもかかわらず、疎結合GCNの作用機構はよく理解されていない。
本稿では,分離GCNの欠陥を克服する適応的学習法(PTA)を提案する。
論文 参考訳(メタデータ) (2020-10-23T13:57:39Z) - Simple and Deep Graph Convolutional Networks [63.76221532439285]
グラフ畳み込みネットワーク(GCN)は、グラフ構造化データに対する強力なディープラーニングアプローチである。
その成功にもかかわらず、現在のGCNモデルは、エムの過度に滑らかな問題のため、ほとんどが浅くなっている。
本稿では,2つの単純かつ効果的な手法を用いて,バニラGCNモデルを拡張したGCNIIを提案する。
論文 参考訳(メタデータ) (2020-07-04T16:18:06Z) - Sequential Graph Convolutional Network for Active Learning [53.99104862192055]
逐次グラフ畳み込みネットワーク(GCN)を用いた新しいプールベースアクティブラーニングフレームワークを提案する。
少数のランダムなサンプル画像がシードラベル付き例であるので、グラフのパラメータを学習してラベル付きノードと非ラベル付きノードを区別する。
我々はGCNの特性を利用してラベル付けされたものと十分に異なる未ラベルの例を選択する。
論文 参考訳(メタデータ) (2020-06-18T00:55:10Z) - Every Document Owns Its Structure: Inductive Text Classification via
Graph Neural Networks [22.91359631452695]
グラフニューラルネットワーク(GNN)を用いたインダクティブテキスト分類のためのテクスティングを提案する。
まず、各文書の個々のグラフを作成し、次にGNNを用いて局所構造に基づいて粒度の細かい単語表現を学習する。
本手法は,最先端のテキスト分類法より優れている。
論文 参考訳(メタデータ) (2020-04-22T07:23:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。