論文の概要: Unsupervised Extractive Summarization with Heterogeneous Graph
Embeddings for Chinese Document
- arxiv url: http://arxiv.org/abs/2211.04698v1
- Date: Wed, 9 Nov 2022 06:07:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 16:47:53.503511
- Title: Unsupervised Extractive Summarization with Heterogeneous Graph
Embeddings for Chinese Document
- Title(参考訳): 異種グラフ埋め込みを用いた中国語文書の教師なし抽出要約
- Authors: Chen Lin, Ye Liu, Siyu An, Di Yin
- Abstract要約: 中国語文書にヘテロジニアスグラフ埋め込み (HGE) を組み込んだ教師なし抽出サマリザイトン法を提案する。
実験結果から,本手法は3つの要約データセットにおいて,強いベースラインを一貫して上回ることを示した。
- 参考スコア(独自算出の注目度): 5.9630342951482085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the scenario of unsupervised extractive summarization, learning
high-quality sentence representations is essential to select salient sentences
from the input document. Previous studies focus more on employing statistical
approaches or pre-trained language models (PLMs) to extract sentence
embeddings, while ignoring the rich information inherent in the heterogeneous
types of interaction between words and sentences. In this paper, we are the
first to propose an unsupervised extractive summarizaiton method with
heterogeneous graph embeddings (HGEs) for Chinese document. A heterogeneous
text graph is constructed to capture different granularities of interactions by
incorporating graph structural information. Moreover, our proposed graph is
general and flexible where additional nodes such as keywords can be easily
integrated. Experimental results demonstrate that our method consistently
outperforms the strong baseline in three summarization datasets.
- Abstract(参考訳): 教師なし抽出要約のシナリオでは、質の高い文表現の学習は、入力文書から突出した文を選択するのに不可欠である。
従来の研究では、文の埋め込みを抽出するために統計的アプローチや事前訓練された言語モデル(PLM)を採用することに注力し、単語と文間の異種相互作用に固有の豊富な情報を無視した。
本稿では,中国語文書にヘテロジニアスグラフ埋め込み (HGE) を組み込んだ非教師なし抽出要約音法を初めて提案する。
異種テキストグラフは、グラフ構造情報を組み込むことで、異なる相互作用の粒度をキャプチャするために構築される。
さらに,提案するグラフは汎用的で柔軟性があり,キーワードなどの追加ノードを容易に統合できる。
実験結果から,本手法は3つの要約データセットにおいて強いベースラインを一貫して上回ることを示した。
関連論文リスト
- Explanation Graph Generation via Generative Pre-training over Synthetic
Graphs [6.25568933262682]
説明グラフの生成は,ユーザの入力に応じて説明グラフを作成することを目的とした重要なタスクである。
現在の研究では、ラベル付きグラフで注釈付けされた小さな下流データセット上で、テキストベースの事前学習言語モデルを微調整するのが一般的である。
本稿では,説明グラフ生成タスクのための新しい事前学習フレームワークEG3Pを提案する。
論文 参考訳(メタデータ) (2023-06-01T13:20:22Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Hierarchical Heterogeneous Graph Representation Learning for Short Text
Classification [60.233529926965836]
短文分類のためのグラフニューラルネットワーク(GNN)に基づく ShiNE と呼ばれる新しい手法を提案する。
まず,短文データセットを単語レベル成分グラフからなる階層的不均一グラフとしてモデル化する。
そして、類似した短いテキスト間の効果的なラベル伝搬を容易にするショート文書グラフを動的に学習する。
論文 参考訳(メタデータ) (2021-10-30T05:33:05Z) - SgSum: Transforming Multi-document Summarization into Sub-graph
Selection [27.40759123902261]
既存の抽出多文書要約(MDS)手法は、各文を個別にスコアし、一つずつ有能な文を抽出して要約を構成する。
サブグラフ選択問題としてMDSタスクを定式化する新しいMDSフレームワーク(SgSum)を提案する。
我々のモデルは従来のMDS法と比較して、より一貫性があり、情報的な要約を生成できる。
論文 参考訳(メタデータ) (2021-10-25T05:12:10Z) - HETFORMER: Heterogeneous Transformer with Sparse Attention for Long-Text
Extractive Summarization [57.798070356553936]
HETFORMERはトランスフォーマーをベースとした事前学習モデルであり、抽出要約のための多粒度スパースアテンションを持つ。
単一文書と複数文書の要約タスクの実験から,HETFORMERがルージュF1の最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-12T22:42:31Z) - Multiplex Graph Neural Network for Extractive Text Summarization [34.185093491514394]
抽出テキスト要約は、ある文書から最も代表的な文章を要約として抽出することを目的としている。
文と単語の異なる関係を共同でモデル化する新しい多重グラフ畳み込みネットワーク(Multi-GCN)を提案する。
マルチGCNに基づいて,抽出テキスト要約のための多重グラフ要約(Multi-GraS)モデルを提案する。
論文 参考訳(メタデータ) (2021-08-29T16:11:01Z) - Relation Clustering in Narrative Knowledge Graphs [71.98234178455398]
原文内の関係文は(SBERTと)埋め込み、意味論的に類似した関係をまとめるためにクラスタ化される。
予備的なテストでは、そのようなクラスタリングが類似した関係を検知し、半教師付きアプローチのための貴重な前処理を提供することが示されている。
論文 参考訳(メタデータ) (2020-11-27T10:43:04Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z) - Heterogeneous Graph Neural Networks for Extractive Document
Summarization [101.17980994606836]
クロス文関係は、抽出文書要約における重要なステップである。
We present a graph-based neural network for extractive summarization (HeterSumGraph)
抽出文書要約のためのグラフベースニューラルネットワークに異なる種類のノードを導入する。
論文 参考訳(メタデータ) (2020-04-26T14:38:11Z) - Selective Attention Encoders by Syntactic Graph Convolutional Networks
for Document Summarization [21.351111598564987]
本稿では,文書中の文から解析木を接続するグラフを提案し,文書の構文表現を学習するために重ねられたグラフ畳み込みネットワーク(GCN)を利用する。
提案したGCNによる選択的アテンションアプローチは,ベースラインよりも優れ,データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-18T01:30:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。