論文の概要: SgSum: Transforming Multi-document Summarization into Sub-graph
Selection
- arxiv url: http://arxiv.org/abs/2110.12645v1
- Date: Mon, 25 Oct 2021 05:12:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-27 04:58:49.038735
- Title: SgSum: Transforming Multi-document Summarization into Sub-graph
Selection
- Title(参考訳): SgSum: マルチドキュメント要約をサブグラフ選択に変換する
- Authors: Moye Chen, Wei Li, Jiachen Liu, Xinyan Xiao, Hua Wu, Haifeng Wang
- Abstract要約: 既存の抽出多文書要約(MDS)手法は、各文を個別にスコアし、一つずつ有能な文を抽出して要約を構成する。
サブグラフ選択問題としてMDSタスクを定式化する新しいMDSフレームワーク(SgSum)を提案する。
我々のモデルは従来のMDS法と比較して、より一貫性があり、情報的な要約を生成できる。
- 参考スコア(独自算出の注目度): 27.40759123902261
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most of existing extractive multi-document summarization (MDS) methods score
each sentence individually and extract salient sentences one by one to compose
a summary, which have two main drawbacks: (1) neglecting both the intra and
cross-document relations between sentences; (2) neglecting the coherence and
conciseness of the whole summary. In this paper, we propose a novel MDS
framework (SgSum) to formulate the MDS task as a sub-graph selection problem,
in which source documents are regarded as a relation graph of sentences (e.g.,
similarity graph or discourse graph) and the candidate summaries are its
sub-graphs. Instead of selecting salient sentences, SgSum selects a salient
sub-graph from the relation graph as the summary. Comparing with traditional
methods, our method has two main advantages: (1) the relations between
sentences are captured by modeling both the graph structure of the whole
document set and the candidate sub-graphs; (2) directly outputs an integrate
summary in the form of sub-graph which is more informative and coherent.
Extensive experiments on MultiNews and DUC datasets show that our proposed
method brings substantial improvements over several strong baselines. Human
evaluation results also demonstrate that our model can produce significantly
more coherent and informative summaries compared with traditional MDS methods.
Moreover, the proposed architecture has strong transfer ability from single to
multi-document input, which can reduce the resource bottleneck in MDS tasks.
Our code and results are available at:
\url{https://github.com/PaddlePaddle/Research/tree/master/NLP/EMNLP2021-SgSum}.
- Abstract(参考訳): 既存の抽出多文書要約法(MDS)は,各文を個別にスコアリングし,各文を1つずつ抽出して要約を構成するが,その主な欠点は,(1)文の内的・横断的な関係を無視すること,(2)要約全体の一貫性と簡潔さを無視することである。
本稿では,MDSタスクをサブグラフ選択問題として定式化するための新しいMDSフレームワーク(SgSum)を提案する。
SgSumは、有能な文を選択する代わりに、関係グラフから有能な部分グラフを要約として選択する。
従来の手法と比較して,(1)文書集合全体のグラフ構造と候補部分グラフの両方をモデル化することにより文間の関係を捉えること,(2)より情報的かつ一貫性のある部分グラフの形式で統合的な要約を直接出力すること,の2つの利点がある。
MultiNews と DUC データセットの大規模な実験により,提案手法はいくつかの強力なベースラインに対して大幅な改善をもたらすことが示された。
また,人間の評価結果から,従来のMDS法と比較して,より一貫性と情報的な要約を生成できることが示唆された。
さらに,提案アーキテクチャは,mdsタスクのリソースボトルネックを低減できる単一文書入力から複数文書入力への強い転送能力を有する。
コードと結果は以下の通りである。 \url{https://github.com/PaddlePaddle/Research/tree/master/NLP/EMNLP2021-SgSum}。
関連論文リスト
- Doc2SoarGraph: Discrete Reasoning over Visually-Rich Table-Text
Documents via Semantic-Oriented Hierarchical Graphs [79.0426838808629]
視覚的にリッチなテーブルテキスト文書に答えるTAT-DQAを提案する。
具体的には、離散推論機能を強化した新しいDoc2SoarGraphフレームワークを提案する。
我々は,TAT-DQAデータセットに関する広範な実験を行い,提案したフレームワークは,テストセット上でのエクサクティマッチ(EM)とF1スコアでそれぞれ17.73%,F1スコアで16.91%の最高のベースラインモデルを上回る結果を得た。
論文 参考訳(メタデータ) (2023-05-03T07:30:32Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - An analysis of document graph construction methods for AMR summarization [2.055054374525828]
本稿では,文書と要約のノード間のアライメントを人間にアノテートした新しいデータセットを提案する。
本稿では,これらの2種類の評価方法とノードマージの新しい手法を適用し,新しい手法が従来の方法よりもはるかに優れた性能を示すことを示す。
論文 参考訳(メタデータ) (2021-11-27T22:12:50Z) - HETFORMER: Heterogeneous Transformer with Sparse Attention for Long-Text
Extractive Summarization [57.798070356553936]
HETFORMERはトランスフォーマーをベースとした事前学習モデルであり、抽出要約のための多粒度スパースアテンションを持つ。
単一文書と複数文書の要約タスクの実験から,HETFORMERがルージュF1の最先端性能を達成することが示された。
論文 参考訳(メタデータ) (2021-10-12T22:42:31Z) - Multiplex Graph Neural Network for Extractive Text Summarization [34.185093491514394]
抽出テキスト要約は、ある文書から最も代表的な文章を要約として抽出することを目的としている。
文と単語の異なる関係を共同でモデル化する新しい多重グラフ畳み込みネットワーク(Multi-GCN)を提案する。
マルチGCNに基づいて,抽出テキスト要約のための多重グラフ要約(Multi-GraS)モデルを提案する。
論文 参考訳(メタデータ) (2021-08-29T16:11:01Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - SummPip: Unsupervised Multi-Document Summarization with Sentence Graph
Compression [61.97200991151141]
SummPipはマルチドキュメント要約のための教師なしの手法である。
元の文書を文グラフに変換し、言語表現と深層表現の両方を考慮に入れます。
次に、スペクトルクラスタリングを適用して複数の文のクラスタを取得し、最後に各クラスタを圧縮して最終的な要約を生成する。
論文 参考訳(メタデータ) (2020-07-17T13:01:15Z) - Leveraging Graph to Improve Abstractive Multi-Document Summarization [50.62418656177642]
我々は、文書のよく知られたグラフ表現を活用することができる、抽象的多文書要約(MDS)モデルを開発する。
本モデルでは,長い文書の要約に欠かせない文書間関係を捉えるために,文書の符号化にグラフを利用する。
また,このモデルでは,要約生成プロセスの導出にグラフを利用することが可能であり,一貫性と簡潔な要約を生成するのに有用である。
論文 参考訳(メタデータ) (2020-05-20T13:39:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。