論文の概要: Understanding Points of Correspondence between Sentences for Abstractive
Summarization
- arxiv url: http://arxiv.org/abs/2006.05621v1
- Date: Wed, 10 Jun 2020 02:42:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-23 05:32:22.612425
- Title: Understanding Points of Correspondence between Sentences for Abstractive
Summarization
- Title(参考訳): 抽象要約のための文間の対応点の理解
- Authors: Logan Lebanoff, John Muchovej, Franck Dernoncourt, Doo Soon Kim, Lidan
Wang, Walter Chang, Fei Liu
- Abstract要約: 本稿では,文書から引き出された文の融合について,対応点の概念を導入して検討する。
我々は、文書、ソースおよび融合文、および文間の対応点の人間のアノテーションを含むデータセットを作成する。
- 参考スコア(独自算出の注目度): 39.7404761923196
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fusing sentences containing disparate content is a remarkable human ability
that helps create informative and succinct summaries. Such a simple task for
humans has remained challenging for modern abstractive summarizers,
substantially restricting their applicability in real-world scenarios. In this
paper, we present an investigation into fusing sentences drawn from a document
by introducing the notion of points of correspondence, which are cohesive
devices that tie any two sentences together into a coherent text. The types of
points of correspondence are delineated by text cohesion theory, covering
pronominal and nominal referencing, repetition and beyond. We create a dataset
containing the documents, source and fusion sentences, and human annotations of
points of correspondence between sentences. Our dataset bridges the gap between
coreference resolution and summarization. It is publicly shared to serve as a
basis for future work to measure the success of sentence fusion systems.
(https://github.com/ucfnlp/points-of-correspondence)
- Abstract(参考訳): 異なる内容を含む文を融合することは、有益で簡潔な要約を作成するのに役立つ驚くべき人間の能力である。
このような簡単な作業は、現代の抽象的な要約者にとって依然として困難であり、現実のシナリオにおける適用性を著しく制限している。
本稿では,2つの文を結合したコヒーレントテキストに結合するコヒーレントな装置である対応点の概念を導入することにより,文書から引き出された文を融合する検討を行う。
対応点のタイプは、テキスト結束理論(英語版)によって説明され、プロノミナルおよび名目的参照、反復などをカバーする。
我々は、文書、ソースおよび融合文、および文間の対応点の人間のアノテーションを含むデータセットを作成する。
私たちのデータセットは、コリファレンス解決と要約の間のギャップを橋渡しします。
文融合システムの成功を測定するための将来の研究の基盤となるために、公に共有されている。
(https://github.com/ucfnlp/points-of-correspondence)
関連論文リスト
- Thesis: Document Summarization with applications to Keyword extraction and Image Retrieval [0.0]
意見要約のための部分モジュラ関数の集合を提案する。
意見要約は、その中に要約と感情検出のタスクが組み込まれている。
我々の関数は、文書の感情と要約の感情と良いROUGEスコアとの相関関係が良いような要約を生成する。
論文 参考訳(メタデータ) (2024-05-20T21:27:18Z) - `Keep it Together': Enforcing Cohesion in Extractive Summaries by
Simulating Human Memory [22.659031563705245]
本稿では,要約における情報性や冗長性を制御しつつ,凝集を強制することを目的としている。
我々の文セレクタは、人間の記憶をシミュレートしてトピックを追跡する。
非常に密集した要約を抽出することはできるが、それでも人間にとって有意義な内容の要約を読めばよい。
論文 参考訳(メタデータ) (2024-02-16T12:43:26Z) - RankSum An unsupervised extractive text summarization based on rank
fusion [0.0]
本稿では,単一文書の抽出テキスト要約手法であるRansumを提案する。
ランクサムは、各特徴に対応する文の給与ランクを教師なしの方法で取得する。
CNN/DailyMail と DUC 2002 で利用可能な要約データセットについて検討した。
論文 参考訳(メタデータ) (2024-02-07T22:24:09Z) - Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - PropSegmEnt: A Large-Scale Corpus for Proposition-Level Segmentation and
Entailment Recognition [63.51569687229681]
文中の各命題の文的含意関係を個別に認識する必要性について論じる。
提案するPropSegmEntは45K以上の提案のコーパスであり, 専門家によるアノテートを行う。
我々のデータセット構造は、(1)文書内の文章を命題の集合に分割し、(2)異なるが、トポジカルに整合した文書に対して、各命題の含意関係を分類するタスクに類似している。
論文 参考訳(メタデータ) (2022-12-21T04:03:33Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Consistency and Coherence from Points of Contextual Similarity [0.0]
近年,事実整合性に特化して提案されているESTIME測度は,人間の専門家のスコアと高い相関性が得られる。
これは現在の要約方式には問題はないが、将来の要約システムには障害となる可能性がある。
論文 参考訳(メタデータ) (2021-12-22T03:04:20Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - Paragraph-level Commonsense Transformers with Recurrent Memory [77.4133779538797]
物語からコヒーレントなコモンセンス推論を生成するために,段落レベルの情報を含む談話認識モデルを訓練する。
以上の結果から,PARA-COMETは文レベルのベースライン,特にコヒーレントかつ新規な推論に優れていた。
論文 参考訳(メタデータ) (2020-10-04T05:24:12Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。