論文の概要: Enhancing Coherence of Extractive Summarization with Multitask Learning
- arxiv url: http://arxiv.org/abs/2305.12851v2
- Date: Fri, 21 Jul 2023 10:22:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-24 15:47:25.336329
- Title: Enhancing Coherence of Extractive Summarization with Multitask Learning
- Title(参考訳): マルチタスク学習による抽出要約のコヒーレンス向上
- Authors: Renlong Jie, Xiaojun Meng, Lifeng Shang, Xin Jiang, Qun Liu
- Abstract要約: 本研究では,コヒーレンス向上を伴う抽出要約のためのマルチタスク学習アーキテクチャを提案する。
アーキテクチャは、抽出要約器とコヒーレント判別器モジュールとを含む。
実験の結果,提案手法は抽出した要約文の連続文の割合を大幅に改善することがわかった。
- 参考スコア(独自算出の注目度): 40.349019691412465
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This study proposes a multitask learning architecture for extractive
summarization with coherence boosting. The architecture contains an extractive
summarizer and coherent discriminator module. The coherent discriminator is
trained online on the sentence vectors of the augmented textual input, thus
improving its general ability of judging whether the input sentences are
coherent. Meanwhile, we maximize the coherent scores from the coherent
discriminator by updating the parameters of the summarizer. To make the
extractive sentences trainable in a differentiable manner, we introduce two
strategies, including pre-trained converting model (model-based) and converting
matrix (MAT-based) that merge sentence representations. Experiments show that
our proposed method significantly improves the proportion of consecutive
sentences in the extracted summaries based on their positions in the original
article (i.e., automatic sentence-level coherence metric), while the goodness
in terms of other automatic metrics (i.e., Rouge scores and BertScores) are
preserved. Human evaluation also evidences the improvement of coherence and
consistency of the extracted summaries given by our method.
- Abstract(参考訳): 本研究では,コヒーレンス向上を伴う抽出要約のためのマルチタスク学習アーキテクチャを提案する。
アーキテクチャは、抽出要約器とコヒーレント判別モジュールを含む。
このコヒーレント判別器は、拡張テキスト入力の文ベクトルに基づいてオンラインで訓練され、入力文がコヒーレントかどうかを判定する一般的な能力を向上させる。
一方,要約者のパラメータを更新することにより,コヒーレント判別器からのコヒーレントスコアを最大化する。
抽出文を異なる方法で訓練できるようにするため,事前学習された変換モデル(モデルベース)と,文章表現をマージする変換行列(MATベース)の2つの戦略を導入する。
実験の結果,提案手法は,抽出した要約中の連続文の割合を原文の位置(すなわち,自動文レベルのコヒーレンス尺度)に基づいて有意に改善し,他の自動指標(ルージュスコア,ベルトスコア)の良さが保存されていることがわかった。
また,人間の評価は,抽出した要約の一貫性と一貫性の向上を実証している。
関連論文リスト
- Hierarchical Indexing for Retrieval-Augmented Opinion Summarization [60.5923941324953]
本稿では,抽出アプローチの帰属性と拡張性と,大規模言語モデル(LLM)の一貫性と拡散性を組み合わせた,教師なし抽象的意見要約手法を提案する。
我々の方法であるHIROは、意味的に整理された離散的な階層を通して文を経路にマッピングするインデックス構造を学習する。
推測時にインデックスを投入し、入力レビューから人気意見を含む文群を識別し、検索する。
論文 参考訳(メタデータ) (2024-03-01T10:38:07Z) - Efficient and Interpretable Compressive Text Summarisation with
Unsupervised Dual-Agent Reinforcement Learning [36.93582300019002]
教師なし二重エージェント強化学習を用いた効率よく解釈可能な圧縮要約法を提案する。
本モデルでは,ROUGE 測定値を用いて,有望な性能と,Newsroom の大幅な改善を実現している。
論文 参考訳(メタデータ) (2023-06-06T05:30:49Z) - Attributable and Scalable Opinion Summarization [79.87892048285819]
我々は、頻繁なエンコーディングを復号することで抽象的な要約を生成し、同じ頻繁なエンコーディングに割り当てられた文を選択して抽出的な要約を生成する。
本手法は,要約プロセスの一部として要約を生成するために使用される文を同定するため,帰属的手法である。
なぜなら、アグリゲーションはトークンの長いシーケンスではなく、潜在空間で実行されるからである。
論文 参考訳(メタデータ) (2023-05-19T11:30:37Z) - A General Contextualized Rewriting Framework for Text Summarization [15.311467109946571]
抽出文は比較的焦点が当てられているが、背景知識や談話の文脈が失われる可能性がある。
コンテントベースのアドレッシングによって抽出文を識別し、グループタグアライメントを施したSeq2seqとしてコンテクスト化された書き直しを形式化する。
その結果,本手法は強化学習を必要とせず,非コンテクスチュアライズされた書き換えシステムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-13T03:55:57Z) - Automated Concatenation of Embeddings for Structured Prediction [75.44925576268052]
本稿では, 埋め込みの自動結合(ACE)を提案し, 構造予測タスクにおける埋め込みのより優れた結合を見つけるプロセスを自動化する。
我々は、強化学習の戦略に従い、制御器のパラメータを最適化し、タスクモデルの精度に基づいて報酬を計算する。
論文 参考訳(メタデータ) (2020-10-10T14:03:20Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z) - Unsupervised Summarization by Jointly Extracting Sentences and Keywords [12.387378783627762]
RepRankは、抽出多文書要約のための教師なしグラフベースのランキングモデルである。
学習した表現を用いて,有意な文やキーワードを協調的・相互強化プロセスで抽出できることを示す。
複数のベンチマークデータセットによる実験結果は、RepRankがROUGEで最高の、または同等のパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2020-09-16T05:58:00Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - AREDSUM: Adaptive Redundancy-Aware Iterative Sentence Ranking for
Extractive Document Summarization [46.00136909474304]
冗長性を考慮した抽出要約システムは、要約に含まれる文の冗長性を評価する。
従来の研究は、ニューラルシークエンス生成モデルを用いた共同スコアリングと文の選択の有効性を示している。
文選択時のサリエンスと新規性を共同で検討するAREDSUM-SEQと、まずサリエンスをスコアする2ステップのAREDSUM-CTXと、サリエンスと冗長性のバランスを学習するAREDSUM-CTXの2つの適応学習モデルを提案する。
論文 参考訳(メタデータ) (2020-04-13T20:02:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。