論文の概要: Improving Sentence Similarity Estimation for Unsupervised Extractive
Summarization
- arxiv url: http://arxiv.org/abs/2302.12490v1
- Date: Fri, 24 Feb 2023 07:10:33 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-27 14:24:43.920973
- Title: Improving Sentence Similarity Estimation for Unsupervised Extractive
Summarization
- Title(参考訳): 教師なし抽出要約における文類似度推定の改善
- Authors: Shichao Sun, Ruifeng Yuan, Wenjie Li, Sujian Li
- Abstract要約: 教師なし抽出要約における文類似度推定を改善するための2つの新しい手法を提案する。
我々は、比較学習を用いて、同じ文書の文が異なる文書の文とよりよく似ているという文書レベルの目的を最適化する。
また、相互学習を用いて文類似度推定と文サリエンスランキングの関係を高める。
- 参考スコア(独自算出の注目度): 21.602394765472386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Unsupervised extractive summarization aims to extract salient sentences from
a document as the summary without labeled data. Recent literatures mostly
research how to leverage sentence similarity to rank sentences in the order of
salience. However, sentence similarity estimation using pre-trained language
models mostly takes little account of document-level information and has a weak
correlation with sentence salience ranking. In this paper, we proposed two
novel strategies to improve sentence similarity estimation for unsupervised
extractive summarization. We use contrastive learning to optimize a
document-level objective that sentences from the same document are more similar
than those from different documents. Moreover, we use mutual learning to
enhance the relationship between sentence similarity estimation and sentence
salience ranking, where an extra signal amplifier is used to refine the pivotal
information. Experimental results demonstrate the effectiveness of our
strategies.
- Abstract(参考訳): 教師なし抽出要約(unsupervised extractive summarization)は、ラベル付きデータなしで文書から敬文を抽出することを目的としている。
近年の文献では、文の順にランクの文と類似性を利用する方法が研究されている。
しかし、事前訓練された言語モデルを用いた文類似度推定は、文書レベルの情報はほとんど考慮せず、文章サリエンスランキングとの相関が弱い。
本稿では,教師なし抽出要約のための文類似度推定を改善するための2つの新しい手法を提案する。
我々は、対照学習を用いて、同じ文書からの文が異なる文書の文よりも似ているという文書レベルの目標を最適化する。
さらに,文の類似度推定と文塩分ランキングとの関係を相互学習により高め,重要な情報の改良に余分な信号増幅器を用いる。
実験の結果,戦略の有効性が示された。
関連論文リスト
- RankCSE: Unsupervised Sentence Representations Learning via Learning to
Rank [54.854714257687334]
本稿では,教師なし文表現学習のための新しい手法であるRangCSEを提案する。
コントラスト学習を伴うランキング一貫性とランキング蒸留を統一された枠組みに組み込む。
セマンティックテキスト類似性(STS)と転送タスク(TR)の両方について、広範な実験が実施されている。
論文 参考訳(メタデータ) (2023-05-26T08:27:07Z) - Enhancing Coherence of Extractive Summarization with Multitask Learning [40.349019691412465]
本研究では,コヒーレンス向上を伴う抽出要約のためのマルチタスク学習アーキテクチャを提案する。
アーキテクチャは、抽出要約器とコヒーレント判別器モジュールとを含む。
実験の結果,提案手法は抽出した要約文の連続文の割合を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-05-22T09:20:58Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - Text Summarization with Oracle Expectation [88.39032981994535]
抽出要約は、文書の中で最も重要な文を識別し、連結することによって要約を生成する。
ほとんどの要約データセットは、文書文が要約に値するかどうかを示す金のラベルを持っていない。
本稿では,ソフトな予測に基づく文ラベルを生成する,シンプルで効果的なラベル付けアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-09-26T14:10:08Z) - Unsupervised Extractive Summarization using Pointwise Mutual Information [5.544401446569243]
文間のポイントワイズ相互情報 (PMI) を用いて, 関連性および冗長性の新たな指標を提案する。
本手法は, ニュース, 医療雑誌記事, 個人逸話など, さまざまな領域のデータセットにおける類似性に基づく手法を上回っていることを示した。
論文 参考訳(メタデータ) (2021-02-11T21:05:50Z) - Narrative Incoherence Detection [76.43894977558811]
本稿では,文間セマンティック理解のための新たなアリーナとして,物語不整合検出の課題を提案する。
複数文の物語を考えると、物語の流れに意味的な矛盾があるかどうかを決定します。
論文 参考訳(メタデータ) (2020-12-21T07:18:08Z) - Unsupervised Extractive Summarization by Pre-training Hierarchical
Transformers [107.12125265675483]
教師なし抽出文書要約は、訓練中にラベル付き要約を用いることなく、文書から重要な文章を選択することを目的としている。
既存の手法は主にグラフベースで、文をノードとして、エッジの重みは文の類似性によって測定される。
教師なし抽出要約のための文のランク付けにはトランスフォーマーの注意が利用できることがわかった。
論文 参考訳(メタデータ) (2020-10-16T08:44:09Z) - Unsupervised Summarization by Jointly Extracting Sentences and Keywords [12.387378783627762]
RepRankは、抽出多文書要約のための教師なしグラフベースのランキングモデルである。
学習した表現を用いて,有意な文やキーワードを協調的・相互強化プロセスで抽出できることを示す。
複数のベンチマークデータセットによる実験結果は、RepRankがROUGEで最高の、または同等のパフォーマンスを達成したことを示している。
論文 参考訳(メタデータ) (2020-09-16T05:58:00Z) - Discrete Optimization for Unsupervised Sentence Summarization with
Word-Level Extraction [31.648764677078837]
自動要約は、その最も重要な情報を保存しながら、文章の短いバージョンを生成する。
我々はこれら2つの側面を言語モデリングと意味的類似度メトリクスからなる教師なし目的関数でモデル化する。
提案手法は,ROUGEスコアによる教師なし文要約のための新しい最先端技術を実現する。
論文 参考訳(メタデータ) (2020-05-04T19:01:55Z) - Combining Word Embeddings and N-grams for Unsupervised Document
Summarization [2.1591018627187286]
グラフに基づく抽出文書要約は、文類似性グラフの品質に依存する。
既製のディープ埋め込み機能とtf-idf機能を採用し、新しいテキスト類似度指標を導入する。
提案手法は, tf-idf に基づく手法より優れ, DUC04 データセット上での最先端性能を実現することができる。
論文 参考訳(メタデータ) (2020-04-25T00:22:46Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。