論文の概要: On the Trade-off between Redundancy and Local Coherence in Summarization
- arxiv url: http://arxiv.org/abs/2205.10192v2
- Date: Thu, 6 Jun 2024 13:27:20 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-08 01:27:18.068957
- Title: On the Trade-off between Redundancy and Local Coherence in Summarization
- Title(参考訳): 要約における冗長性と局所コヒーレンスとのトレードオフについて
- Authors: Ronald Cardenas, Matthias Galle, Shay B. Cohen,
- Abstract要約: 抽出した要約文の相互結合と冗長性の制御を目的とした場合のトレードオフについて検討する。
提案した非教師システムでは,文書の冗長性のレベルによって,密集度の高い要約を抽出できることがわかった。
- 参考スコア(独自算出の注目度): 20.16107829497668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extractive summaries are usually presented as lists of sentences with no expected cohesion between them and with plenty of redundant information if not accounted for. In this paper, we investigate the trade-offs incurred when aiming to control for inter-sentential cohesion and redundancy in extracted summaries, and their impact on their informativeness. As case study, we focus on the summarization of long, highly redundant documents and consider two optimization scenarios, reward-guided and with no supervision. In the reward-guided scenario, we compare systems that control for redundancy and cohesion during sentence scoring. In the unsupervised scenario, we introduce two systems that aim to control all three properties -- informativeness, redundancy, and cohesion -- in a principled way. Both systems implement a psycholinguistic theory that simulates how humans keep track of relevant content units and how cohesion and non-redundancy constraints are applied in short-term memory during reading. Extensive automatic and human evaluations reveal that systems optimizing for -- among other properties -- cohesion are capable of better organizing content in summaries compared to systems that optimize only for redundancy, while maintaining comparable informativeness. We find that the proposed unsupervised systems manage to extract highly cohesive summaries across varying levels of document redundancy, although sacrificing informativeness in the process. Finally, we lay evidence as to how simulated cognitive processes impact the trade-off between the analyzed summary properties.
- Abstract(参考訳): 抽出要約は、通常、それらの間の結合が期待されていない文のリストとして提示される。
本稿では,抽出した要約文の相互結合と冗長性制御を目的とした場合のトレードオフとその情報性への影響について検討する。
ケーススタディでは、長い冗長な文書の要約に焦点をあて、報酬誘導と監督なしの2つの最適化シナリオを検討する。
報酬誘導のシナリオでは,文の採点時の冗長性や凝集度を制御するシステムを比較する。
教師なしのシナリオでは、情報性、冗長性、凝集性の3つの特性を原則的に制御することを目的とした2つのシステムを導入します。
どちらのシステムも、人間が関連するコンテンツ単位を追跡する方法をシミュレートする心理言語学理論を実装しており、読み上げ中の短期記憶において、凝集や非冗長性の制約がどのように適用されるかを示している。
大規模な自動評価と人的評価により、コヒージョンは -- その他の特性の中で -- 最適化されたシステムが、冗長性のみを最適化するシステムに比べて、要約中のコンテンツをよりよく整理する能力を持つことが明らかになった。
提案する非教師システムでは,文書の冗長性のレベルが多様であるにもかかわらず,高度に密集した要約を抽出できることがわかった。
最後に、シミュレーションされた認知過程が分析された要約特性間のトレードオフにどのように影響するかを示す。
関連論文リスト
- Unifying Feature and Cost Aggregation with Transformers for Semantic and Visual Correspondence [51.54175067684008]
本稿では,高密度マッチングタスク用に設計されたTransformerベースの積分機能とコスト集約ネットワークを提案する。
まず, 特徴集約とコスト集約が異なる特徴を示し, 双方の集約プロセスの司法的利用から生じる実質的な利益の可能性を明らかにした。
本フレームワークは意味マッチングのための標準ベンチマークで評価され,また幾何マッチングにも適用された。
論文 参考訳(メタデータ) (2024-03-17T07:02:55Z) - `Keep it Together': Enforcing Cohesion in Extractive Summaries by
Simulating Human Memory [22.659031563705245]
本稿では,要約における情報性や冗長性を制御しつつ,凝集を強制することを目的としている。
我々の文セレクタは、人間の記憶をシミュレートしてトピックを追跡する。
非常に密集した要約を抽出することはできるが、それでも人間にとって有意義な内容の要約を読めばよい。
論文 参考訳(メタデータ) (2024-02-16T12:43:26Z) - Interpretable Automatic Fine-grained Inconsistency Detection in Text
Summarization [56.94741578760294]
本研究の目的は, 要約中の事実誤りの微粒化を予測し, 微粒化不整合検出の課題を提案することである。
要約における現実的不整合の検査方法に触発され,解析可能な微粒不整合検出モデルであるFinGrainFactを提案する。
論文 参考訳(メタデータ) (2023-05-23T22:11:47Z) - Enhancing Coherence of Extractive Summarization with Multitask Learning [40.349019691412465]
本研究では,コヒーレンス向上を伴う抽出要約のためのマルチタスク学習アーキテクチャを提案する。
アーキテクチャは、抽出要約器とコヒーレント判別器モジュールとを含む。
実験の結果,提案手法は抽出した要約文の連続文の割合を大幅に改善することがわかった。
論文 参考訳(メタデータ) (2023-05-22T09:20:58Z) - How to Find Strong Summary Coherence Measures? A Toolbox and a
Comparative Study for Summary Coherence Measure Evaluation [3.434197496862117]
球面上での要約コヒーレンスモデリングのための様々な手法を大規模に検討する。
システム内相関とバイアス行列という2つの新しい分析尺度を導入し,コヒーレンス尺度のバイアスを識別し,システムレベルの共同設立者に対して堅牢性を提供する。
現在利用可能な自動コヒーレンス対策はいずれも、すべての評価指標にわたるシステム要約に信頼性の高いコヒーレンススコアを割り当てることはできないが、大規模言語モデルは、異なる要約の長さにわたって一般化する必要があることを考慮すれば、有望な結果を示す。
論文 参考訳(メタデータ) (2022-09-14T09:42:19Z) - SNaC: Coherence Error Detection for Narrative Summarization [73.48220043216087]
SNaCは長文の微粒化アノテーションに根ざした物語コヒーレンス評価フレームワークである。
本稿では,生成した物語要約におけるコヒーレンスエラーの分類法を開発し,150冊の本や映画の脚本要約にまたがる6.6k文のスパンレベルアノテーションを収集する。
我々の研究は、最先端の要約モデルによって生成されるコヒーレンスエラーの最初の特徴と、群衆アノテータからコヒーレンス判断を引き出すためのプロトコルを提供する。
論文 参考訳(メタデータ) (2022-05-19T16:01:47Z) - Re-Examining System-Level Correlations of Automatic Summarization
Evaluation Metrics [64.81682222169113]
システムレベルの相関により, 要約品質の人的判断を再現する自動要約評価指標を確実に定量化する。
システムレベルの相関の定義が、実際にシステムを評価するためにメトリクスがどのように使われているかと矛盾する2つの方法を特定する。
論文 参考訳(メタデータ) (2022-04-21T15:52:14Z) - Weakly-Supervised Spatio-Temporal Anomaly Detection in Surveillance
Video [128.41392860714635]
Weakly-Supervised Snoma-Temporally Detection (WSSTAD) を監視ビデオに導入する。
WSSTADは異常事象を封止する時空間管(すなわち連続する境界ボックスのシーケンス)をローカライズすることを目的としている。
本稿では,空間的・時間的領域に複数粒度を持つ入力提案を行うデュアルブランチネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-09T06:11:14Z) - Unsupervised Extractive Summarization using Pointwise Mutual Information [5.544401446569243]
文間のポイントワイズ相互情報 (PMI) を用いて, 関連性および冗長性の新たな指標を提案する。
本手法は, ニュース, 医療雑誌記事, 個人逸話など, さまざまな領域のデータセットにおける類似性に基づく手法を上回っていることを示した。
論文 参考訳(メタデータ) (2021-02-11T21:05:50Z) - Systematically Exploring Redundancy Reduction in Summarizing Long
Documents [6.812554384019158]
長い文書を要約する際、冗長性に対処する方法を探索し比較する。
提案手法は,2つの学術論文データセット上でのROUGEスコアに対して,最先端の手法を実現することを実証した。
論文 参考訳(メタデータ) (2020-11-30T19:07:27Z) - Multi-Fact Correction in Abstractive Text Summarization [98.27031108197944]
Span-Factは、質問応答モデルから学んだ知識を活用して、スパン選択によるシステム生成サマリーの補正を行う2つの事実補正モデルのスイートである。
我々のモデルは、ソースコードのセマンティック一貫性を確保するために、反復的または自動回帰的にエンティティを置き換えるために、シングルまたはマルチマスキング戦略を採用している。
実験の結果,自動測定と人的評価の両面において,要約品質を犠牲にすることなく,システム生成要約の事実整合性を大幅に向上させることができた。
論文 参考訳(メタデータ) (2020-10-06T02:51:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。