論文の概要: Unsupervised Opinion Summarization with Content Planning
- arxiv url: http://arxiv.org/abs/2012.07808v1
- Date: Mon, 14 Dec 2020 18:41:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-08 20:25:11.942203
- Title: Unsupervised Opinion Summarization with Content Planning
- Title(参考訳): コンテンツ計画における教師なし意見要約
- Authors: Reinald Kim Amplayo, Stefanos Angelidis, Mirella Lapata
- Abstract要約: 要約モデルにコンテンツプランニングを明示的に組み込むことで、より高い品質のアウトプットが得られることを示す。
また、より自然な合成データセットを作成し、実世界の文書と要約のペアに似ている。
当社のアプローチは,情報的,一貫性,流動的な要約を生成する上で,競争モデルよりも優れています。
- 参考スコア(独自算出の注目度): 58.5308638148329
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The recent success of deep learning techniques for abstractive summarization
is predicated on the availability of large-scale datasets. When summarizing
reviews (e.g., for products or movies), such training data is neither available
nor can be easily sourced, motivating the development of methods which rely on
synthetic datasets for supervised training. We show that explicitly
incorporating content planning in a summarization model not only yields output
of higher quality, but also allows the creation of synthetic datasets which are
more natural, resembling real world document-summary pairs. Our content plans
take the form of aspect and sentiment distributions which we induce from data
without access to expensive annotations. Synthetic datasets are created by
sampling pseudo-reviews from a Dirichlet distribution parametrized by our
content planner, while our model generates summaries based on input reviews and
induced content plans. Experimental results on three domains show that our
approach outperforms competitive models in generating informative, coherent,
and fluent summaries that capture opinion consensus.
- Abstract(参考訳): 抽象的要約のためのディープラーニング技術の最近の成功は、大規模データセットの可用性を前提としている。
レビュー(製品や映画など)を要約する場合、そのようなトレーニングデータは入手できず、容易にソース化できないため、教師付きトレーニングのための合成データセットに依存する手法の開発を動機付けている。
要約モデルにコンテンツプランニングを明示的に組み込むことにより、高品質な出力が得られるだけでなく、より自然な合成データセットの作成が可能となり、実世界の文書と要約のペアに類似していることが示されている。
当社のコンテンツ計画は、高価なアノテーションにアクセスせずにデータから引き起こされるアスペクトと感情分布の形式を取っています。
コンテントプランナによってパラメータ化されたディリクレ分布から擬似レビューをサンプリングして合成データセットを作成し,入力レビューと誘導コンテンツプランに基づいて要約を生成する。
3つの領域における実験結果から,提案手法は,意見のコンセンサスを捉える情報的,一貫性的,流動的な要約を生成する上で,競争モデルよりも優れていることが示された。
関連論文リスト
- Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - ACLSum: A New Dataset for Aspect-based Summarization of Scientific
Publications [10.529898520273063]
ACLSumは、ドメインの専門家によって慎重に作成され、評価される新しい要約データセットである。
以前のデータセットとは対照的に、ACLSumは科学論文のマルチアスペクト要約を容易にする。
論文 参考訳(メタデータ) (2024-03-08T13:32:01Z) - Template-based Abstractive Microblog Opinion Summarisation [26.777997436856076]
我々は,マイクロブログ意見要約(MOS)の課題を紹介し,ゴールド標準意見要約3100のデータセットを共有する。
このデータセットには、2年間にわたるつぶやきの要約が含まれており、他のパブリックなTwitter要約データセットよりも多くのトピックをカバーしている。
論文 参考訳(メタデータ) (2022-08-08T12:16:01Z) - Improving the Faithfulness of Abstractive Summarization via Entity
Coverage Control [27.214742188672464]
エンティティカバレッジ制御(ECC)を用いたエンティティレベルの幻覚の治療法を提案する。
ECCはエンティティカバレッジの精度を計算し、トレーニング例ごとに対応する制御コードをプリペンドする。
提案手法は,教師付き微調整およびゼロショット設定において,より忠実かつ健全な抽象的要約をもたらすことを示す。
論文 参考訳(メタデータ) (2022-07-05T18:52:19Z) - Aspect-Controllable Opinion Summarization [58.5308638148329]
アスペクトクエリに基づいてカスタマイズした要約を生成する手法を提案する。
レビューコーパスを用いて、アスペクトコントローラで強化された(リビュー、サマリ)ペアの合成トレーニングデータセットを作成する。
合成データセットを用いて事前学習したモデルを微調整し、アスペクトコントローラを変更することでアスペクト固有の要約を生成する。
論文 参考訳(メタデータ) (2021-09-07T16:09:17Z) - Improving Zero and Few-Shot Abstractive Summarization with Intermediate
Fine-tuning and Data Augmentation [101.26235068460551]
大規模テキストコーパス上での自己教師対象による事前学習モデルは、英語テキスト要約タスクにおける最先端のパフォーマンスを達成する。
モデルは通常、数十万のデータポイントで微調整されるが、これは新しいニッチなドメインに要約を適用する際に、実現不可能な要件である。
我々は、教師なし、データセット固有の方法で要約のための訓練済みモデルを微調整するための、WikiTransferと呼ばれる新しい一般化可能な手法を紹介した。
論文 参考訳(メタデータ) (2020-10-24T08:36:49Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - Unsupervised Opinion Summarization with Noising and Denoising [85.49169453434554]
ユーザレビューのコーパスから合成データセットを作成し、レビューをサンプリングし、要約のふりをして、ノイズのあるバージョンを生成します。
テスト時に、モデルは本物のレビューを受け入れ、健全な意見を含む要約を生成し、合意に達しないものをノイズとして扱います。
論文 参考訳(メタデータ) (2020-04-21T16:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。