論文の概要: Simple Yet Effective Synthetic Dataset Construction for Unsupervised
Opinion Summarization
- arxiv url: http://arxiv.org/abs/2303.11660v1
- Date: Tue, 21 Mar 2023 08:08:04 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 16:01:30.757854
- Title: Simple Yet Effective Synthetic Dataset Construction for Unsupervised
Opinion Summarization
- Title(参考訳): 教師なしオピニオン要約のためのシンプルで効果的な合成データセット構築
- Authors: Ming Shen, Jie Ma, Shuai Wang, Yogarshi Vyas, Kalpit Dixit, Miguel
Ballesteros, Yassine Benajiba
- Abstract要約: 本稿では、アスペクト特化と一般的な意見要約の両方を生成するための、単純で効果的な教師なしの2つのアプローチを提案する。
最初のアプローチであるSed Words Based Leave-One-Out (SW-LOO) は、正確にマッチングされたアスペクトシードワードによって、アスペクト関連のレビューを識別する。
第2のアプローチであるNLI-LOO(Natural Language Inference Based Leave-One-Out)では、NLIモデルを用いたアスペクト関連文を、シード語を使わずにより一般的な設定で識別する。
- 参考スコア(独自算出の注目度): 28.52201592634964
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Opinion summarization provides an important solution for summarizing opinions
expressed among a large number of reviews. However, generating aspect-specific
and general summaries is challenging due to the lack of annotated data. In this
work, we propose two simple yet effective unsupervised approaches to generate
both aspect-specific and general opinion summaries by training on synthetic
datasets constructed with aspect-related review contents. Our first approach,
Seed Words Based Leave-One-Out (SW-LOO), identifies aspect-related portions of
reviews simply by exact-matching aspect seed words and outperforms existing
methods by 3.4 ROUGE-L points on SPACE and 0.5 ROUGE-1 point on OPOSUM+ for
aspect-specific opinion summarization. Our second approach, Natural Language
Inference Based Leave-One-Out (NLI-LOO) identifies aspect-related sentences
utilizing an NLI model in a more general setting without using seed words and
outperforms existing approaches by 1.2 ROUGE-L points on SPACE for
aspect-specific opinion summarization and remains competitive on other metrics.
- Abstract(参考訳): 意見要約は、多くのレビューで表される意見を要約するための重要なソリューションを提供する。
しかし,アノテートデータがないため,アスペクト特化や一般的な要約の生成が困難である。
本稿では,アスペクト関連レビューコンテンツを用いた合成データセットのトレーニングにより,アスペクト固有および一般意見要約を生成するための,単純かつ効果的な2つの非教師付きアプローチを提案する。
最初のアプローチであるSed Words Based Leave-One-Out (SW-LOO) では、アスペクト固有の意見要約のため、SPACEの3.4ROUGE-L点とOPOSUM+の0.5ROUGE-1点で既存の手法よりも優れている。
第2のアプローチであるNLI-LOO(Natural Language Inference Based Leave-One-Out)は、NLIモデルを用いたアスペクト関連文を、シードワードを使わずにより一般的な設定で識別し、アスペクト固有の意見要約のためのSPACE上の1.2 ROUGE-Lポイントで既存のアプローチより優れている。
関連論文リスト
- Towards Enhancing Coherence in Extractive Summarization: Dataset and Experiments with LLMs [70.15262704746378]
我々は,5つの公開データセットと自然言語ユーザフィードバックのためのコヒーレントな要約からなる,体系的に作成された人間アノテーションデータセットを提案する。
Falcon-40BとLlama-2-13Bによる予備的な実験では、コヒーレントなサマリーを生成するという点で大幅な性能向上(10%ルージュ-L)が見られた。
論文 参考訳(メタデータ) (2024-07-05T20:25:04Z) - FENICE: Factuality Evaluation of summarization based on Natural language Inference and Claim Extraction [85.26780391682894]
自然言語推論とクレーム抽出(FENICE)に基づく要約のファクチュアリティ評価を提案する。
FENICEは、ソース文書内の情報と、要約から抽出されたクレームと呼ばれる一連の原子的事実との間のNLIベースのアライメントを利用する。
我々の測定基準は、事実性評価のためのデファクトベンチマークであるAGGREFACTに関する新しい技術状況を設定する。
論文 参考訳(メタデータ) (2024-03-04T17:57:18Z) - Aspect-based Meeting Transcript Summarization: A Two-Stage Approach with
Weak Supervision on Sentence Classification [91.13086984529706]
Aspect-based meeting transcript summarization は複数の要約を生成することを目的としている。
従来の要約手法は、全ての側面の情報を1つの要約で混合する。
アスペクトベースの会議書き起こし要約のための2段階の手法を提案する。
論文 参考訳(メタデータ) (2023-11-07T19:06:31Z) - Prompted Opinion Summarization with GPT-3.5 [115.95460650578678]
GPT-3.5モデルは人体評価において非常に高い性能を示す。
我々は,標準評価指標がこれを反映していないことを論じ,忠実性,事実性,汎用性を重視した3つの新しい指標を導入する。
論文 参考訳(メタデータ) (2022-11-29T04:06:21Z) - Constrained Abstractive Summarization: Preserving Factual Consistency
with Constrained Generation [93.87095877617968]
本稿では,抽象要約の現実的一貫性を保ちつつ,制約付き抽象要約(CAS)を提案する。
我々は、CASを満たすために、一般的に自己回帰生成モデルに適用される語彙制約付き復号法を採用する。
対話的要約において1つの手動制約のみを使用する場合、最大13.8ROUGE-2ゲインを観測する。
論文 参考訳(メタデータ) (2020-10-24T00:27:44Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - A Multi-task Learning Framework for Opinion Triplet Extraction [24.983625011760328]
本稿では,意見三重項抽出課題としてのABSAの新たな視点について述べる。
アスペクト項と意見項を協調的に抽出するマルチタスク学習フレームワークを提案する。
提案するフレームワークを,ASBAの4つのSemEvalベンチマークで評価する。
論文 参考訳(メタデータ) (2020-10-04T08:31:54Z) - SueNes: A Weakly Supervised Approach to Evaluating Single-Document
Summarization via Negative Sampling [25.299937353444854]
本研究は,参照要約の存在を伴わない,弱教師付き要約評価手法に対する概念実証研究である。
既存の要約データセットの大量データは、文書と破損した参照要約とのペアリングによってトレーニングのために変換される。
論文 参考訳(メタデータ) (2020-05-13T15:40:13Z) - Aspect and Opinion Aware Abstractive Review Summarization with
Reinforced Hard Typed Decoder [18.894655634326423]
本稿では,まず3つの型から出力語型を予測し,次に予測語型を利用して最終単語分布を生成する2段階強化学習手法を提案する。
Amazon製品レビューデータセットの2つの結果から、ROUGEスコアに基づいた強力なベースラインアプローチを一貫して上回ります。
論文 参考訳(メタデータ) (2020-04-13T03:35:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。