論文の概要: Unsupervised Extractive Opinion Summarization Using Sparse Coding
- arxiv url: http://arxiv.org/abs/2203.07921v1
- Date: Tue, 15 Mar 2022 14:03:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 14:56:46.039541
- Title: Unsupervised Extractive Opinion Summarization Using Sparse Coding
- Title(参考訳): スパース符号化を用いた教師なし抽出的意見要約
- Authors: Somnath Basu Roy Chowdhury, Chao Zhao, Snigdha Chaturvedi
- Abstract要約: 本稿では,セマンティック・オートエンコーダ(Semantic Autoencoder,SemAE)について,教師なしの方法で抽出的意見要約を行う。
SemAEは辞書学習を使用して、レビューから暗黙的に意味情報をキャプチャし、各文のセマンティック単位に対する潜在表現を学習する。
本研究では,SPACE と AMAZON のデータセット上での強い性能について報告する。
- 参考スコア(独自算出の注目度): 19.598936651505067
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Opinion summarization is the task of automatically generating summaries that
encapsulate information from multiple user reviews. We present Semantic
Autoencoder (SemAE) to perform extractive opinion summarization in an
unsupervised manner. SemAE uses dictionary learning to implicitly capture
semantic information from the review and learns a latent representation of each
sentence over semantic units. A semantic unit is supposed to capture an
abstract semantic concept. Our extractive summarization algorithm leverages the
representations to identify representative opinions among hundreds of reviews.
SemAE is also able to perform controllable summarization to generate
aspect-specific summaries. We report strong performance on SPACE and AMAZON
datasets, and perform experiments to investigate the functioning of our model.
Our code is publicly available at https://github.com/brcsomnath/SemAE.
- Abstract(参考訳): Opinion summarizationは、複数のユーザレビューから情報をカプセル化した要約を自動的に生成するタスクである。
本稿では,セマンティック・オートエンコーダ(Semantic Autoencoder,SemAE)について,教師なしの方法で抽出的意見要約を行う。
SemAEは辞書学習を使用して、レビューから暗黙的に意味情報をキャプチャし、各文のセマンティック単位に対する潜在表現を学習する。
セマンティックユニットは抽象的なセマンティック概念をキャプチャする。
抽出要約アルゴリズムは,その表現を利用して,数百のレビューの中から代表者の意見を識別する。
SemAEはまた、アスペクト固有の要約を生成するために制御可能な要約を実行することもできる。
宇宙とamazonのデータセットでの強力なパフォーマンスを報告し、モデルの機能を調べる実験を行いました。
私たちのコードはhttps://github.com/brcsomnath/SemAE.comで公開されています。
関連論文リスト
- AugSumm: towards generalizable speech summarization using synthetic
labels from large language model [61.73741195292997]
抽象音声要約(SSUM)は、音声から人間に似た要約を生成することを目的としている。
従来のSSUMモデルは、主に、人間による注釈付き決定論的要約(英語版)を用いて訓練され、評価されている。
AugSummは,人間のアノテータが拡張要約を生成するためのプロキシとして,大規模言語モデル(LLM)を利用する手法である。
論文 参考訳(メタデータ) (2024-01-10T18:39:46Z) - Attributable and Scalable Opinion Summarization [79.87892048285819]
我々は、頻繁なエンコーディングを復号することで抽象的な要約を生成し、同じ頻繁なエンコーディングに割り当てられた文を選択して抽出的な要約を生成する。
本手法は,要約プロセスの一部として要約を生成するために使用される文を同定するため,帰属的手法である。
なぜなら、アグリゲーションはトークンの長いシーケンスではなく、潜在空間で実行されるからである。
論文 参考訳(メタデータ) (2023-05-19T11:30:37Z) - Unsupervised Opinion Summarisation in the Wasserstein Space [22.634245146129857]
We present WassOS, an unsupervised abstractive summarization model that makes using the Wasserstein distance。
我々は、WassOSがROUGEメトリクスの最先端をほぼ常に上回り、人間の評価による最高のサマリーを一貫して生成していることを示します。
論文 参考訳(メタデータ) (2022-11-27T19:45:38Z) - Summarization Programs: Interpretable Abstractive Summarization with
Neural Modular Trees [89.60269205320431]
現在の抽象的要約モデルは明確な解釈可能性の欠如に悩まされるか、あるいは不完全理性を与える。
本稿では,バイナリツリーの(順序付き)リストからなる解釈可能なモジュラーフレームワークであるSummarization Program (SP)を提案する。
要約プログラムは、要約文毎に1つのルートノードを含み、各要約文と文書文を個別のツリーで接続する。
論文 参考訳(メタデータ) (2022-09-21T16:50:22Z) - Unsupervised Opinion Summarization Using Approximate Geodesics [38.19696482602788]
我々は,未指導の抽出的意見要約を行う新しいシステムであるGeoSumm(GeoSumm)を紹介する。
GeoSummはエンコーダ-デコーダに基づく表現学習モデルで、潜在意味単位上の分布としてテキストの表現を生成する。
我々はこれらの表現を用いて、新しい測地線距離に基づくスコアリング機構を用いて、レビュー文の妥当性を定量化する。
論文 参考訳(メタデータ) (2022-09-15T17:37:08Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - At Which Level Should We Extract? An Empirical Analysis on Extractive
Document Summarization [110.54963847339775]
本研究は,全文を抽出する際,不必要な問題や冗長性が存在することを示す。
選挙区解析木に基づくサブセグメント単位の抽出を提案する。
論文 参考訳(メタデータ) (2020-04-06T13:35:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。