論文の概要: WikiAsp: A Dataset for Multi-domain Aspect-based Summarization
- arxiv url: http://arxiv.org/abs/2011.07832v1
- Date: Mon, 16 Nov 2020 10:02:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-25 00:05:22.301589
- Title: WikiAsp: A Dataset for Multi-domain Aspect-based Summarization
- Title(参考訳): wikiasp:マルチドメインアスペクトベースの要約のためのデータセット
- Authors: Hiroaki Hayashi, Prashant Budania, Peng Wang, Chris Ackerson, Raj
Neervannan, Graham Neubig
- Abstract要約: マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、アスペクトアノテーションのプロキシとして、各記事のセクションタイトルとバウンダリを使用して、20の異なるドメインからウィキペディア記事を使用してデータセットを構築します。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
- 参考スコア(独自算出の注目度): 69.13865812754058
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Aspect-based summarization is the task of generating focused summaries based
on specific points of interest. Such summaries aid efficient analysis of text,
such as quickly understanding reviews or opinions from different angles.
However, due to large differences in the type of aspects for different domains
(e.g., sentiment, product features), the development of previous models has
tended to be domain-specific. In this paper, we propose WikiAsp, a large-scale
dataset for multi-domain aspect-based summarization that attempts to spur
research in the direction of open-domain aspect-based summarization.
Specifically, we build the dataset using Wikipedia articles from 20 different
domains, using the section titles and boundaries of each article as a proxy for
aspect annotation. We propose several straightforward baseline models for this
task and conduct experiments on the dataset. Results highlight key challenges
that existing summarization models face in this setting, such as proper pronoun
handling of quoted sources and consistent explanation of time-sensitive events.
- Abstract(参考訳): アスペクトベースの要約は、特定の関心点に基づいて集中的な要約を生成するタスクである。
このような要約は、レビューや異なる角度からの意見の迅速な理解など、テキストの効率的な分析に役立つ。
しかし、異なるドメイン(例えば、感情、製品の特徴)のアスペクトのタイプに大きな違いがあるため、以前のモデルの開発はドメイン固有の傾向にある。
本稿では、オープンドメインアスペクトベースの要約の方向の研究を促進するために、マルチドメインアスペクトベースの要約のための大規模データセットであるWikiAspを提案する。
具体的には、20の異なるドメインのwikipediaの記事を使って、各記事のセクションタイトルとバウンダリをアスペクトアノテーションのプロキシとして使用してデータセットを構築します。
本稿では,このタスクのベースラインモデルをいくつか提案し,データセット上で実験を行う。
その結果,既存の要約モデルがこの設定で直面する重要な課題,例えば引用されたソースの適切な代名詞処理,時間に敏感なイベントの一貫した説明などが浮き彫りになった。
関連論文リスト
- Language Guided Domain Generalized Medical Image Segmentation [68.93124785575739]
単一ソースドメインの一般化は、より信頼性が高く一貫性のあるイメージセグメンテーションを現実の臨床環境にわたって約束する。
本稿では,テキストエンコーダ機能によって案内されるコントラスト学習機構を組み込むことで,テキスト情報を明確に活用する手法を提案する。
文献における既存手法に対して,本手法は良好な性能を発揮する。
論文 参考訳(メタデータ) (2024-04-01T17:48:15Z) - OpenAsp: A Benchmark for Multi-document Open Aspect-based Summarization [19.079053035229695]
アスペクトベースの要約のベンチマークであるOpenAspを紹介する。
OpenAspで実現された現実的なオープン・アスペクト設定は、現在の最先端の要約モデルに挑戦していることを示す。
論文 参考訳(メタデータ) (2023-12-07T17:06:20Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - OASum: Large-Scale Open Domain Aspect-based Summarization [29.45232847592956]
我々は、ウィキペディア.orgのクラウドソーシングの知識を活用し、OASumという高品質で大規模なアスペクトベースの要約データセットを自動生成する。
OASumには370万以上のインスタンスがあり、200万のWikipediaページで約100万の異なる側面がある。
特定のドメインにおけるデータの不足を克服するために、我々は7つの下流データセットでゼロショット、少数ショット、微調整を行う。
論文 参考訳(メタデータ) (2022-12-19T04:04:17Z) - Syntax-Guided Domain Adaptation for Aspect-based Sentiment Analysis [23.883810236153757]
ドメイン適応は、ドメイン間で共通の知識を伝達することによって、新しいドメインにおけるデータ不足問題を緩和するための一般的なソリューションである。
より効果的なクロスドメインABSAのための、SDAMと呼ばれる新しい構文誘導型ドメイン適応モデルを提案する。
我々のモデルは、クロスドメインEnd2EndABSAタスクのMicro-F1メトリックに関して、最先端のベースラインを一貫して上回ります。
論文 参考訳(メタデータ) (2022-11-10T10:09:33Z) - Unsupervised Summarization with Customized Granularities [76.26899748972423]
本稿では,最初の教師なし多粒度要約フレームワークであるGranuSumを提案する。
異なる数のイベントを入力することで、GranuSumは教師なしの方法で複数の粒度のサマリーを生成することができる。
論文 参考訳(メタデータ) (2022-01-29T05:56:35Z) - Aspect-Oriented Summarization through Query-Focused Extraction [23.62412515574206]
実際のユーザのニーズは、特定のクエリではなく、ユーザが興味を持っているデータセットの幅広いトピックという側面に、より深く浸透することが多い。
抽出クエリに焦点を絞った学習手法をベンチマークし、モデルを訓練するための対照的な拡張手法を提案する。
我々は2つのアスペクト指向データセットを評価し、この手法が一般的な要約システムよりも焦点を絞った要約を得られることを発見した。
論文 参考訳(メタデータ) (2021-10-15T18:06:21Z) - Weakly-Supervised Aspect-Based Sentiment Analysis via Joint
Aspect-Sentiment Topic Embedding [71.2260967797055]
アスペクトベース感情分析のための弱教師付きアプローチを提案する。
We learn sentiment, aspects> joint topic embeddeds in the word embedding space。
次に、ニューラルネットワークを用いて単語レベルの識別情報を一般化する。
論文 参考訳(メタデータ) (2020-10-13T21:33:24Z) - CDEvalSumm: An Empirical Study of Cross-Dataset Evaluation for Neural
Summarization Systems [121.78477833009671]
データセット間設定下での様々な要約モデルの性能について検討する。
異なるドメインの5つのデータセットに対する11の代表的な要約システムに関する包括的な研究は、モデルアーキテクチャと生成方法の影響を明らかにしている。
論文 参考訳(メタデータ) (2020-10-11T02:19:15Z) - Unsupervised Domain Adaptation in Semantic Segmentation: a Review [22.366638308792734]
本研究の目的は, セマンティックセグメンテーションのための深層ネットワークのUnsupervised Domain Adaptation (UDA) の最近の進歩について概説することである。
論文 参考訳(メタデータ) (2020-05-21T20:10:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。