論文の概要: Abstractive Snippet Generation
- arxiv url: http://arxiv.org/abs/2002.10782v2
- Date: Sun, 15 Mar 2020 22:50:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 21:55:14.089910
- Title: Abstractive Snippet Generation
- Title(参考訳): 抽象スニペット生成
- Authors: Wei-Fan Chen, Shahbaz Syed, Benno Stein, Matthias Hagen, Martin
Potthast
- Abstract要約: 抽象スニペット(英: abstractive snippet)とは、検索エンジンの検索結果ページのWebページを要約するために作成されたテキストである。
本稿では,遠隔監視のための2つの大規模ソース,すなわちアンカーコンテキストとWebディレクトリを識別する,抽象スニペット生成のための新しいアプローチを提案する。
本稿では,2方向の抽象スニペット生成モデルを提案し,コーパスと生成した抽象スニペットの品質を標準尺度,クラウドソーシング,および技術状況と比較して評価する。
- 参考スコア(独自算出の注目度): 39.30483409765206
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An abstractive snippet is an originally created piece of text to summarize a
web page on a search engine results page. Compared to the conventional
extractive snippets, which are generated by extracting phrases and sentences
verbatim from a web page, abstractive snippets circumvent copyright issues;
even more interesting is the fact that they open the door for personalization.
Abstractive snippets have been evaluated as equally powerful in terms of user
acceptance and expressiveness---but the key question remains: Can abstractive
snippets be automatically generated with sufficient quality?
This paper introduces a new approach to abstractive snippet generation: We
identify the first two large-scale sources for distant supervision, namely
anchor contexts and web directories. By mining the entire ClueWeb09 and
ClueWeb12 for anchor contexts and by utilizing the DMOZ Open Directory Project,
we compile the Webis Abstractive Snippet Corpus 2020, comprising more than 3.5
million triples of the form $\langle$query, snippet, document$\rangle$ as
training examples, where the snippet is either an anchor context or a web
directory description in lieu of a genuine query-biased abstractive snippet of
the web document. We propose a bidirectional abstractive snippet generation
model and assess the quality of both our corpus and the generated abstractive
snippets with standard measures, crowdsourcing, and in comparison to the state
of the art. The evaluation shows that our novel data sources along with the
proposed model allow for producing usable query-biased abstractive snippets
while minimizing text reuse.
- Abstract(参考訳): 抽象スニペット(abstractive snippet)は、検索エンジンの結果ページにウェブページを要約するために作成されたテキストである。
従来の抽出スニペットは、Webページから動詞句や文を抽出することによって生成されるものであり、抽象スニペットは著作権問題を回避し、さらに興味深いのは、パーソナライズのための扉を開くことである。
抽象的なスニペットは、ユーザーの受け入れと表現力の点で等しく強力であると評価されてきたが、重要な疑問は残る。
本稿では,遠隔監視のための2つの大規模ソース,すなわちアンカーコンテキストとWebディレクトリを識別する,抽象スニペット生成のための新しいアプローチを提案する。
これは$\langle$query, snippet, document$\rangle$という形式の350万以上のトリプルからなり、スニペットはアンカーコンテキストかwebドキュメントの真のクエリバイアスされた抽象スニペットの代わりにwebディレクトリ記述である。
本稿では,2方向の抽象スニペット生成モデルを提案し,コーパスと生成した抽象スニペットの品質を標準尺度,クラウドソーシング,および技術状況と比較して評価する。
評価の結果,提案モデルと併用した新たなデータソースにより,テキスト再利用を最小化しつつ,クエリバイアス付き抽象スニペットを作成できることがわかった。
関連論文リスト
- A Survey on Neural Abstractive Summarization Methods and Factual
Consistency of Summarization [18.763290930749235]
要約は、サブセット(要約)を作成するために、テキストデータの集合を計算的に短縮する過程である
既存の要約法は、抽出法と抽象法という2つのタイプに大別できる。
抽出要約器は、ソース文書からテキストスニペットを明示的に選択し、抽象要約器は、ソースで広く普及している最も健全な概念を伝えるために、新しいテキストスニペットを生成する。
論文 参考訳(メタデータ) (2022-04-20T14:56:36Z) - Reinforcing Semantic-Symmetry for Document Summarization [15.113768658584979]
文書要約は、長い文書を詳細な情報と正確な意味記述を備えた短いバージョンに凝縮する。
本稿では,文書要約のための新しいtextbfreinforcing stextbfemantic-textbfsymmetric Learning textbfmodelを提案する。
CNN/Daily MailとBigPatentの2つの大胆なベンチマークデータセットに対して、一連の実験が行われた。
論文 参考訳(メタデータ) (2021-12-14T17:41:37Z) - iFacetSum: Coreference-based Interactive Faceted Summarization for
Multi-Document Exploration [63.272359227081836]
iFacetSumは、インタラクティブな要約と顔検索を統合している。
微粒なファセットは、クロスドキュメントのコア参照パイプラインに基づいて自動的に生成される。
論文 参考訳(メタデータ) (2021-09-23T20:01:11Z) - TWAG: A Topic-Guided Wikipedia Abstract Generator [23.937804531845938]
Wikipediaの抽象生成は、ウィキペディアの抽象化をWebソースから抽出することを目的としており、大きな成功を収めている。
それまでの著作では、抽象概念を平易なテキストとみなしており、ある実体の記述であり、異なるトピックに分解できるという事実を無視している。
本稿では,トピック情報を用いた2段階モデルTWAGを提案する。
論文 参考訳(メタデータ) (2021-06-29T07:42:08Z) - Constrained Abstractive Summarization: Preserving Factual Consistency
with Constrained Generation [93.87095877617968]
本稿では,抽象要約の現実的一貫性を保ちつつ,制約付き抽象要約(CAS)を提案する。
我々は、CASを満たすために、一般的に自己回帰生成モデルに適用される語彙制約付き復号法を採用する。
対話的要約において1つの手動制約のみを使用する場合、最大13.8ROUGE-2ゲインを観測する。
論文 参考訳(メタデータ) (2020-10-24T00:27:44Z) - Few-Shot Learning for Opinion Summarization [117.70510762845338]
オピニオン要約は、複数の文書で表現された主観的な情報を反映したテキストの自動生成である。
本研究では,要約テキストの生成をブートストラップするのには,少数の要約でも十分であることを示す。
提案手法は, 従来の抽出法および抽象法を, 自動的, 人的評価において大きく上回っている。
論文 参考訳(メタデータ) (2020-04-30T15:37:38Z) - Exploring Explainable Selection to Control Abstractive Summarization [51.74889133688111]
説明可能性を重視した新しいフレームワークを開発する。
新しいペアワイズ行列は、文の相互作用、中心性、属性スコアをキャプチャする。
コンストラクタ内の文分割アテンション機構は、最終要約が所望のコンテンツを強調することを保証する。
論文 参考訳(メタデータ) (2020-04-24T14:39:34Z) - Extractive Summarization as Text Matching [123.09816729675838]
本稿では,ニューラル抽出要約システムの構築方法に関するパラダイムシフトを作成する。
抽出した要約タスクを意味テキストマッチング問題として定式化する。
我々はCNN/DailyMailの最先端抽出結果を新しいレベル(ROUGE-1の44.41)に推し進めた。
論文 参考訳(メタデータ) (2020-04-19T08:27:57Z) - Selective Attention Encoders by Syntactic Graph Convolutional Networks
for Document Summarization [21.351111598564987]
本稿では,文書中の文から解析木を接続するグラフを提案し,文書の構文表現を学習するために重ねられたグラフ畳み込みネットワーク(GCN)を利用する。
提案したGCNによる選択的アテンションアプローチは,ベースラインよりも優れ,データセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-18T01:30:02Z) - StructSum: Summarization via Structured Representations [27.890477913486787]
抽象テキスト要約は、長い資料の情報を要約した要約に圧縮することを目的としている。
モデリング技術の進歩にもかかわらず、抽象的な要約モデルは依然としていくつかの重要な課題に悩まされている。
本稿では,これらの課題に対処するための要約のための文書レベルの構造誘導に基づくフレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-01T20:32:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。