論文の概要: Diverse, Controllable, and Keyphrase-Aware: A Corpus and Method for News
Multi-Headline Generation
- arxiv url: http://arxiv.org/abs/2004.03875v2
- Date: Sun, 4 Oct 2020 03:02:07 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 08:45:16.338318
- Title: Diverse, Controllable, and Keyphrase-Aware: A Corpus and Method for News
Multi-Headline Generation
- Title(参考訳): ディバース, 制御可能, キーフレーズ認識:ニュースマルチヘッドライン生成のためのコーパスと方法
- Authors: Dayiheng Liu, Yeyun Gong, Jie Fu, Wei Liu, Yu Yan, Bo Shao, Daxin
Jiang, Jiancheng Lv, Nan Duan
- Abstract要約: ユーザ関心のキーワードで複数の見出しを生成することを提案する。
提案手法は,品質と多様性の観点から,最先端の成果を達成する。
- 参考スコア(独自算出の注目度): 98.98411895250774
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: News headline generation aims to produce a short sentence to attract readers
to read the news. One news article often contains multiple keyphrases that are
of interest to different users, which can naturally have multiple reasonable
headlines. However, most existing methods focus on the single headline
generation. In this paper, we propose generating multiple headlines with
keyphrases of user interests, whose main idea is to generate multiple
keyphrases of interest to users for the news first, and then generate multiple
keyphrase-relevant headlines. We propose a multi-source Transformer decoder,
which takes three sources as inputs: (a) keyphrase, (b) keyphrase-filtered
article, and (c) original article to generate keyphrase-relevant, high-quality,
and diverse headlines. Furthermore, we propose a simple and effective method to
mine the keyphrases of interest in the news article and build a first
large-scale keyphrase-aware news headline corpus, which contains over 180K
aligned triples of $<$news article, headline, keyphrase$>$. Extensive
experimental comparisons on the real-world dataset show that the proposed
method achieves state-of-the-art results in terms of quality and diversity
- Abstract(参考訳): ニュースの見出し生成は、読者を惹きつけるために短い文章を作成することを目的としている。
あるニュース記事には、異なるユーザーにとって興味のある複数のキーワードが含まれていることが多い。
しかし、既存のほとんどの手法は単一の見出し生成に焦点を当てている。
本稿では,ユーザ興味のキーフレーズを用いた複数の見出しを生成することを提案する。その主目的は,まずニュースに対するユーザ関心のキーフレーズを複数生成し,次に複数のキーワード関連見出しを生成することである。
3つのソースを入力として利用するマルチソーストランスフォーマーデコーダを提案する。
(a)キーフレーズ
b) キーフレーズフィルタリング記事及び
(c) キーフレーズ関連、高品質、多彩な見出しを生成するオリジナル記事。
さらに,ニュース記事のキーフレーズをマイニングし,約180K以上の記事,見出し,キーフレーズ$>$を含む,最初の大規模キーフレーズ対応ニュース見出しコーパスを構築するための,簡便で効果的な手法を提案する。
実世界のデータセットにおける広範囲な実験比較により,提案手法は品質と多様性の観点から最先端の成果が得られることが示された。
関連論文リスト
- Data Augmentation for Low-Resource Keyphrase Generation [46.52115499306222]
キーフレーズ生成(英: Keyphrase generation)とは、任意の記事の内容をいくつかの有能なフレーズ(またはキーフレーズ)に要約するタスクである。
タスクの既存の作業は主に、取得が簡単ではない大規模なアノテートデータセットに依存しています。
我々は、純粋にリソース制約のあるドメインにおいて、キーフレーズの生成に対処するためのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2023-05-29T09:20:34Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Keyphrase Generation Beyond the Boundaries of Title and Abstract [28.56508031460787]
キーワード生成は、与えられた文書を最もよく記述するフレーズ(キーワード)を生成することを目的としている。
本研究では、意味論的に類似した記事からの追加データの統合や、与えられた記事の全文の統合が、ニューラルキーフレーズ生成モデルに役立つかどうかを考察する。
特に記事の要約形式で全文から文を追加することは、両方のキーフレーズの生成を著しく改善することを発見した。
論文 参考訳(メタデータ) (2021-12-13T16:33:01Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Pushing Paraphrase Away from Original Sentence: A Multi-Round Paraphrase
Generation Approach [97.38622477085188]
パラフレーズの多様性を向上させるためにBTmPG(Back-Translation Guided Multi-round Paraphrase Generation)を提案する。
2つのベンチマークデータセット上でBTmPGを評価する。
論文 参考訳(メタデータ) (2021-09-04T13:12:01Z) - DeepTitle -- Leveraging BERT to generate Search Engine Optimized
Headlines [0.0]
本稿では,事前学習した言語モデルを用いて,ドイツ語のニュース見出し生成を抽象化する方法について紹介する。
我々は,抽象的なテキスト要約のための細調整技術,すなわちエンコーダとデコーダに異なるベイトを使用する技術の現状を取り入れた。
ドイツのニュースデータセット上で実験を行い, ROUGE-L-gram Fスコアを40.02で達成した。
論文 参考訳(メタデータ) (2021-07-22T21:32:54Z) - Persian Keyphrase Generation Using Sequence-to-Sequence Models [1.192436948211501]
キーワードは入力テキストの要約であり、テキストで議論された主主題を提供する。
本稿では,キーフレーズ生成とニュース記事の抽出に,深いシーケンス・ツー・シーケンスモデルを用いて取り組む。
論文 参考訳(メタデータ) (2020-09-25T14:40:14Z) - PerKey: A Persian News Corpus for Keyphrase Extraction and Generation [1.192436948211501]
PerKeyは、ペルシャの6つのニュースサイトから553kのニュース記事のコーパスであり、比較的高品質な著者がキーフレーズを抽出した。
データは、キーフレーズの品質を保証するために、人間の評価に入れられた。
論文 参考訳(メタデータ) (2020-09-25T14:36:41Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。