論文の概要: Unsupervised Deep Keyphrase Generation
- arxiv url: http://arxiv.org/abs/2104.08729v1
- Date: Sun, 18 Apr 2021 05:53:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-20 14:36:44.216963
- Title: Unsupervised Deep Keyphrase Generation
- Title(参考訳): 教師なし深層キーフレーズ生成
- Authors: Xianjie Shen, Yinghan Wang, Rui Meng, Jingbo Shang
- Abstract要約: keyphrase生成は、長い文書を敬語句のコレクションにまとめることを目的としている。
ディープニューラルモデルは、このタスクにおいて顕著な成功を示し、文書から欠落するキーフレーズを予測することができる。
キーフレーズ生成のための新しい手法であるAutoKeyGenについて,人間のアノテーションを介さずに提示する。
- 参考スコア(独自算出の注目度): 14.544869226959612
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrase generation aims to summarize long documents with a collection of
salient phrases. Deep neural models have demonstrated a remarkable success in
this task, capable of predicting keyphrases that are even absent from a
document. However, such abstractiveness is acquired at the expense of a
substantial amount of annotated data. In this paper, we present a novel method
for keyphrase generation, AutoKeyGen, without the supervision of any human
annotation. Motivated by the observation that an absent keyphrase in one
document can appear in other places, in whole or in part, we first construct a
phrase bank by pooling all phrases in a corpus. With this phrase bank, we then
draw candidate absent keyphrases for each document through a partial matching
process. To rank both types of candidates, we combine their lexical- and
semantic-level similarities to the input document. Moreover, we utilize these
top-ranked candidates as to train a deep generative model for more absent
keyphrases. Extensive experiments demonstrate that AutoKeyGen outperforms all
unsupervised baselines and can even beat strong supervised methods in certain
cases.
- Abstract(参考訳): keyphrase生成は、長い文書を敬語句のコレクションにまとめることを目的としている。
ディープニューラルモデルは、このタスクにおいて顕著な成功を示し、文書から欠落するキーフレーズを予測することができる。
しかし、そのような抽象性は相当量の注釈データに犠牲を払って取得される。
本稿では,キーフレーズ生成のための新しい手法であるAutoKeyGenを提案する。
1つの文書に欠けているキーフレーズが他の場所に現れるという観察に動機づけられ、まず、コーパスにすべてのフレーズをプールしてフレーズバンクを構築します。
このフレーズバンクを用いて、各文書に候補のないキーフレーズを部分的マッチングプロセスで描画する。
両方の候補をランク付けするために、それらの語彙と意味レベルでの類似性を入力文書と組み合わせます。
さらに,これらの最上位候補を用いて,キーフレーズの欠落に対して深い生成モデルを学習する。
大規模な実験では、AutoKeyGenは教師なしのベースラインをすべて上回り、特定のケースで強力な教師付きメソッドを破ることさえできる。
関連論文リスト
- SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Neural Keyphrase Generation: Analysis and Evaluation [47.004575377472285]
本稿では,T5(事前学習型トランスフォーマー),CatSeq-Transformer(非事前学習型トランスフォーマー),ExHiRD(リカレントニューラルネットワーク)の3つの強力なモデルで示される傾向について検討する。
2つのキーフレーズの類似性を評価するために,SoftKeyScoreという新しいメトリクスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-27T00:10:21Z) - Applying Transformer-based Text Summarization for Keyphrase Generation [2.28438857884398]
キーフレーズは学術文書の検索と体系化に不可欠である。
本稿では,抽象的なテキスト要約のためのトランスフォーマーモデルについて実験する。
要約モデルはフルマッチのF1スコアとBERTスコアでキーフレーズを生成するのに非常に効果的であることを示す。
また,キーフレーズをターゲットとした順序付け戦略についても検討する。
論文 参考訳(メタデータ) (2022-09-08T13:01:52Z) - KPDrop: An Approach to Improving Absent Keyphrase Generation [26.563045686728135]
キーワード生成(英: Keyphrase generation)とは、ある文書の主要なトピックを要約するフレーズ(キーワード)を生成するタスクである。
KPDrop(keyphrase dropout)と呼ばれる手法を提案する。
論文 参考訳(メタデータ) (2021-12-02T18:25:56Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Towards Document-Level Paraphrase Generation with Sentence Rewriting and
Reordering [88.08581016329398]
文書レベルのパラフレーズ生成のためのCoRPG(Coherence Relation Guided Paraphrase Generation)を提案する。
グラフGRUを用いて、コヒーレンス関係グラフを符号化し、各文のコヒーレンス対応表現を得る。
我々のモデルは、より多様性とセマンティックな保存を伴う文書パラフレーズを生成することができる。
論文 参考訳(メタデータ) (2021-09-15T05:53:40Z) - Heterogeneous Graph Neural Networks for Keyphrase Generation [13.841525616800908]
本稿では,関連する参照から明示的な知識を抽出するグラフベースの新しい手法を提案する。
我々のモデルはまず、あらかじめ定義されたインデックスから、ソースドキュメントに似た文書とキーワードのペアを参照として検索する。
復号処理を導くために、ソース文書と参照の両方から適切な単語を直接コピーする階層的注目・複写機構を導入する。
論文 参考訳(メタデータ) (2021-09-10T07:17:07Z) - UCPhrase: Unsupervised Context-aware Quality Phrase Tagging [63.86606855524567]
UCPhraseは、教師なしの文脈対応のフレーズタグである。
我々は,一貫した単語列から,高品質なフレーズを銀のラベルとして表現する。
我々の設計は、最先端の事前訓練、教師なし、遠隔管理の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-05-28T19:44:24Z) - Select, Extract and Generate: Neural Keyphrase Generation with
Layer-wise Coverage Attention [75.44523978180317]
本稿では,2つの主要成分からなるニューラルキーフレーズ生成モデルであるemphSEG-Netを提案する。
科学的およびWeb文書から得られた7つのキーフレーズ生成ベンチマークの実験結果は、SEG-Netが最先端のニューラル生成手法よりも大きなマージンで優れていることを示している。
論文 参考訳(メタデータ) (2020-08-04T18:00:07Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。