論文の概要: MDERank: A Masked Document Embedding Rank Approach for Unsupervised
Keyphrase Extraction
- arxiv url: http://arxiv.org/abs/2110.06651v1
- Date: Wed, 13 Oct 2021 11:29:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-14 13:43:22.220197
- Title: MDERank: A Masked Document Embedding Rank Approach for Unsupervised
Keyphrase Extraction
- Title(参考訳): mderank:unsupervised keyphrase抽出のためのマスク付き文書埋め込みランクアプローチ
- Authors: Linhan Zhang, Qian Chen, Wen Wang, Chong Deng, Shiliang Zhang, Bing
Li, Wei Wang, Xin Cao
- Abstract要約: キーワードは、コアコンテンツの簡潔な要約を提供するドキュメントのフレーズで、読者が記事が少しで何を言っているのかを理解するのに役立つ。
BERTをベースとしたモデルを用いて,MASK戦略を用いて候補キーフレーズの選択とランク付けを行う,新しい教師なしキーワード抽出手法を提案する。
- 参考スコア(独自算出の注目度): 41.941098507759015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrases are phrases in a document providing a concise summary of core
content, helping readers to understand what the article is talking about in a
minute. However, existing unsupervised works are not robust enough to handle
various types of documents owing to the mismatch of sequence length for
comparison. In this paper, we propose a novel unsupervised keyword extraction
method by leveraging the BERT-based model to select and rank candidate
keyphrases with a MASK strategy. In addition, we further enhance the model,
denoted as Keyphrases Extraction BERT (KPEBERT), via designing a compatible
self-supervised task and conducting a contrast learning. We conducted extensive
experimental evaluation to demonstrate the superiority and robustness of the
proposed method as well as the effectiveness of KPEBERT.
- Abstract(参考訳): キーワードは、コアコンテンツの簡潔な要約を提供するドキュメントのフレーズで、読者が記事が少しで何を言っているのかを理解するのに役立つ。
しかし、既存の教師なしの作品は、比較のためのシーケンス長のミスマッチのため、様々な種類の文書を扱うのに十分ではない。
本稿では,bertモデルを用いてマス戦略を用いた候補キーフレーズの選択とランク付けを行う,教師なしキーワード抽出手法を提案する。
さらに、互換性のある自己教師型タスクを設計し、コントラスト学習を行うことにより、KPEBERT(Keyphrases extract BERT)と呼ばれるモデルをさらに強化する。
提案手法の優越性と頑健性およびkpebertの有効性を実証するために,広範な実験評価を行った。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - MatchVIE: Exploiting Match Relevancy between Entities for Visual
Information Extraction [48.55908127994688]
我々は、VIE(MatchVIE)のためのグラフニューラルネットワークに基づく新しいキー値マッチングモデルを提案する。
関連性評価に基づくキー値マッチングにより、提案したMatchVIEは、認識を様々な意味論にバイパスすることができる。
我々は、エンコードされた値の不安定性に対処するために、単純だが効果的な操作であるNum2Vecを導入する。
論文 参考訳(メタデータ) (2021-06-24T12:06:29Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - Unsupervised Deep Keyphrase Generation [14.544869226959612]
keyphrase生成は、長い文書を敬語句のコレクションにまとめることを目的としている。
ディープニューラルモデルは、このタスクにおいて顕著な成功を示し、文書から欠落するキーフレーズを予測することができる。
キーフレーズ生成のための新しい手法であるAutoKeyGenについて,人間のアノテーションを介さずに提示する。
論文 参考訳(メタデータ) (2021-04-18T05:53:19Z) - A Joint Learning Approach based on Self-Distillation for Keyphrase
Extraction from Scientific Documents [29.479331909227998]
キーフレーズ抽出(英: Keyphrase extract)は、文書を最もよく記述するフレーズの小さなセットを抽出するタスクである。
タスクの既存のベンチマークデータセットは、通常、注釈付きドキュメントの数に制限がある。
本稿では, 自己蒸留の考え方に基づく, シンプルで効率的な共同学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:31Z) - Context-Based Quotation Recommendation [60.93257124507105]
本稿では,新しい文脈対応引用レコメンデーションシステムを提案する。
これは、所定のソース文書から引用可能な段落とトークンの列挙リストを生成する。
音声テキストと関連するニュース記事の収集実験を行う。
論文 参考訳(メタデータ) (2020-05-17T17:49:53Z) - Keyphrase Prediction With Pre-trained Language Model [16.06425973336514]
我々は,キーフレーズ予測を2つのサブタスク,すなわち,現在キーフレーズ抽出(PKE)と欠キーフレーズ生成(AKG)に分割することを提案する。
PKEでは、事前訓練された言語モデルBERTを用いて、このタスクをシーケンスラベリング問題として扱う。
AKG では,PKE から学んだキーフレーズの知識を細調整した BERT で完全に統合した Transformer ベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-22T09:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。