論文の概要: Deep Keyphrase Completion
- arxiv url: http://arxiv.org/abs/2111.01910v1
- Date: Fri, 29 Oct 2021 07:15:35 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-07 11:59:12.127096
- Title: Deep Keyphrase Completion
- Title(参考訳): ディープキーフレーズの完成
- Authors: Yu Zhao, Jia Song, Huali Feng, Fuzhen Zhuang, Qing Li, Xiaojie Wang,
Ji Liu
- Abstract要約: Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
- 参考スコア(独自算出の注目度): 59.0413813332449
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keyphrase provides accurate information of document content that is highly
compact, concise, full of meanings, and widely used for discourse
comprehension, organization, and text retrieval. Though previous studies have
made substantial efforts for automated keyphrase extraction and generation,
surprisingly, few studies have been made for \textit{keyphrase completion}
(KPC). KPC aims to generate more keyphrases for document (e.g. scientific
publication) taking advantage of document content along with a very limited
number of known keyphrases, which can be applied to improve text indexing
system, etc. In this paper, we propose a novel KPC method with an
encoder-decoder framework. We name it \textit{deep keyphrase completion} (DKPC)
since it attempts to capture the deep semantic meaning of the document content
together with known keyphrases via a deep learning framework. Specifically, the
encoder and the decoder in DKPC play different roles to make full use of the
known keyphrases. The former considers the keyphrase-guiding factors, which
aggregates information of known keyphrases into context. On the contrary, the
latter considers the keyphrase-inhibited factor to inhibit semantically
repeated keyphrase generation. Extensive experiments on benchmark datasets
demonstrate the efficacy of our proposed model.
- Abstract(参考訳): Keyphraseは、非常にコンパクトで簡潔で意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
従来の研究はキーフレーズの自動抽出と生成に多大な努力をしてきたが、驚くべきことに \textit{keyphrase completion} (kpc) に関する研究はほとんど行われていない。
KPCは、文書コンテンツと非常に限られた数の既知のキーフレーズを利用して、文書(例えば、科学出版物)のためのより多くのキーフレーズを生成することを目的としており、テキストインデックスシステムの改善などに応用できる。
本稿では,エンコーダデコーダフレームワークを用いた新しいKPC手法を提案する。
DKPC (textit{deep keyphrase completion}) という名前は、ディープラーニングフレームワークを通じて、既知のキーフレーズとともに文書の内容の深い意味をキャプチャしようとするものである。
特に、dkpcのエンコーダとデコーダは、既知のキーフレーズをフル活用するために異なる役割を担っている。
前者は、既知のキーフレーズの情報をコンテキストに集約するキーフレーズ誘導因子を考える。
対照的に、後者はキーフラーゼ阻害因子を意味的に反復されたキーフラーゼ生成を阻害すると考えている。
ベンチマークデータセットの大規模な実験により,提案モデルの有効性が示された。
関連論文リスト
- SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction [9.307602861891926]
キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-17T02:26:30Z) - Neural Keyphrase Generation: Analysis and Evaluation [47.004575377472285]
本稿では,T5(事前学習型トランスフォーマー),CatSeq-Transformer(非事前学習型トランスフォーマー),ExHiRD(リカレントニューラルネットワーク)の3つの強力なモデルで示される傾向について検討する。
2つのキーフレーズの類似性を評価するために,SoftKeyScoreという新しいメトリクスフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-27T00:10:21Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Capturing Global Informativeness in Open Domain Keyphrase Extraction [40.57116173502994]
Open- domain KeyPhrase extract (KPE)は、ドメインや品質の制約なしにドキュメントからキーフレーズを抽出することを目的としている。
本稿では,事前学習言語モデルに基づくオープンドメインKPEアーキテクチャであるJointKPEを提案する。
JointKPEは、ドキュメント全体の情報度を見積もることで、キーフレーズのランク付けを学び、キーフレーズチャンキングタスクで共同で訓練される。
論文 参考訳(メタデータ) (2020-04-28T16:34:35Z) - Keyphrase Generation with Cross-Document Attention [28.565813544820553]
キーワード生成は、与えられた文書の本質を要約した一連のフレーズを作成することを目的としている。
本稿では,トランスフォーマーをグローバルな注目を集めるキーフレーズ生成装置CDKGenを提案する。
また,キーフレーズ中の語彙外単語を扱うために,文書から適切な単語を選択することで,モデルを強化するコピー機構も採用している。
論文 参考訳(メタデータ) (2020-04-21T07:58:27Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。