論文の概要: Capturing Global Informativeness in Open Domain Keyphrase Extraction
- arxiv url: http://arxiv.org/abs/2004.13639v2
- Date: Fri, 17 Sep 2021 09:37:12 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 22:59:14.899959
- Title: Capturing Global Informativeness in Open Domain Keyphrase Extraction
- Title(参考訳): オープンドメインキーフレーズ抽出におけるグローバル情報化
- Authors: Si Sun, Zhenghao Liu, Chenyan Xiong, Zhiyuan Liu, Jie Bao
- Abstract要約: Open- domain KeyPhrase extract (KPE)は、ドメインや品質の制約なしにドキュメントからキーフレーズを抽出することを目的としている。
本稿では,事前学習言語モデルに基づくオープンドメインKPEアーキテクチャであるJointKPEを提案する。
JointKPEは、ドキュメント全体の情報度を見積もることで、キーフレーズのランク付けを学び、キーフレーズチャンキングタスクで共同で訓練される。
- 参考スコア(独自算出の注目度): 40.57116173502994
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-domain KeyPhrase Extraction (KPE) aims to extract keyphrases from
documents without domain or quality restrictions, e.g., web pages with variant
domains and qualities. Recently, neural methods have shown promising results in
many KPE tasks due to their powerful capacity for modeling contextual semantics
of the given documents. However, we empirically show that most neural KPE
methods prefer to extract keyphrases with good phraseness, such as short and
entity-style n-grams, instead of globally informative keyphrases from
open-domain documents. This paper presents JointKPE, an open-domain KPE
architecture built on pre-trained language models, which can capture both local
phraseness and global informativeness when extracting keyphrases. JointKPE
learns to rank keyphrases by estimating their informativeness in the entire
document and is jointly trained on the keyphrase chunking task to guarantee the
phraseness of keyphrase candidates. Experiments on two large KPE datasets with
diverse domains, OpenKP and KP20k, demonstrate the effectiveness of JointKPE on
different pre-trained variants in open-domain scenarios. Further analyses
reveal the significant advantages of JointKPE in predicting long and non-entity
keyphrases, which are challenging for previous neural KPE methods. Our code is
publicly available at https://github.com/thunlp/BERT-KPE.
- Abstract(参考訳): Open- domain KeyPhrase extract (KPE) は、ドメインや品質制限のないドキュメントからキーフレーズを抽出することを目的としている。
近年、ニューラルネットワークは、与えられた文書の文脈意味論をモデル化する能力があるため、多くのkpeタスクで有望な結果を示している。
しかし、ほとんどのニューラルネットワークKPE法は、オープンドメイン文書からグローバルな情報的キーフレーズの代わりに、ショートやエンティティスタイルのn-gramのような優れたフレーズを持つキーフレーズを抽出することを実証的に示す。
本稿では,学習済み言語モデル上に構築されたオープンドメインKPEアーキテクチャであるJointKPEを提案する。
jointkpeは、文書全体の情報度を推定することで、キーフレーズのランク付けを学び、キーフレーズのチャンキングタスクで共同で訓練し、キーフレーズ候補の句性を保証する。
多様なドメインを持つ2つの大きなKPEデータセット(OpenKPとKP20k)の実験は、オープンドメインシナリオにおける様々な事前訓練された変種に対するJointKPEの有効性を実証している。
さらに分析したところ、従来の神経性KPE法では困難であった長大なキーフレーズの予測において、JointKPEの顕著な利点が明らかとなった。
私たちのコードはhttps://github.com/thunlp/BERT-KPEで公開されています。
関連論文リスト
- Pre-Trained Language Models for Keyphrase Prediction: A Review [2.7869482272876622]
キーフレーズ予測(KP)は、その内容を要約できる文書中のキーフレーズを特定するのに不可欠である。
最近の自然言語処理の進歩は、ディープラーニング技術を用いたより効率的なKPモデルを開発した。
本稿では,キーフレーズ予測のための事前学習言語モデル(PLM-KP)の話題を幅広く検討する。
論文 参考訳(メタデータ) (2024-09-02T09:15:44Z) - Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction [9.307602861891926]
キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-17T02:26:30Z) - Enriching Relation Extraction with OpenIE [70.52564277675056]
関係抽出(RE)は情報抽出(IE)のサブ分野である
本稿では,オープン情報抽出(OpenIE)の最近の取り組みがREの課題の改善にどのように役立つかを検討する。
本稿では,2つの注釈付きコーパスであるKnowledgeNetとFewRelを用いた実験により,拡張モデルの精度向上を実証した。
論文 参考訳(メタデータ) (2022-12-19T11:26:23Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Unsupervised Keyphrase Extraction via Interpretable Neural Networks [27.774524511005172]
テキストのトピックを予測するのに最も有用なキーワードは重要なキーワードである。
InSPECTは、影響力のあるキーフレーズを識別するための自己説明型ニューラルネットワークフレームワークである。
InSPECTは4つの異なるデータセットから教師なし鍵抽出を行う。
論文 参考訳(メタデータ) (2022-03-15T04:30:47Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - One-shot Key Information Extraction from Document with Deep Partial
Graph Matching [60.48651298832829]
ドキュメントからキー情報抽出(KIE)は、多くの産業シナリオにおいて効率、生産性、セキュリティを改善する。
KIEタスクのための既存の教師付き学習手法は、多数のラベル付きサンプルを供給し、異なる種類の文書の別々のモデルを学ぶ必要がある。
部分グラフマッチングを用いたワンショットKIEのためのディープエンド・ツー・エンド・トレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T07:45:53Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。