論文の概要: Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction
- arxiv url: http://arxiv.org/abs/2308.08739v2
- Date: Wed, 20 Mar 2024 16:41:11 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 22:47:21.328130
- Title: Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction
- Title(参考訳): フレーズ抽出のためのインフォメーション・ボトルネックガイドテキスト拡散プロセスによるフレーズ表現の強化
- Authors: Yuanzhen Luo, Qingyu Zhou, Feng Zhou,
- Abstract要約: キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
- 参考スコア(独自算出の注目度): 9.307602861891926
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keyphrase extraction (KPE) is an important task in Natural Language Processing for many scenarios, which aims to extract keyphrases that are present in a given document. Many existing supervised methods treat KPE as sequential labeling, span-level classification, or generative tasks. However, these methods lack the ability to utilize keyphrase information, which may result in biased results. In this study, we propose Diff-KPE, which leverages the supervised Variational Information Bottleneck (VIB) to guide the text diffusion process for generating enhanced keyphrase representations. Diff-KPE first generates the desired keyphrase embeddings conditioned on the entire document and then injects the generated keyphrase embeddings into each phrase representation. A ranking network and VIB are then optimized together with rank loss and classification loss, respectively. This design of Diff-KPE allows us to rank each candidate phrase by utilizing both the information of keyphrases and the document. Experiments show that Diff-KPE outperforms existing KPE methods on a large open domain keyphrase extraction benchmark, OpenKP, and a scientific domain dataset, KP20K.
- Abstract(参考訳): キーフレーズ抽出(KPE)は多くのシナリオにおいて自然言語処理において重要なタスクであり、ある文書に存在するキーフレーズを抽出することを目的としている。
多くの既存の教師付き手法は、KPEをシーケンシャルラベリング、スパンレベル分類、または生成タスクとして扱う。
しかし、これらの手法はキーフレーズ情報を利用する能力に欠けており、結果としてバイアスが生じる可能性がある。
本研究では、教師付き変分情報ボトルネック(VIB)を利用して、拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
Diff-KPEはまず、文書全体に条件付された所望のキーフレーズ埋め込みを生成し、その後、生成されたキーフレーズ埋め込みを各フレーズ表現に注入する。
ランキングネットワークとVIBは、それぞれランク損失と分類損失とを合わせて最適化される。
このDiff-KPEの設計により、キーフレーズの情報と文書の両方を利用して、各候補句をランク付けできる。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
関連論文リスト
- BibRank: Automatic Keyphrase Extraction Platform Using~Metadata [0.0]
本稿では、キーフレーズデータセットを統合し、キーフレーズ抽出アルゴリズムの評価を容易にするプラットフォームを提案する。
このプラットフォームには、単語をBib形式で解析することで得られる豊富なデータセットを活用する自動キーフレーズ抽出アルゴリズムであるBibRankが含まれている。
論文 参考訳(メタデータ) (2023-10-13T14:44:34Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Phraseformer: Multimodal Key-phrase Extraction using Transformer and
Graph Embedding [3.7110020502717616]
我々は,変換器とグラフ埋め込み技術を用いて,多モーダルなキーフレーズ抽出手法であるPhraseformerを開発した。
Phraseformerでは、各キーワード候補は、テキストと構造学習表現の連結であるベクトルによって提示される。
Inspec、SemEval2010、SemEval 2017の3つのデータセット上でのPhraseformerの性能をF1スコアで解析する。
論文 参考訳(メタデータ) (2021-06-09T09:32:17Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Capturing Global Informativeness in Open Domain Keyphrase Extraction [40.57116173502994]
Open- domain KeyPhrase extract (KPE)は、ドメインや品質の制約なしにドキュメントからキーフレーズを抽出することを目的としている。
本稿では,事前学習言語モデルに基づくオープンドメインKPEアーキテクチャであるJointKPEを提案する。
JointKPEは、ドキュメント全体の情報度を見積もることで、キーフレーズのランク付けを学び、キーフレーズチャンキングタスクで共同で訓練される。
論文 参考訳(メタデータ) (2020-04-28T16:34:35Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。