論文の概要: Enhancing Keyphrase Generation by BART Finetuning with Splitting and
Shuffling
- arxiv url: http://arxiv.org/abs/2309.06726v1
- Date: Wed, 13 Sep 2023 05:02:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-14 15:20:33.649414
- Title: Enhancing Keyphrase Generation by BART Finetuning with Splitting and
Shuffling
- Title(参考訳): 分割とシャッフルによるBARTファインタニングによるキーワード生成の促進
- Authors: Bin Chen, Mizuho Iwaihara
- Abstract要約: キーワード生成(英: Keyphrase generation)とは、テキストの主要なトピックやテーマを最も再送するフレーズの集合を識別するタスクである。
本稿では,現在と不在なキーフレーズの世代間の違いを生かしたKephrase-Focused BARTを提案する。
Keyphrase-Focused BARTは5つのKeyphrase gen-erationベンチマークデータセットのうち2つで、F1@5で新しい最先端スコアを達成した。
- 参考スコア(独自算出の注目度): 6.276370570422467
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Keyphrase generation is a task of identifying a set of phrases that best
repre-sent the main topics or themes of a given text. Keyphrases are dividend
int pre-sent and absent keyphrases. Recent approaches utilizing
sequence-to-sequence models show effectiveness on absent keyphrase generation.
However, the per-formance is still limited due to the hardness of finding
absent keyphrases. In this paper, we propose Keyphrase-Focused BART, which
exploits the differ-ences between present and absent keyphrase generations, and
performs fine-tuning of two separate BART models for present and absent
keyphrases. We further show effective approaches of shuffling keyphrases and
candidate keyphrase ranking. For absent keyphrases, our Keyphrase-Focused BART
achieved new state-of-the-art score on F1@5 in two out of five keyphrase
gen-eration benchmark datasets.
- Abstract(参考訳): キーワード生成(英: Keyphrase generation)とは、あるテキストの主要なトピックやテーマを最も再送するフレーズの集合を識別するタスクである。
keyphrases はdispointnd int pre-sent であり、キーphrases がない。
シーケンシャル・ツー・シーケンスモデルを用いた最近のアプローチではキーフレーズの欠落が有効である。
しかし、キーフレーズの欠落が困難であることから、フォーム単位は制限されている。
本稿では,現在と不在なキーフレーズの世代間の違いを利用して,現在と不在なキーフレーズに対する2つの別々のBARTモデルの微調整を行うKephrase-Focused BARTを提案する。
さらに、シャッフルキーフレーズと候補キーフレーズランキングの効果的なアプローチを示す。
Keyphrase-Focused BARTは5つのKeyphrase gen-erationベンチマークデータセットのうち2つで、F1@5で新しい最先端スコアを達成した。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Applying Transformer-based Text Summarization for Keyphrase Generation [2.28438857884398]
キーフレーズは学術文書の検索と体系化に不可欠である。
本稿では,抽象的なテキスト要約のためのトランスフォーマーモデルについて実験する。
要約モデルはフルマッチのF1スコアとBERTスコアでキーフレーズを生成するのに非常に効果的であることを示す。
また,キーフレーズをターゲットとした順序付け戦略についても検討する。
論文 参考訳(メタデータ) (2022-09-08T13:01:52Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - KPDrop: An Approach to Improving Absent Keyphrase Generation [26.563045686728135]
キーワード生成(英: Keyphrase generation)とは、ある文書の主要なトピックを要約するフレーズ(キーワード)を生成するタスクである。
KPDrop(keyphrase dropout)と呼ばれる手法を提案する。
論文 参考訳(メタデータ) (2021-12-02T18:25:56Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness [9.13755431537592]
情報検索の観点から不在のキーフレーズの有用性について議論する。
本稿では,キーフレーズの欠落が科学文書検索に与える影響について,より詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2021-03-23T10:42:18Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - Keyphrase Prediction With Pre-trained Language Model [16.06425973336514]
我々は,キーフレーズ予測を2つのサブタスク,すなわち,現在キーフレーズ抽出(PKE)と欠キーフレーズ生成(AKG)に分割することを提案する。
PKEでは、事前訓練された言語モデルBERTを用いて、このタスクをシーケンスラベリング問題として扱う。
AKG では,PKE から学んだキーフレーズの知識を細調整した BERT で完全に統合した Transformer ベースのアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-04-22T09:35:02Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。