論文の概要: KPDrop: An Approach to Improving Absent Keyphrase Generation
- arxiv url: http://arxiv.org/abs/2112.01476v1
- Date: Thu, 2 Dec 2021 18:25:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-03 15:38:02.315742
- Title: KPDrop: An Approach to Improving Absent Keyphrase Generation
- Title(参考訳): KPDrop: Absent Keyphrase生成の改善へのアプローチ
- Authors: Seoyeon Park, Jishnu Ray Chowdhury, Tuhin Kundu, Cornelia Caragea
- Abstract要約: キーワード生成(英: Keyphrase generation)とは、ある文書の主要なトピックを要約するフレーズ(キーワード)を生成するタスクである。
KPDrop(keyphrase dropout)と呼ばれる手法を提案する。
- 参考スコア(独自算出の注目度): 26.563045686728135
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Keyphrase generation is the task of generating phrases (keyphrases) that
summarize the main topics of a given document. The generated keyphrases can be
either present or absent from the text of the given document. While the
extraction of present keyphrases has received much attention in the past, only
recently a stronger focus has been placed on the generation of absent
keyphrases. However, generating absent keyphrases is very challenging; even the
best methods show only a modest degree of success. In this paper, we propose an
approach, called keyphrase dropout (or KPDrop), to improve absent keyphrase
generation. We randomly drop present keyphrases from the document and turn them
into artificial absent keyphrases during training. We test our approach
extensively and show that it consistently improves the absent performance of
strong baselines in keyphrase generation.
- Abstract(参考訳): キーワード生成は、ある文書の主要なトピックを要約するフレーズ(キーワード)を生成するタスクである。
生成されたキーフレーズは、所定の文書のテキストから存在または欠落することができる。
キーフレーズの抽出は過去にも注目されてきたが、近年では欠失キーフレーズの生成に重点が置かれている。
しかし、キーフレーズの欠如は極めて困難であり、最良の方法でさえもわずかな成功の程度しか示していない。
本稿では,キーフレーズ生成の欠如を改善するために,キーフレーズドロップアウト(kpdrop)と呼ばれる手法を提案する。
文書から現在あるキーフレーズをランダムに落とし、トレーニング中に人工欠落キーフレーズに変換する。
我々はこのアプローチを広範囲にテストし,キーフレーズ生成における強力なベースラインの欠如性能を一貫して向上させることを示す。
関連論文リスト
- Enhancing Keyphrase Generation by BART Finetuning with Splitting and
Shuffling [6.276370570422467]
キーワード生成(英: Keyphrase generation)とは、テキストの主要なトピックやテーマを最も再送するフレーズの集合を識別するタスクである。
本稿では,現在と不在なキーフレーズの世代間の違いを生かしたKephrase-Focused BARTを提案する。
Keyphrase-Focused BARTは5つのKeyphrase gen-erationベンチマークデータセットのうち2つで、F1@5で新しい最先端スコアを達成した。
論文 参考訳(メタデータ) (2023-09-13T05:02:11Z) - Data Augmentation for Low-Resource Keyphrase Generation [46.52115499306222]
キーフレーズ生成(英: Keyphrase generation)とは、任意の記事の内容をいくつかの有能なフレーズ(またはキーフレーズ)に要約するタスクである。
タスクの既存の作業は主に、取得が簡単ではない大規模なアノテートデータセットに依存しています。
我々は、純粋にリソース制約のあるドメインにおいて、キーフレーズの生成に対処するためのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2023-05-29T09:20:34Z) - Applying Transformer-based Text Summarization for Keyphrase Generation [2.28438857884398]
キーフレーズは学術文書の検索と体系化に不可欠である。
本稿では,抽象的なテキスト要約のためのトランスフォーマーモデルについて実験する。
要約モデルはフルマッチのF1スコアとBERTスコアでキーフレーズを生成するのに非常に効果的であることを示す。
また,キーフレーズをターゲットとした順序付け戦略についても検討する。
論文 参考訳(メタデータ) (2022-09-08T13:01:52Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Towards Document-Level Paraphrase Generation with Sentence Rewriting and
Reordering [88.08581016329398]
文書レベルのパラフレーズ生成のためのCoRPG(Coherence Relation Guided Paraphrase Generation)を提案する。
グラフGRUを用いて、コヒーレンス関係グラフを符号化し、各文のコヒーレンス対応表現を得る。
我々のモデルは、より多様性とセマンティックな保存を伴う文書パラフレーズを生成することができる。
論文 参考訳(メタデータ) (2021-09-15T05:53:40Z) - Unsupervised Deep Keyphrase Generation [14.544869226959612]
keyphrase生成は、長い文書を敬語句のコレクションにまとめることを目的としている。
ディープニューラルモデルは、このタスクにおいて顕著な成功を示し、文書から欠落するキーフレーズを予測することができる。
キーフレーズ生成のための新しい手法であるAutoKeyGenについて,人間のアノテーションを介さずに提示する。
論文 参考訳(メタデータ) (2021-04-18T05:53:19Z) - Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness [9.13755431537592]
情報検索の観点から不在のキーフレーズの有用性について議論する。
本稿では,キーフレーズの欠落が科学文書検索に与える影響について,より詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2021-03-23T10:42:18Z) - Persian Keyphrase Generation Using Sequence-to-Sequence Models [1.192436948211501]
キーワードは入力テキストの要約であり、テキストで議論された主主題を提供する。
本稿では,キーフレーズ生成とニュース記事の抽出に,深いシーケンス・ツー・シーケンスモデルを用いて取り組む。
論文 参考訳(メタデータ) (2020-09-25T14:40:14Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。