論文の概要: Representation Learning for Resource-Constrained Keyphrase Generation
- arxiv url: http://arxiv.org/abs/2203.08118v1
- Date: Tue, 15 Mar 2022 17:48:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-16 17:11:22.338559
- Title: Representation Learning for Resource-Constrained Keyphrase Generation
- Title(参考訳): 資源制約付きキーフレーズ生成のための表現学習
- Authors: Di Wu, Wasi Uddin Ahmad, Sunipa Dev, Kai-Wei Chang
- Abstract要約: 本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
- 参考スコア(独自算出の注目度): 78.02577815973764
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: State-of-the-art keyphrase generation methods generally depend on large
annotated datasets, limiting their performance in domains with constrained
resources. To overcome this challenge, we investigate strategies to learn an
intermediate representation suitable for the keyphrase generation task. We
introduce salient span recovery and salient span prediction as guided denoising
language modeling objectives that condense the domain-specific knowledge
essential for keyphrase generation. Through experiments on multiple scientific
keyphrase generation benchmarks, we show the effectiveness of the proposed
approach for facilitating low-resource and zero-shot keyphrase generation.
Furthermore, we observe that our method especially benefits the generation of
absent keyphrases, approaching the performance of SOTA methods trained with
large training sets.
- Abstract(参考訳): State-of-the-art Keyphrase生成メソッドは一般的に大きなアノテーション付きデータセットに依存し、制約のあるリソースを持つドメインでのパフォーマンスを制限する。
この課題を克服するために,キーフレーズ生成タスクに適した中間表現を学習するための戦略を検討する。
我々は,キーフレーズ生成に必要なドメイン固有知識を凝縮させる言語モデル目標として,salient span recoveryとsalient span predictionを導入する。
本研究では,複数のキーフレーズ生成ベンチマークを用いた実験を行い,提案手法の有効性を示す。
また,本手法は,大規模訓練セットで訓練したsoma法の性能に近づくことにより,キーフレーズの欠落の発生に特に有益であると考えられる。
関連論文リスト
- Self-Compositional Data Augmentation for Scientific Keyphrase Generation [28.912937922090038]
本稿では,キーフレーズ生成のための自己合成データ拡張手法を提案する。
共有キーフレーズに基づく学習用文書の関連性を測定し,類似した文書を組み合わせて合成サンプルを生成する。
論文 参考訳(メタデータ) (2024-11-05T12:22:51Z) - Key Algorithms for Keyphrase Generation: Instruction-Based LLMs for Russian Scientific Keyphrases [2.8402080392117757]
キーフレーズの選択は、広範囲のアプリケーションを持つ自然言語処理において難しいタスクである。
既存の教師なしおよび教師なしのソリューションをロシア語に適用することは、いくつかの制限に直面している。
近年の英文研究により,大言語モデル (LLM) がキーフレーズの生成に成功していることが示された。
論文 参考訳(メタデータ) (2024-10-23T17:07:32Z) - MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - Data Augmentation for Low-Resource Keyphrase Generation [46.52115499306222]
キーフレーズ生成(英: Keyphrase generation)とは、任意の記事の内容をいくつかの有能なフレーズ(またはキーフレーズ)に要約するタスクである。
タスクの既存の作業は主に、取得が簡単ではない大規模なアノテートデータセットに依存しています。
我々は、純粋にリソース制約のあるドメインにおいて、キーフレーズの生成に対処するためのデータ拡張戦略を提案する。
論文 参考訳(メタデータ) (2023-05-29T09:20:34Z) - Pre-trained Language Models for Keyphrase Generation: A Thorough
Empirical Study [76.52997424694767]
事前学習言語モデルを用いて,キーフレーズ抽出とキーフレーズ生成の詳細な実験を行った。
PLMは、競争力のある高リソース性能と最先端の低リソース性能を持つことを示す。
さらに,領域内のBERTライクなPLMを用いて,強大かつデータ効率のよいキーフレーズ生成モデルを構築できることが示唆された。
論文 参考訳(メタデータ) (2022-12-20T13:20:21Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Retrieval-Augmented Multilingual Keyphrase Generation with
Retriever-Generator Iterative Training [66.64843711515341]
キーフレーズ生成は、長いテキストが与えられたキーフレーズを自動的に予測するタスクである。
我々は多言語キーフレーズ生成という新しい設定に注意を払っている。
非英語言語におけるデータ不足問題を軽減するために,多言語キーフレーズ生成のための検索拡張手法を提案する。
論文 参考訳(メタデータ) (2022-05-21T00:45:21Z) - Unsupervised Keyphrase Extraction via Interpretable Neural Networks [27.774524511005172]
テキストのトピックを予測するのに最も有用なキーワードは重要なキーワードである。
InSPECTは、影響力のあるキーフレーズを識別するための自己説明型ニューラルネットワークフレームワークである。
InSPECTは4つの異なるデータセットから教師なし鍵抽出を行う。
論文 参考訳(メタデータ) (2022-03-15T04:30:47Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。