論文の概要: Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness
- arxiv url: http://arxiv.org/abs/2103.12440v1
- Date: Tue, 23 Mar 2021 10:42:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-24 13:49:02.635672
- Title: Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness
- Title(参考訳): 欠失キーフレーズの再定義と検索効果への影響
- Authors: Florian Boudin and Ygor Gallina
- Abstract要約: 情報検索の観点から不在のキーフレーズの有用性について議論する。
本稿では,キーフレーズの欠落が科学文書検索に与える影響について,より詳細に分類する手法を提案する。
- 参考スコア(独自算出の注目度): 9.13755431537592
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Neural keyphrase generation models have recently attracted much interest due
to their ability to output absent keyphrases, that is, keyphrases that do not
appear in the source text. In this paper, we discuss the usefulness of absent
keyphrases from an Information Retrieval (IR) perspective, and show that the
commonly drawn distinction between present and absent keyphrases is not made
explicit enough. We introduce a finer-grained categorization scheme that sheds
more light on the impact of absent keyphrases on scientific document retrieval.
Under this scheme, we find that only a fraction (around 20%) of the words that
make up keyphrases actually serves as document expansion, but that this small
fraction of words is behind much of the gains observed in retrieval
effectiveness. We also discuss how the proposed scheme can offer a new angle to
evaluate the output of neural keyphrase generation models.
- Abstract(参考訳): ニューラルキーフレーズ生成モデルは、最近、欠落キーフレーズ、すなわち、ソーステキストに現れないキーフレーズを出力する能力により、多くの関心を集めている。
本稿では,情報検索(ir)の観点から,欠落キーフレーズの有用性を考察し,現在キーフレーズと欠落キーフレーズの区別が十分に明確化されていないことを示す。
本稿では,キーフレーズの欠落が科学文書検索に与える影響について,より詳細に分類する手法を提案する。
この方式では,キーフレーズを構成する単語の約20%のみが実際に文書拡張の役割を果たすが,検索効果で観察される多くの成果の背後には,このわずかな単語が隠れていることがわかった。
また,提案手法がニューラルキーフレーズ生成モデルの出力を評価する新しい角度を提供する方法についても論じる。
関連論文リスト
- Enhancing Keyphrase Generation by BART Finetuning with Splitting and
Shuffling [6.276370570422467]
キーワード生成(英: Keyphrase generation)とは、テキストの主要なトピックやテーマを最も再送するフレーズの集合を識別するタスクである。
本稿では,現在と不在なキーフレーズの世代間の違いを生かしたKephrase-Focused BARTを提案する。
Keyphrase-Focused BARTは5つのKeyphrase gen-erationベンチマークデータセットのうち2つで、F1@5で新しい最先端スコアを達成した。
論文 参考訳(メタデータ) (2023-09-13T05:02:11Z) - To Wake-up or Not to Wake-up: Reducing Keyword False Alarm by Successive
Refinement [58.96644066571205]
既存の深層キーワードスポッティング機構は逐次リファインメントにより改善可能であることを示す。
13Kパラメーターから2.41Mパラメーターまで、複数のモデルにまたがって、連続精製法はFAを最大8.5%削減する。
提案手法は"plug-and-play"であり,任意の深いキーワードスポッティングモデルに適用できる。
論文 参考訳(メタデータ) (2023-04-06T23:49:29Z) - Unsupervised Syntactically Controlled Paraphrase Generation with
Abstract Meaning Representations [59.10748929158525]
抽象表現(AMR)は、教師なし構文制御されたパラフレーズ生成の性能を大幅に向上させることができる。
提案モデルであるAMRPGは,AMRグラフを符号化し,入力文を2つの非絡み合った意味的および構文的埋め込みに解析する。
実験により、AMRPGは既存の教師なしアプローチと比較して、定量的かつ質的に、より正確な構文制御されたパラフレーズを生成することが示された。
論文 参考訳(メタデータ) (2022-11-02T04:58:38Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Applying Transformer-based Text Summarization for Keyphrase Generation [2.28438857884398]
キーフレーズは学術文書の検索と体系化に不可欠である。
本稿では,抽象的なテキスト要約のためのトランスフォーマーモデルについて実験する。
要約モデルはフルマッチのF1スコアとBERTスコアでキーフレーズを生成するのに非常に効果的であることを示す。
また,キーフレーズをターゲットとした順序付け戦略についても検討する。
論文 参考訳(メタデータ) (2022-09-08T13:01:52Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Unsupervised Keyphrase Extraction via Interpretable Neural Networks [27.774524511005172]
テキストのトピックを予測するのに最も有用なキーワードは重要なキーワードである。
InSPECTは、影響力のあるキーフレーズを識別するための自己説明型ニューラルネットワークフレームワークである。
InSPECTは4つの異なるデータセットから教師なし鍵抽出を行う。
論文 参考訳(メタデータ) (2022-03-15T04:30:47Z) - KPDrop: An Approach to Improving Absent Keyphrase Generation [26.563045686728135]
キーワード生成(英: Keyphrase generation)とは、ある文書の主要なトピックを要約するフレーズ(キーワード)を生成するタスクである。
KPDrop(keyphrase dropout)と呼ばれる手法を提案する。
論文 参考訳(メタデータ) (2021-12-02T18:25:56Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - Unsupervised Deep Keyphrase Generation [14.544869226959612]
keyphrase生成は、長い文書を敬語句のコレクションにまとめることを目的としている。
ディープニューラルモデルは、このタスクにおいて顕著な成功を示し、文書から欠落するキーフレーズを予測することができる。
キーフレーズ生成のための新しい手法であるAutoKeyGenについて,人間のアノテーションを介さずに提示する。
論文 参考訳(メタデータ) (2021-04-18T05:53:19Z) - Exclusive Hierarchical Decoding for Deep Keyphrase Generation [63.357895318562214]
キーフレーズ生成(KG)は、文書の主要なアイデアをキーフレーズの集合にまとめることを目的としている。
この設定の以前の作業では、キーフレーズを生成するためのシーケンシャルなデコードプロセスが使用されている。
本稿では,階層的復号化プロセスとソフトかハードかのいずれかを含む排他的階層的復号化フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-18T02:58:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。