論文の概要: Unsupervised Keyphrase Extraction via Interpretable Neural Networks
- arxiv url: http://arxiv.org/abs/2203.07640v1
- Date: Tue, 15 Mar 2022 04:30:47 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-17 07:44:05.824385
- Title: Unsupervised Keyphrase Extraction via Interpretable Neural Networks
- Title(参考訳): 解釈型ニューラルネットワークによる教師なしキーフレーズ抽出
- Authors: Rishabh Joshi and Vidhisha Balachandran and Emily Saldanha and Maria
Glenski and Svitlana Volkova and Yulia Tsvetkov
- Abstract要約: テキストのトピックを予測するのに最も有用なキーワードは重要なキーワードである。
InSPECTは、影響力のあるキーフレーズを識別するための自己説明型ニューラルネットワークフレームワークである。
InSPECTは4つの異なるデータセットから教師なし鍵抽出を行う。
- 参考スコア(独自算出の注目度): 27.774524511005172
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Keyphrase extraction aims at automatically extracting a list of "important"
phrases which represent the key concepts in a document. Prior approaches for
unsupervised keyphrase extraction resort to heuristic notions of phrase
importance via embedding similarities or graph centrality, requiring extensive
domain expertise to develop them. Our work proposes an alternative operational
definition: phrases that are most useful for predicting the topic of a text are
important keyphrases. To this end, we propose INSPECT -- a self-explaining
neural framework for identifying influential keyphrases by measuring the
predictive impact of input phrases on the downstream task of topic
classification. We show that this novel approach not only alleviates the need
for ad-hoc heuristics but also achieves state-of-the-art results in
unsupervised keyphrase extraction across four diverse datasets in two domains:
scientific publications and news articles. Ultimately, our study suggests a new
usage of interpretable neural networks as an intrinsic component in NLP
systems, and not only as a tool for explaining model predictions to humans.
- Abstract(参考訳): キーフレーズ抽出は、文書のキーコンセプトを表す「重要な」フレーズのリストを自動的に抽出することを目的としている。
教師なしのキーフレーズ抽出の以前のアプローチは、類似性やグラフ中心性を通じてフレーズの重要性のヒューリスティックな概念を取り入れ、それらを開発するために広範なドメイン知識を必要としていた。
テキストのトピックを予測するのに最も有用なフレーズは重要なキーワードである。
そこで本研究では,トピック分類の下流課題に対する入力句の予測的影響を計測し,キーフレーズを識別するための自己説明型ニューラルネットワークinspectを提案する。
この手法は, アドホックなヒューリスティックスの必要性を緩和するだけでなく, 科学的出版物とニュース記事という2つの領域の4つの異なるデータセットから, 教師なしのキーフレーズを抽出することで, 最先端の成果が得られることを示す。
最終的には、解釈可能なニューラルネットワークをnlpシステムに内在する要素として、モデル予測を人間に説明するツールとしてだけでなく、新たな利用法を提案する。
関連論文リスト
- MetaKP: On-Demand Keyphrase Generation [52.48698290354449]
オンデマンドのキーフレーズ生成は,特定のハイレベルな目標や意図に従うキーフレーズを必要とする新しいパラダイムである。
そこで我々は,4つのデータセット,7500のドキュメント,3760の目標からなる大規模ベンチマークであるMetaKPを紹介した。
ソーシャルメディアからの流行事象検出に応用して,一般のNLP基盤として機能する可能性を示す。
論文 参考訳(メタデータ) (2024-06-28T19:02:59Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - UniKeyphrase: A Unified Extraction and Generation Framework for
Keyphrase Prediction [20.26899340581431]
キーワード予測タスクは、与えられたドキュメントのメインアイデアを要約できるいくつかのキーフレーズを予測することを目的としている。
メインストリームKP法は、純粋に生成的アプローチと、抽出と生成を伴う統合モデルに分類することができる。
キーフレーズの抽出と生成を共同で学習する新しいエンドツーエンド学習フレームワークUniKeyphraseを提案する。
論文 参考訳(メタデータ) (2021-06-09T07:09:51Z) - Redefining Absent Keyphrases and their Effect on Retrieval Effectiveness [9.13755431537592]
情報検索の観点から不在のキーフレーズの有用性について議論する。
本稿では,キーフレーズの欠落が科学文書検索に与える影響について,より詳細に分類する手法を提案する。
論文 参考訳(メタデータ) (2021-03-23T10:42:18Z) - Be More with Less: Hypergraph Attention Networks for Inductive Text
Classification [56.98218530073927]
グラフニューラルネットワーク(GNN)は、研究コミュニティで注目され、この標準タスクで有望な結果を実証している。
成功にもかかわらず、それらのパフォーマンスは、単語間の高次相互作用をキャプチャできないため、実際は大部分が危険に晒される可能性がある。
本稿では,テキスト表現学習において,少ない計算量でより表現力の高いハイパーグラフアテンションネットワーク(HyperGAT)を提案する。
論文 参考訳(メタデータ) (2020-11-01T00:21:59Z) - Select, Extract and Generate: Neural Keyphrase Generation with
Layer-wise Coverage Attention [75.44523978180317]
本稿では,2つの主要成分からなるニューラルキーフレーズ生成モデルであるemphSEG-Netを提案する。
科学的およびWeb文書から得られた7つのキーフレーズ生成ベンチマークの実験結果は、SEG-Netが最先端のニューラル生成手法よりも大きなマージンで優れていることを示している。
論文 参考訳(メタデータ) (2020-08-04T18:00:07Z) - Corpus-level and Concept-based Explanations for Interpretable Document
Classification [23.194220621342254]
本稿では,キーワードとモデル予測の間の因果関係を捉えるためのコーパスレベルの説明手法を提案する。
また,より高レベルな概念を自動学習し,モデル予測タスクにおいて重要となる概念に基づく説明手法を提案する。
論文 参考訳(メタデータ) (2020-04-24T20:54:17Z) - Keyphrase Extraction with Span-based Feature Representations [13.790461555410747]
キーフレーズは、文書を特徴付ける意味メタデータを提供することができる。
キーフレーズ抽出のための3つのアプローチ: (i) 従来の2段階ランキング法、 (ii) シーケンスラベリング、 (iii) ニューラルネットワークを用いた生成。
本稿では,すべてのコンテンツトークンから直接,キーフレーズのスパン的特徴表現を抽出する新規スパンキーフレーズ抽出モデルを提案する。
論文 参考訳(メタデータ) (2020-02-13T09:48:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。