論文の概要: Enhancing Keyphrase Extraction from Academic Articles with their
Reference Information
- arxiv url: http://arxiv.org/abs/2111.14106v2
- Date: Tue, 30 Nov 2021 04:43:39 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 13:13:07.972184
- Title: Enhancing Keyphrase Extraction from Academic Articles with their
Reference Information
- Title(参考訳): 参考情報を用いた学術論文からのキーワード抽出の促進
- Authors: Chengzhi Zhang, Lei Zhao, Mengyuan Zhao, Yingyi Zhang
- Abstract要約: 文書情報を高度に要約するキーワードは、ユーザが文書を素早く入手し、理解するのに役立ちます。
参照のタイトル情報は、著者が指定したキーフレーズも含んでいる。
実験により、参照情報は自動キーフレーズ抽出の精度、リコール、F1を高めることができる。
- 参考スコア(独自算出の注目度): 12.769066804715697
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: With the development of Internet technology, the phenomenon of information
overload is becoming more and more obvious. It takes a lot of time for users to
obtain the information they need. However, keyphrases that summarize document
information highly are helpful for users to quickly obtain and understand
documents. For academic resources, most existing studies extract keyphrases
through the title and abstract of papers. We find that title information in
references also contains author-assigned keyphrases. Therefore, this article
uses reference information and applies two typical methods of unsupervised
extraction methods (TF*IDF and TextRank), two representative traditional
supervised learning algorithms (Na\"ive Bayes and Conditional Random Field) and
a supervised deep learning model (BiLSTM-CRF), to analyze the specific
performance of reference information on keyphrase extraction. It is expected to
improve the quality of keyphrase recognition from the perspective of expanding
the source text. The experimental results show that reference information can
increase precision, recall, and F1 of automatic keyphrase extraction to a
certain extent. This indicates the usefulness of reference information on
keyphrase extraction of academic papers and provides a new idea for the
following research on automatic keyphrase extraction.
- Abstract(参考訳): インターネット技術の発展とともに、情報過剰の現象はますます顕著になりつつある。
ユーザが必要な情報を取得するには、多くの時間が必要です。
しかし、文書情報を高度に要約するキーフレーズは、ユーザが文書を素早く入手し理解するのに役立ちます。
学術資源については、ほとんどの既存の研究が論文のタイトルと要約を通じてキーフレーズを抽出している。
参照中のタイトル情報は、著者が指定したキーフレーズも含んでいる。
そこで本研究では,参照情報を用いて,非教師付き抽出法(tf*idfとtextrank),代表的な教師付き学習アルゴリズム(na\"ive bayes and conditional random field)と教師付きディープラーニングモデル(bilstm-crf)の2つの典型的な手法を適用し,キーフレーズ抽出における基準情報の特定性能を分析する。
原文の拡張の観点からキーフレーズ認識の質を向上させることが期待されている。
実験の結果,基準情報はキーフレーズの自動抽出の精度,リコール,f1をある程度向上できることがわかった。
これは,学術論文のキーフレーズ抽出における参照情報の有用性を示し,自動キーフレーズ抽出に関する新たな研究のアイデアを提供する。
関連論文リスト
- BibRank: Automatic Keyphrase Extraction Platform Using~Metadata [0.0]
本稿では、キーフレーズデータセットを統合し、キーフレーズ抽出アルゴリズムの評価を容易にするプラットフォームを提案する。
このプラットフォームには、単語をBib形式で解析することで得られる豊富なデータセットを活用する自動キーフレーズ抽出アルゴリズムであるBibRankが含まれている。
論文 参考訳(メタデータ) (2023-10-13T14:44:34Z) - SimCKP: Simple Contrastive Learning of Keyphrase Representations [36.88517357720033]
そこで本論文では,(1)文脈認識型フレーズレベルの表現からキーフレーズを抽出する抽出器・ジェネレータと,(2)生成したフレーズのスコアを対応する文書と整列させることで,文書に現れないキーフレーズを生成するリランカと,の2つの段階からなる単純なコントラスト学習フレームワークであるSimCKPを提案する。
論文 参考訳(メタデータ) (2023-10-12T11:11:54Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - LDKP: A Dataset for Identifying Keyphrases from Long Scientific
Documents [48.84086818702328]
テキスト文書からキーフレーズ(KP)を識別することは、自然言語処理と情報検索の基本的な課題である。
このタスクのベンチマークデータセットの大部分は、ドキュメントのタイトルと抽象情報のみを含む科学領域からのものだ。
人間が書いた要約はほとんどの文書では利用できないし、文書はほとんど常に長く、KPの比率はタイトルと抽象の限られた文脈を超えて直接見つかる。
論文 参考訳(メタデータ) (2022-03-29T08:44:57Z) - Representation Learning for Resource-Constrained Keyphrase Generation [78.02577815973764]
本稿では,言語モデリングの目的を導くために,有能なスパンリカバリと有能なスパン予測を導入する。
提案手法が低リソースおよびゼロショットのキーフレーズ生成に有効であることを示す。
論文 参考訳(メタデータ) (2022-03-15T17:48:04Z) - Deep Keyphrase Completion [59.0413813332449]
Keyphraseは、非常にコンパクトで簡潔で、意味に満ちた文書内容の正確な情報を提供し、談話理解、組織化、テキスト検索に広く利用されている。
本論文では,文書内容と既知のキーフレーズの数が極めて限られているため,テキストキーフレーズの完全化(KPC)を提案し,文書中のキーフレーズをより多く生成する(科学出版など)。
深層学習フレームワークを通じて、既知のキーフレーズとともに文書内容の深い意味的意味を捉えようとすることから、textitdeep keyphrase completion (DKPC) と命名する。
論文 参考訳(メタデータ) (2021-10-29T07:15:35Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Keyphrase Extraction with Dynamic Graph Convolutional Networks and
Diversified Inference [50.768682650658384]
キーワード抽出(KE)は、ある文書でカバーされている概念やトピックを正確に表現するフレーズの集合を要約することを目的としている。
最近のシークエンス・ツー・シークエンス(Seq2Seq)ベースの生成フレームワークはKEタスクで広く使われ、様々なベンチマークで競合性能を得た。
本稿では,この2つの問題を同時に解くために,動的グラフ畳み込みネットワーク(DGCN)を採用することを提案する。
論文 参考訳(メタデータ) (2020-10-24T08:11:23Z) - A Joint Learning Approach based on Self-Distillation for Keyphrase
Extraction from Scientific Documents [29.479331909227998]
キーフレーズ抽出(英: Keyphrase extract)は、文書を最もよく記述するフレーズの小さなセットを抽出するタスクである。
タスクの既存のベンチマークデータセットは、通常、注釈付きドキュメントの数に制限がある。
本稿では, 自己蒸留の考え方に基づく, シンプルで効率的な共同学習手法を提案する。
論文 参考訳(メタデータ) (2020-10-22T18:36:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。