論文の概要: Enhancing Unsupervised Keyword Extraction in Academic Papers through Integrating Highlights with Abstract
- arxiv url: http://arxiv.org/abs/2604.19505v1
- Date: Tue, 21 Apr 2026 14:22:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-22 22:41:49.808818
- Title: Enhancing Unsupervised Keyword Extraction in Academic Papers through Integrating Highlights with Abstract
- Title(参考訳): ハイライトと抽象化の統合による学術論文における教師なしキーワード抽出の促進
- Authors: Yi Xiang, Chengzhi Zhang,
- Abstract要約: 本稿では,重要発見とコントリビューションの要約として,ハイライトセクションに焦点を当てる。
分析の結果,ハイライトには意味のあるキーワード情報が含まれており,要約を効果的に補完できることがわかった。
コンピュータサイエンス(CS)、ライブラリー・アンド・インフォメーション・サイエンス(LIS)データセットに関する4つの教師なしモデルで実験を行った。
- 参考スコア(独自算出の注目度): 7.006270460190784
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic keyword extraction from academic papers is a key area of interest in natural language processing and information retrieval. Although previous research has mainly focused on utilizing abstract and references for keyword extraction, this paper focuses on the highlights section - a summary describing the key findings and contributions, offering readers a quick overview of the research. Our observations indicate that highlights contain valuable keyword information that can effectively complement the abstract. To investigate the impact of incorporating highlights into unsupervised keyword extraction, we evaluate three input scenarios: using only the abstract, the highlights, and a combination of both. Experiments conducted with four unsupervised models on Computer Science (CS), Library and Information Science (LIS) datasets reveal that integrating the abstract with highlights significantly improves extraction performance. Furthermore, we examine the differences in keyword coverage and content between abstract and highlights, exploring how these variations influence extraction outcomes. The data and code are available at https://github.com/xiangyi-njust/Highlight-KPE.
- Abstract(参考訳): 学術論文からのキーワードの自動抽出は、自然言語処理と情報検索において重要な分野である。
従来の研究は主にキーワード抽出における抽象的・参照的手法の活用に重点を置いてきたが、本論文はハイライトセクション(重要な発見と貢献の要約)に焦点を当て、研究の概要を読者に提供した。
分析の結果,ハイライトには意味のあるキーワード情報が含まれており,要約を効果的に補完できることがわかった。
教師なしキーワード抽出にハイライトを組み込むことによる影響を調べるため,要約とハイライトと組み合わせた3つの入力シナリオを評価した。
コンピュータサイエンス(CS)、ライブラリーおよび情報科学(LIS)データセットに関する4つの教師なしモデルによる実験により、抽象概念とハイライトを統合することにより、抽出性能が大幅に向上することが明らかになった。
さらに,キーワードのカバレッジと要約とハイライトのコンテンツの違いについて検討し,これらの変化が抽出結果にどのように影響するかを考察した。
データとコードはhttps://github.com/xiangyi-njust/Highlight-KPEで公開されている。
関連論文リスト
- AbsPyramid: Benchmarking the Abstraction Ability of Language Models with a Unified Entailment Graph [62.685920585838616]
抽象能力は人間の知性において必須であり、言語モデルでは未探索のままである。
本稿では、抽象知識の221Kテキスト記述を統一したエンテーメントグラフであるAbsPyramidを提案する。
論文 参考訳(メタデータ) (2023-11-15T18:11:23Z) - Named Entity Recognition Based Automatic Generation of Research
Highlights [3.9410617513331863]
我々は,研究論文の異なるセクションを入力として,研究ハイライトを自動的に生成することを目指している。
入力に名前付きエンティティ認識を用いることで、生成したハイライトの品質が向上するかどうかを検討する。
論文 参考訳(メタデータ) (2023-02-25T16:33:03Z) - Improving Keyphrase Extraction with Data Augmentation and Information
Filtering [67.43025048639333]
キーフレーズ抽出はNLPにおける文書理解に不可欠なタスクの1つである。
本稿では,Behanceプラットフォーム上でストリームされたビデオからキーフレーズを抽出するための新しいコーパスと手法を提案する。
論文 参考訳(メタデータ) (2022-09-11T22:38:02Z) - Enhancing Keyphrase Extraction from Academic Articles with their
Reference Information [12.769066804715697]
文書情報を高度に要約するキーワードは、ユーザが文書を素早く入手し、理解するのに役立ちます。
参照のタイトル情報は、著者が指定したキーフレーズも含んでいる。
実験により、参照情報は自動キーフレーズ抽出の精度、リコール、F1を高めることができる。
論文 参考訳(メタデータ) (2021-11-28T11:14:16Z) - Keyword Extraction for Improved Document Retrieval in Conversational
Search [10.798537120200006]
混合開始型会話検索は大きな利点をもたらす。
会話からユーザーが提供する追加情報を取り入れることには、いくつかの課題がある。
我々は2つの対話型キーワード抽出データセットを収集し、それらを組み込んだエンドツーエンドの文書検索パイプラインを提案する。
論文 参考訳(メタデータ) (2021-09-13T13:55:37Z) - TRIE: End-to-End Text Reading and Information Extraction for Document
Understanding [56.1416883796342]
本稿では,統合されたエンドツーエンドのテキスト読解と情報抽出ネットワークを提案する。
テキスト読解のマルチモーダル視覚的特徴とテキスト的特徴は、情報抽出のために融合される。
提案手法は, 精度と効率の両面において, 最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-05-27T01:47:26Z) - Salience Estimation with Multi-Attention Learning for Abstractive Text
Summarization [86.45110800123216]
テキスト要約のタスクでは、単語、フレーズ、文のサリエンス推定が重要な要素である。
本稿では,サラレンス推定のための2つの新しい注目学習要素を含むマルチアテンション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-04-07T02:38:56Z) - Finding Black Cat in a Coal Cellar -- Keyphrase Extraction &
Keyphrase-Rubric Relationship Classification from Complex Assignments [5.067828201066184]
本稿では,キーフレーズ抽出作業における教師あり教師なしアプローチの有効性を定量化することを目的とする。
i) 教師なしの MultiPartiteRank がキーフレーズ抽出に最適であることがわかった。
今後,これらの課題に関心のある人々に対して,包括的分析と有用な観察結果の導出を行う。
論文 参考訳(メタデータ) (2020-04-03T13:18:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。