論文の概要: Enhancing Keyphrase Extraction from Academic Articles Using Section Structure Information
- arxiv url: http://arxiv.org/abs/2505.14149v1
- Date: Tue, 20 May 2025 09:57:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:53.046647
- Title: Enhancing Keyphrase Extraction from Academic Articles Using Section Structure Information
- Title(参考訳): セクション構造情報を用いた学術論文からのキーワード抽出の促進
- Authors: Chengzhi Zhang, Xinyi Yan, Lei Zhao, Yingyi Zhang,
- Abstract要約: 本研究では,入力コーパスとして Title と Abstract を用いた抽出モデルの性能向上を目的とした。
キーワードの意味的豊かさは抽象長によって著しく制約される。
本稿では,学術論文のセクション構造情報から得られた構造的特徴とセクションテキストを利用して,キーフレーズを抽出した。
- 参考スコア(独自算出の注目度): 11.576476334524997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The exponential increase in academic papers has significantly increased the time required for researchers to access relevant literature. Keyphrase Extraction (KPE) offers a solution to this situation by enabling researchers to efficiently retrieve relevant literature. The current study on KPE from academic articles aims to improve the performance of extraction models through innovative approaches using Title and Abstract as input corpora. However, the semantic richness of keywords is significantly constrained by the length of the abstract. While full-text-based KPE can address this issue, it simultaneously introduces noise, which significantly diminishes KPE performance. To address this issue, this paper utilized the structural features and section texts obtained from the section structure information of academic articles to extract keyphrase from academic papers. The approach consists of two main parts: (1) exploring the effect of seven structural features on KPE models, and (2) integrating the extraction results from all section texts used as input corpora for KPE models via a keyphrase integration algorithm to obtain the keyphrase integration result. Furthermore, this paper also examined the effect of the classification quality of section structure on the KPE performance. The results show that incorporating structural features improves KPE performance, though different features have varying effects on model efficacy. The keyphrase integration approach yields the best performance, and the classification quality of section structure can affect KPE performance. These findings indicate that using the section structure information of academic articles contributes to effective KPE from academic articles. The code and dataset supporting this study are available at https://github.com/yan-xinyi/SSB_KPE.
- Abstract(参考訳): 学術論文の指数的な増加は、研究者が関連する文献にアクセスするのに必要な時間を大幅に増加させた。
キーフレーズ抽出(KPE)は、研究者が関連文献を効率的に検索できるようにすることにより、この状況に対する解決策を提供する。
学術論文のKPEに関する現在の研究は、入力コーパスとして Title と Abstract を用いて、革新的なアプローチによって抽出モデルの性能を向上させることを目的としている。
しかし、キーワードの意味的豊かさは抽象長によって著しく制約される。
フルテキストベースのKPEはこの問題に対処できるが、同時にノイズを導入し、KPEのパフォーマンスを著しく低下させる。
そこで本稿では,学術論文のセクション構造情報から得られた構造的特徴とセクションテキストを利用して,学術論文からキーフレーズを抽出した。
提案手法は,(1) 7つの構造的特徴がKPEモデルに与える影響を探索し,(2)キーフレーズ統合アルゴリズムを用いてKPEモデルの入力コーパスとして使用される全セクションテキストから抽出結果を統合し,キーフレーズ統合結果を得る。
さらに, 断面構造の分類品質がKPE性能に及ぼす影響についても検討した。
その結果, 構造的特徴を取り入れた場合, KPEの性能は向上するが, 異なる特徴がモデルの有効性に様々な影響を及ぼすことがわかった。
キーフレーズの統合アプローチは最高の性能をもたらし、セクション構造の分類品質はKPEのパフォーマンスに影響を及ぼす。
これらの結果から,学術論文のセクション構造情報の利用は,学術論文の有効KPEに寄与することが示唆された。
この研究をサポートするコードとデータセットはhttps://github.com/yan-xinyi/SSB_KPEで公開されている。
関連論文リスト
- Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction [9.307602861891926]
キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-17T02:26:30Z) - StructVPR: Distill Structural Knowledge with Weighting Samples for
Visual Place Recognition [49.58170209388029]
視覚的位置認識(VPR)は通常、特定の画像検索問題と見なされる。
我々は、RGBグローバル機能における構造的知識を高めるために、VPRのための新しいトレーニングアーキテクチャであるStructVPRを提案する。
計算コストを低く保ちながら最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-12-02T02:52:01Z) - Enhancing Identification of Structure Function of Academic Articles
Using Contextual Information [6.28532577139029]
本稿では,学術論文の構造的機能を明らかにするためのコーパスとして,ACLカンファレンスの記事を取り上げる。
従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。
2) に触発された本論文は,ディープラーニングモデルに文脈情報を導入し,重要な結果を得た。
論文 参考訳(メタデータ) (2021-11-28T11:21:21Z) - Capturing Global Informativeness in Open Domain Keyphrase Extraction [40.57116173502994]
Open- domain KeyPhrase extract (KPE)は、ドメインや品質の制約なしにドキュメントからキーフレーズを抽出することを目的としている。
本稿では,事前学習言語モデルに基づくオープンドメインKPEアーキテクチャであるJointKPEを提案する。
JointKPEは、ドキュメント全体の情報度を見積もることで、キーフレーズのランク付けを学び、キーフレーズチャンキングタスクで共同で訓練される。
論文 参考訳(メタデータ) (2020-04-28T16:34:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。