論文の概要: Enhancing Keyphrase Extraction from Academic Articles Using Section Structure Information
- arxiv url: http://arxiv.org/abs/2505.14149v1
- Date: Tue, 20 May 2025 09:57:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-21 14:49:53.046647
- Title: Enhancing Keyphrase Extraction from Academic Articles Using Section Structure Information
- Title(参考訳): セクション構造情報を用いた学術論文からのキーワード抽出の促進
- Authors: Chengzhi Zhang, Xinyi Yan, Lei Zhao, Yingyi Zhang,
- Abstract要約: 本研究では,入力コーパスとして Title と Abstract を用いた抽出モデルの性能向上を目的とした。
キーワードの意味的豊かさは抽象長によって著しく制約される。
本稿では,学術論文のセクション構造情報から得られた構造的特徴とセクションテキストを利用して,キーフレーズを抽出した。
- 参考スコア(独自算出の注目度): 11.576476334524997
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The exponential increase in academic papers has significantly increased the time required for researchers to access relevant literature. Keyphrase Extraction (KPE) offers a solution to this situation by enabling researchers to efficiently retrieve relevant literature. The current study on KPE from academic articles aims to improve the performance of extraction models through innovative approaches using Title and Abstract as input corpora. However, the semantic richness of keywords is significantly constrained by the length of the abstract. While full-text-based KPE can address this issue, it simultaneously introduces noise, which significantly diminishes KPE performance. To address this issue, this paper utilized the structural features and section texts obtained from the section structure information of academic articles to extract keyphrase from academic papers. The approach consists of two main parts: (1) exploring the effect of seven structural features on KPE models, and (2) integrating the extraction results from all section texts used as input corpora for KPE models via a keyphrase integration algorithm to obtain the keyphrase integration result. Furthermore, this paper also examined the effect of the classification quality of section structure on the KPE performance. The results show that incorporating structural features improves KPE performance, though different features have varying effects on model efficacy. The keyphrase integration approach yields the best performance, and the classification quality of section structure can affect KPE performance. These findings indicate that using the section structure information of academic articles contributes to effective KPE from academic articles. The code and dataset supporting this study are available at https://github.com/yan-xinyi/SSB_KPE.
- Abstract(参考訳): 学術論文の指数的な増加は、研究者が関連する文献にアクセスするのに必要な時間を大幅に増加させた。
キーフレーズ抽出(KPE)は、研究者が関連文献を効率的に検索できるようにすることにより、この状況に対する解決策を提供する。
学術論文のKPEに関する現在の研究は、入力コーパスとして Title と Abstract を用いて、革新的なアプローチによって抽出モデルの性能を向上させることを目的としている。
しかし、キーワードの意味的豊かさは抽象長によって著しく制約される。
フルテキストベースのKPEはこの問題に対処できるが、同時にノイズを導入し、KPEのパフォーマンスを著しく低下させる。
そこで本稿では,学術論文のセクション構造情報から得られた構造的特徴とセクションテキストを利用して,学術論文からキーフレーズを抽出した。
提案手法は,(1) 7つの構造的特徴がKPEモデルに与える影響を探索し,(2)キーフレーズ統合アルゴリズムを用いてKPEモデルの入力コーパスとして使用される全セクションテキストから抽出結果を統合し,キーフレーズ統合結果を得る。
さらに, 断面構造の分類品質がKPE性能に及ぼす影響についても検討した。
その結果, 構造的特徴を取り入れた場合, KPEの性能は向上するが, 異なる特徴がモデルの有効性に様々な影響を及ぼすことがわかった。
キーフレーズの統合アプローチは最高の性能をもたらし、セクション構造の分類品質はKPEのパフォーマンスに影響を及ぼす。
これらの結果から,学術論文のセクション構造情報の利用は,学術論文の有効KPEに寄与することが示唆された。
この研究をサポートするコードとデータセットはhttps://github.com/yan-xinyi/SSB_KPEで公開されている。
関連論文リスト
- Enhancing Abstractive Summarization of Scientific Papers Using Structure Information [6.414732533433283]
本稿では,学術論文における構造的機能の自動認識を活用する2段階の抽象的要約フレームワークを提案する。
第1段階では,多くの学術論文から章題を標準化し,構造関数認識のための大規模データセットを構築した。
第2段階では、Longformerを用いて、セクション間のリッチなコンテキスト関係をキャプチャし、コンテキスト対応の要約を生成する。
論文 参考訳(メタデータ) (2025-05-20T10:34:45Z) - EMK-KEN: A High-Performance Approach for Assessing Knowledge Value in Citation Network [0.0]
EMK-KENと呼ばれる新しい知識評価手法を提案する。
モデルは2つのモジュールから構成される。具体的には、まずMetaFPとMambaを使用して、ノードメタデータとテキスト埋め込みのセマンティックな特徴をキャプチャする。
第2のモジュールはkanを利用して、異なる分野のネットワークの違いを学習するために、引用ネットワークの構造情報をさらにキャプチャする。
論文 参考訳(メタデータ) (2025-01-19T06:27:46Z) - Learning to Extract Structured Entities Using Language Models [52.281701191329]
機械学習の最近の進歩は、情報抽出の分野に大きな影響を与えている。
タスクをエンティティ中心にすることで、さまざまなメトリクスの使用を可能にします。
我々は、Structured Entity extractを導入し、Adroximate Entity Set OverlaPメトリックを提案し、この分野にコントリビュートします。
論文 参考訳(メタデータ) (2024-02-06T22:15:09Z) - Enhancing Phrase Representation by Information Bottleneck Guided Text Diffusion Process for Keyphrase Extraction [9.307602861891926]
キーフレーズ抽出は自然言語処理において重要な課題である。
本研究では,拡張キーフレーズ表現を生成するためのテキスト拡散過程を導出するDiff-KPEを提案する。
実験により、Diff-KPEは、大規模なオープンドメインキーフレーズ抽出ベンチマーク、OpenKP、科学ドメインデータセットKP20Kにおいて、既存のKPEメソッドよりも優れていることが示された。
論文 参考訳(メタデータ) (2023-08-17T02:26:30Z) - Structural and Statistical Texture Knowledge Distillation for Semantic Segmentation [72.19108372163868]
セグメンテーションのための構造的・統計的テクスチャ知識蒸留(SSTKD)フレームワークを提案する。
構造的テクスチャ知識のために,低レベルの特徴を分解するContourlet Decomposition Module (CDM)を導入する。
本稿では, 統計的テクスチャ知識を適応的に抽出し, 強化するDenoized Texture Intensity Equalization Module (DTIEM)を提案する。
論文 参考訳(メタデータ) (2023-05-06T06:01:11Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - StructVPR: Distill Structural Knowledge with Weighting Samples for
Visual Place Recognition [49.58170209388029]
視覚的位置認識(VPR)は通常、特定の画像検索問題と見なされる。
我々は、RGBグローバル機能における構造的知識を高めるために、VPRのための新しいトレーニングアーキテクチャであるStructVPRを提案する。
計算コストを低く保ちながら最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-12-02T02:52:01Z) - Unified Structure Generation for Universal Information Extraction [58.89057387608414]
UIEは、異なるIEタスクを普遍的にモデル化し、ターゲット構造を適応的に生成し、異なる知識ソースから一般的なIE能力を協調的に学習することができる。
実験によると、UIEは4つのIEタスク、13のデータセット、およびすべての教師付き、低リソース、数ショット設定で最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-03-23T08:49:29Z) - Enhancing Identification of Structure Function of Academic Articles
Using Contextual Information [6.28532577139029]
本稿では,学術論文の構造的機能を明らかにするためのコーパスとして,ACLカンファレンスの記事を取り上げる。
従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。
2) に触発された本論文は,ディープラーニングモデルに文脈情報を導入し,重要な結果を得た。
論文 参考訳(メタデータ) (2021-11-28T11:21:21Z) - Capturing Global Informativeness in Open Domain Keyphrase Extraction [40.57116173502994]
Open- domain KeyPhrase extract (KPE)は、ドメインや品質の制約なしにドキュメントからキーフレーズを抽出することを目的としている。
本稿では,事前学習言語モデルに基づくオープンドメインKPEアーキテクチャであるJointKPEを提案する。
JointKPEは、ドキュメント全体の情報度を見積もることで、キーフレーズのランク付けを学び、キーフレーズチャンキングタスクで共同で訓練される。
論文 参考訳(メタデータ) (2020-04-28T16:34:35Z) - A Dependency Syntactic Knowledge Augmented Interactive Architecture for
End-to-End Aspect-based Sentiment Analysis [73.74885246830611]
エンドツーエンドABSAのためのマルチタスク学習を用いた対話型アーキテクチャを新たに提案する。
このモデルは、よく設計された依存性関係埋め込みグラフ畳み込みネットワーク(DreGcn)を活用することで、構文知識(依存性関係と型)を完全に活用することができる。
3つのベンチマークデータセットの大規模な実験結果から,本手法の有効性が示された。
論文 参考訳(メタデータ) (2020-04-04T14:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。