論文の概要: Comprehensive Manuscript Assessment with Text Summarization Using 69707 articles
- arxiv url: http://arxiv.org/abs/2503.20835v1
- Date: Wed, 26 Mar 2025 07:56:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-28 12:53:29.890593
- Title: Comprehensive Manuscript Assessment with Text Summarization Using 69707 articles
- Title(参考訳): 69707記事を用いたテキスト要約による総合的マニュアル評価
- Authors: Qichen Sun, Yuxing Lu, Kun Xia, Li Chen, He Sun, Jinzhuo Wang,
- Abstract要約: 我々は69707の科学論文から得られた、非常に包括的で大規模な情報のデータセットをキュレートするために、Scopusを利用する。
本稿では,原稿から抽出した意味的特徴と論文メタデータを活用する,インパクトベース分類タスクの深層学習手法を提案する。
- 参考スコア(独自算出の注目度): 10.943765373420135
- License:
- Abstract: Rapid and efficient assessment of the future impact of research articles is a significant concern for both authors and reviewers. The most common standard for measuring the impact of academic papers is the number of citations. In recent years, numerous efforts have been undertaken to predict citation counts within various citation windows. However, most of these studies focus solely on a specific academic field or require early citation counts for prediction, rendering them impractical for the early-stage evaluation of papers. In this work, we harness Scopus to curate a significantly comprehensive and large-scale dataset of information from 69707 scientific articles sourced from 99 journals spanning multiple disciplines. We propose a deep learning methodology for the impact-based classification tasks, which leverages semantic features extracted from the manuscripts and paper metadata. To summarize the semantic features, such as titles and abstracts, we employ a Transformer-based language model to encode semantic features and design a text fusion layer to capture shared information between titles and abstracts. We specifically focus on the following impact-based prediction tasks using information of scientific manuscripts in pre-publication stage: (1) The impact of journals in which the manuscripts will be published. (2) The future impact of manuscripts themselves. Extensive experiments on our datasets demonstrate the superiority of our proposed model for impact-based prediction tasks. We also demonstrate potentials in generating manuscript's feedback and improvement suggestions.
- Abstract(参考訳): 研究論文の将来的影響の迅速かつ効率的な評価は、著者とレビュアー双方にとって重要な関心事である。
学術論文の影響を測る最も一般的な基準は引用数である。
近年,様々な引用窓内での引用数を予測するために,多くの試みがなされている。
しかし、これらの研究の多くは特定の学術分野にのみ焦点をあてたり、予測に早期の引用数を必要とするため、論文の早期評価には実用的ではない。
本研究では,複数の分野にまたがる99の論文から得られた69707の学術論文から,より包括的で大規模な情報を収集するために,Scopusを利用する。
本稿では,原稿から抽出した意味的特徴と論文メタデータを活用する,インパクトベース分類タスクの深層学習手法を提案する。
タイトルや抽象語などの意味的特徴を要約するために,意味的特徴をエンコードし,テキスト融合層を設計し,タイトルと抽象語間の共有情報をキャプチャするTransformerベースの言語モデルを用いる。
本研究は, 学術論文の公開段階における情報を用いた影響に基づく予測課題に特に焦点をあてる: (1) 論文を出版する雑誌の影響について述べる。
2)写本自体の将来的な影響
本研究のデータセットに対する大規模な実験は,影響に基づく予測タスクに対する提案モデルの優位性を示すものである。
また、原稿のフィードバックと改善提案を生成する可能性を示す。
関連論文リスト
- CiMaTe: Citation Count Prediction Effectively Leveraging the Main Text [14.279848166377667]
主文は引用数予測において重要な要素であるが,本文は典型的に非常に長いため,機械学習モデルでは処理が困難である。
本稿では,紙の断面構造を明示的に把握し,主文を利用したBERTに基づく引用数予測モデルCiMaTeを提案する。
論文 参考訳(メタデータ) (2024-10-06T08:39:13Z) - From Words to Worth: Newborn Article Impact Prediction with LLM [69.41680520058418]
本稿では, LLMの能力を活用して, 新生記事の今後の影響を予測する, 有望なアプローチを提案する。
提案手法はLLMを用いて,高インパクトな論文の共有意味的特徴をタイトルと抽象的なペアの集合から識別する。
提案手法は, 0.216のMAEと0.901のNDCG@20を用いて, 提案手法が最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-08-07T17:52:02Z) - CiteFusion: An Ensemble Framework for Citation Intent Classification Harnessing Dual-Model Binary Couples and SHAP Analyses [1.7812428873698407]
本研究は,多クラスCitation Intent Classificationタスクに対処するアンサンブルフレームワークであるCiteFusionを紹介する。
CiteFusionは最先端のパフォーマンスを実現し、Macro-F1スコアはSciCiteが89.60%、ACL-ARCが76.24%だった。
我々は、SciCiteで開発されたCiteFusionモデルを利用して、引用意図を分類するWebベースのアプリケーションをリリースする。
論文 参考訳(メタデータ) (2024-07-18T09:29:33Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Automatic Analysis of Linguistic Features in Journal Articles of
Different Academic Impacts with Feature Engineering Techniques [0.975434908987426]
本研究では, 特徴工学的手法を用いて, 高次・中等度な学術誌RAのマイクロレベル言語的特徴の抽出を試みた。
英文記事のコーパスから特徴選択手法を用いて,25の高関連特徴を抽出した。
その結果, 隣接文間の内容語重複, 第三者代名詞の使用, 助動詞, 時制, 感情語など24種類の言語的特徴が, 学術的影響の異なる雑誌記事に対して一貫した, 正確な予測を提供することがわかった。
論文 参考訳(メタデータ) (2021-11-15T03:56:50Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - A Survey on Text Classification: From Shallow to Deep Learning [83.47804123133719]
過去10年は、ディープラーニングが前例のない成功を収めたために、この分野の研究が急増している。
本稿では,1961年から2021年までの最先端のアプローチを見直し,そのギャップを埋める。
特徴抽出と分類に使用されるテキストとモデルに基づいて,テキスト分類のための分類を作成する。
論文 参考訳(メタデータ) (2020-08-02T00:09:03Z) - Machine Identification of High Impact Research through Text and Image
Analysis [0.4737991126491218]
本稿では,引用の可能性が低い論文から高い論文を自動的に分離するシステムを提案する。
本システムでは,文書全体の外観を推測する視覚的分類器と,コンテンツインフォームド決定のためのテキスト分類器の両方を用いる。
論文 参考訳(メタデータ) (2020-05-20T19:12:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。