論文の概要: From Words to Worth: Newborn Article Impact Prediction with LLM
- arxiv url: http://arxiv.org/abs/2408.03934v1
- Date: Wed, 7 Aug 2024 17:52:02 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-08 12:35:07.547756
- Title: From Words to Worth: Newborn Article Impact Prediction with LLM
- Title(参考訳): 言葉から価値へ: LLMで生まれ変わった記事インパクト予測
- Authors: Penghai Zhao, Qinghua Xing, Kairan Dou, Jinyu Tian, Ying Tai, Jian Yang, Ming-Ming Cheng, Xiang Li,
- Abstract要約: 本稿は,LLMの微調整機能を活用して,新たな記事の今後の影響を予測する,有望なアプローチを提案する。
LLMを微調整するための包括的なデータセットが構築されリリースされ、対応するタイトル、抽象化、TLCSI_SPを含む12,000以上のエントリが含まれている。
- 参考スコア(独自算出の注目度): 69.41680520058418
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As the academic landscape expands, the challenge of efficiently identifying potentially high-impact articles among the vast number of newly published works becomes critical. This paper introduces a promising approach, leveraging the capabilities of fine-tuned LLMs to predict the future impact of newborn articles solely based on titles and abstracts. Moving beyond traditional methods heavily reliant on external information, the proposed method discerns the shared semantic features of highly impactful papers from a large collection of title-abstract and potential impact pairs. These semantic features are further utilized to regress an improved metric, TNCSI_SP, which has been endowed with value, field, and time normalization properties. Additionally, a comprehensive dataset has been constructed and released for fine-tuning the LLM, containing over 12,000 entries with corresponding titles, abstracts, and TNCSI_SP. The quantitative results, with an NDCG@20 of 0.901, demonstrate that the proposed approach achieves state-of-the-art performance in predicting the impact of newborn articles when compared to competitive counterparts. Finally, we demonstrate a real-world application for predicting the impact of newborn journal articles to demonstrate its noteworthy practical value. Overall, our findings challenge existing paradigms and propose a shift towards a more content-focused prediction of academic impact, offering new insights for assessing newborn article impact.
- Abstract(参考訳): 学術的な景観が拡大するにつれて、新刊作品の膨大な数の中で、潜在的にインパクトの高い記事を効果的に特定するという課題が重要となる。
本稿では,書名と要約のみに基づく新生記事の今後の影響を予測するために,微調整LDMの能力を活用する,有望なアプローチを提案する。
外部情報に大きく依存する従来の手法を超えて、提案手法は、非常に影響力のある論文の共有意味的特徴を、タイトルと潜在的なインパクトペアの大規模なコレクションから識別する。
これらのセマンティック機能は、値、フィールド、時間正規化特性を付与した改良されたメトリックである TNCSI_SP にさらに活用される。
さらに、LLMを微調整するための包括的なデータセットが構築されリリースされ、対応するタイトル、抽象化、TLCSI_SPを含む12,000以上のエントリが含まれている。
0.901のNDCG@20を用いて, 提案手法は, 競合する記事と比較して, 新生記事の影響を予測する上で, 最先端の性能を実現することを実証した。
最後に,新たな雑誌記事の影響を予測するための実世界のアプリケーションを紹介し,その実用的価値を実証する。
全体として、既存のパラダイムに挑戦し、よりコンテンツを重視した学術的影響予測へのシフトを提案し、新しく生まれた記事の影響を評価するための新たな洞察を提供する。
関連論文リスト
- ATLAS: Improving Lay Summarisation with Attribute-based Control [19.62666787748948]
レイ要約(Lay summarisation)は、専門家でない聴衆に理解しやすい要約を作成することを目的としている。
以前の作業では、生成したサマリの内容とスタイルが、モデルをトレーニングするために使用されるデータに完全に依存する、オールサイズのアプローチを前提としていました。
我々は,生成された要約の全体的「遅延性」に寄与する様々な特性を制御できる,抽象的な要約手法ATLASを提案する。
論文 参考訳(メタデータ) (2024-06-09T03:22:55Z) - Entangled Relations: Leveraging NLI and Meta-analysis to Enhance Biomedical Relation Extraction [35.320291731292286]
そこで我々は,NLIの原理を応用し,関係抽出を強化したMetaEntail-REを提案する。
我々のアプローチは、関係クラスをクラス指示仮説に言語化することで過去の研究に追従する。
実験の結果,MetaEntail-REはバイオメディカルドメインと一般ドメインの両方で性能向上を示した。
論文 参考訳(メタデータ) (2024-05-31T23:05:04Z) - LLM-DA: Data Augmentation via Large Language Models for Few-Shot Named
Entity Recognition [67.96794382040547]
$LLM-DA$は、数発のNERタスクのために、大きな言語モデル(LLM)に基づいた、新しいデータ拡張テクニックである。
提案手法では,14のコンテキスト書き換え戦略を採用し,同一タイプのエンティティ置換を設計し,ロバスト性を高めるためにノイズ注入を導入する。
論文 参考訳(メタデータ) (2024-02-22T14:19:56Z) - P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.571395694391654]
既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文 参考訳(メタデータ) (2023-11-16T10:14:28Z) - Enhancing Topic Extraction in Recommender Systems with Entropy
Regularization [2.7286395031146062]
本稿では,レコメンデータシステムの低説明可能性問題に対処するため,エントロピー正規化と呼ばれる新しい手法を提案する。
実験の結果,単語埋め込みにおけるコサイン類似性によって定量化され,トピックコヒーレンスが著しく向上したことが示された。
論文 参考訳(メタデータ) (2023-06-12T20:05:09Z) - MINER: Improving Out-of-Vocabulary Named Entity Recognition from an
Information Theoretic Perspective [57.19660234992812]
NERモデルは標準のNERベンチマークで有望な性能を達成した。
近年の研究では、従来のアプローチはエンティティ参照情報に過度に依存し、OoV(out-of-vocabulary)エンティティ認識の性能が劣っていることが示されている。
我々は、情報理論の観点からこの問題を改善するための新しいNER学習フレームワークであるMINERを提案する。
論文 参考訳(メタデータ) (2022-04-09T05:18:20Z) - Deep forecasting of translational impact in medical research [1.8130872753848115]
我々は,多スケールパブリッシュデータの表現的および識別的数学的モデルスイートを開発する。
我々は、引用は、特許、ガイドライン、政策文書に含めることにより判断される翻訳効果の適度な予測のみであることを示す。
我々は、従来の引用に基づく手法よりも、コンテンツに基づく影響モデルの方がパフォーマンスに優れていると論じる。
論文 参考訳(メタデータ) (2021-10-17T19:29:41Z) - Simplifying Impact Prediction for Scientific Articles [1.8352113484137624]
記事の期待される影響を推定することは、さまざまなアプリケーションにとって価値があります。
最小限の記事メタデータを用いてトレーニングできるモデルを提案する。
論文 参考訳(メタデータ) (2020-12-30T15:24:55Z) - Reliable Evaluations for Natural Language Inference based on a Unified
Cross-dataset Benchmark [54.782397511033345]
クラウドソースの自然言語推論(NLI)データセットは、アノテーションアーティファクトのような重大なバイアスに悩まされる可能性がある。
14のNLIデータセットと9つの広く使用されているニューラルネットワークベースのNLIモデルを再評価した、新しいクロスデータセットベンチマークを提案する。
提案した評価手法と実験ベースラインは,将来信頼性の高いNLI研究を刺激する基盤となる可能性がある。
論文 参考訳(メタデータ) (2020-10-15T11:50:12Z) - Latent Opinions Transfer Network for Target-Oriented Opinion Words
Extraction [63.70885228396077]
資源豊富なレビュー評価分類データセットから低リソースタスクTOWEへ意見知識を伝達する新しいモデルを提案する。
我々のモデルは、他の最先端手法よりも優れた性能を達成し、意見の知識を伝達することなく、ベースモデルを大幅に上回る。
論文 参考訳(メタデータ) (2020-01-07T11:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。