論文の概要: Predicting Long-Term Citations from Short-Term Linguistic Influence
- arxiv url: http://arxiv.org/abs/2210.13628v1
- Date: Mon, 24 Oct 2022 22:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:32:47.394225
- Title: Predicting Long-Term Citations from Short-Term Linguistic Influence
- Title(参考訳): 短期言語的影響による長期引用の予測
- Authors: Sandeep Soni and David Bamman and Jacob Eisenstein
- Abstract要約: 研究論文の影響の基準尺度は、その引用回数である。
本稿では,タイムスタンプによる文書収集における言語的影響の定量化手法を提案する。
- 参考スコア(独自算出の注目度): 20.78217545537925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A standard measure of the influence of a research paper is the number of
times it is cited. However, papers may be cited for many reasons, and citation
count offers limited information about the extent to which a paper affected the
content of subsequent publications. We therefore propose a novel method to
quantify linguistic influence in timestamped document collections. There are
two main steps: first, identify lexical and semantic changes using contextual
embeddings and word frequencies; second, aggregate information about these
changes into per-document influence scores by estimating a high-dimensional
Hawkes process with a low-rank parameter matrix. We show that this measure of
linguistic influence is predictive of $\textit{future}$ citations: the estimate
of linguistic influence from the two years after a paper's publication is
correlated with and predictive of its citation count in the following three
years. This is demonstrated using an online evaluation with incremental
temporal training/test splits, in comparison with a strong baseline that
includes predictors for initial citation counts, topics, and lexical features.
- Abstract(参考訳): 研究論文の影響の標準的な尺度は、引用回数である。
しかし、多くの理由から論文は引用され、引用数にはその後の出版物の内容にどの程度影響したかという限られた情報がある。
そこで我々は,タイムスタンプ文書コレクションにおける言語的影響を定量化する新しい手法を提案する。
まず、文脈埋め込みと単語周波数を用いて語彙と意味の変化を識別し、次に、低ランクパラメータ行列を用いて高次元ホークス過程を推定することにより、これらの変化を文書ごとの影響スコアに集約する。
論文発表から2年後の言語的影響の推定は,次の3年間の引用数と相関し,予測する。
これは、漸進的な時間的トレーニング/テスト分割によるオンライン評価と、初期引用数、トピック、語彙特徴の予測子を含む強力なベースラインを用いて実証される。
関連論文リスト
- CausalCite: A Causal Formulation of Paper Citations [54.31994550721541]
本稿では,従来のマッチングフレームワークを高次元テキスト埋め込みに適用する因果推論手法であるTextMatchを提案する。
論文引用の因果的定式化として、CausalCiteと呼ばれる結果の計量を適用した。
本研究は, 科学的専門家が報告した紙衝撃と高い相関性など, 様々な基準で有効性を示す。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - Estimating the Causal Effect of Early ArXiving on Paper Acceptance [56.538813945721685]
我々は,論文の審査期間(初期arXiving)前にarXivingが会議の受理に与える影響を推定する。
以上の結果から,早期のarXivingは,論文の受容に少なからぬ影響を及ぼす可能性が示唆された。
論文 参考訳(メタデータ) (2023-06-24T07:45:38Z) - Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Cross-Lingual Citations in English Papers: A Large-Scale Analysis of
Prevalence, Usage, and Impact [0.0]
本稿では,100万以上の英文論文に基づく言語間引用の分析を行う。
私たちの発見の中には、中国語で書かれた出版物への引用率の増加がある。
さらなる研究を容易にするため,収集したデータとソースコードを公開している。
論文 参考訳(メタデータ) (2021-11-07T15:34:02Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - How are journals cited? characterizing journal citations by type of
citation [0.0]
本稿では,引用関数に基づく引用の統計的特徴付けに関する最初の結果を示す。
また,雑誌が受ける支持率と論争の比率を,品質の潜在的指標として特徴づける最初の結果も提示する。
論文 参考訳(メタデータ) (2021-02-22T14:15:50Z) - Longitudinal Citation Prediction using Temporal Graph Neural Networks [27.589741169713825]
シーケンス引用予測のタスクを紹介します。
目標は、学術研究が経時的に受ける引用回数の軌跡を正確に予測することである。
論文 参考訳(メタデータ) (2020-12-10T15:25:16Z) - Preprints as accelerator of scholarly communication: An empirical
analysis in Mathematics [9.899221738408581]
出版の遅れと影響の2つの影響を測定する。
プレプリント版のある記事は、ソーシャルメディアで言及されることが多く、Altmetricの注意の遅れが短い。
論文 参考訳(メタデータ) (2020-11-24T07:32:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。