論文の概要: Predicting Long-Term Citations from Short-Term Linguistic Influence
- arxiv url: http://arxiv.org/abs/2210.13628v1
- Date: Mon, 24 Oct 2022 22:03:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:32:47.394225
- Title: Predicting Long-Term Citations from Short-Term Linguistic Influence
- Title(参考訳): 短期言語的影響による長期引用の予測
- Authors: Sandeep Soni and David Bamman and Jacob Eisenstein
- Abstract要約: 研究論文の影響の基準尺度は、その引用回数である。
本稿では,タイムスタンプによる文書収集における言語的影響の定量化手法を提案する。
- 参考スコア(独自算出の注目度): 20.78217545537925
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A standard measure of the influence of a research paper is the number of
times it is cited. However, papers may be cited for many reasons, and citation
count offers limited information about the extent to which a paper affected the
content of subsequent publications. We therefore propose a novel method to
quantify linguistic influence in timestamped document collections. There are
two main steps: first, identify lexical and semantic changes using contextual
embeddings and word frequencies; second, aggregate information about these
changes into per-document influence scores by estimating a high-dimensional
Hawkes process with a low-rank parameter matrix. We show that this measure of
linguistic influence is predictive of $\textit{future}$ citations: the estimate
of linguistic influence from the two years after a paper's publication is
correlated with and predictive of its citation count in the following three
years. This is demonstrated using an online evaluation with incremental
temporal training/test splits, in comparison with a strong baseline that
includes predictors for initial citation counts, topics, and lexical features.
- Abstract(参考訳): 研究論文の影響の標準的な尺度は、引用回数である。
しかし、多くの理由から論文は引用され、引用数にはその後の出版物の内容にどの程度影響したかという限られた情報がある。
そこで我々は,タイムスタンプ文書コレクションにおける言語的影響を定量化する新しい手法を提案する。
まず、文脈埋め込みと単語周波数を用いて語彙と意味の変化を識別し、次に、低ランクパラメータ行列を用いて高次元ホークス過程を推定することにより、これらの変化を文書ごとの影響スコアに集約する。
論文発表から2年後の言語的影響の推定は,次の3年間の引用数と相関し,予測する。
これは、漸進的な時間的トレーニング/テスト分割によるオンライン評価と、初期引用数、トピック、語彙特徴の予測子を含む強力なベースラインを用いて実証される。
関連論文リスト
- CiMaTe: Citation Count Prediction Effectively Leveraging the Main Text [14.279848166377667]
主文は引用数予測において重要な要素であるが,本文は典型的に非常に長いため,機械学習モデルでは処理が困難である。
本稿では,紙の断面構造を明示的に把握し,主文を利用したBERTに基づく引用数予測モデルCiMaTeを提案する。
論文 参考訳(メタデータ) (2024-10-06T08:39:13Z) - ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。
我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。
複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文 参考訳(メタデータ) (2024-06-19T09:16:14Z) - CausalCite: A Causal Formulation of Paper Citations [80.82622421055734]
CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - Estimating the Causal Effect of Early ArXiving on Paper Acceptance [56.538813945721685]
我々は,論文の審査期間(初期arXiving)前にarXivingが会議の受理に与える影響を推定する。
以上の結果から,早期のarXivingは,論文の受容に少なからぬ影響を及ぼす可能性が示唆された。
論文 参考訳(メタデータ) (2023-06-24T07:45:38Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Cross-Lingual Citations in English Papers: A Large-Scale Analysis of
Prevalence, Usage, and Impact [0.0]
本稿では,100万以上の英文論文に基づく言語間引用の分析を行う。
私たちの発見の中には、中国語で書かれた出版物への引用率の増加がある。
さらなる研究を容易にするため,収集したデータとソースコードを公開している。
論文 参考訳(メタデータ) (2021-11-07T15:34:02Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - How are journals cited? characterizing journal citations by type of
citation [0.0]
本稿では,引用関数に基づく引用の統計的特徴付けに関する最初の結果を示す。
また,雑誌が受ける支持率と論争の比率を,品質の潜在的指標として特徴づける最初の結果も提示する。
論文 参考訳(メタデータ) (2021-02-22T14:15:50Z) - Longitudinal Citation Prediction using Temporal Graph Neural Networks [27.589741169713825]
シーケンス引用予測のタスクを紹介します。
目標は、学術研究が経時的に受ける引用回数の軌跡を正確に予測することである。
論文 参考訳(メタデータ) (2020-12-10T15:25:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。