論文の概要: The Noisy Path from Source to Citation: Measuring How Scholars Engage with Past Research
- arxiv url: http://arxiv.org/abs/2502.20581v1
- Date: Thu, 27 Feb 2025 22:47:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-03 13:42:40.882188
- Title: The Noisy Path from Source to Citation: Measuring How Scholars Engage with Past Research
- Title(参考訳): ソースからサイテーションへのノイズの経路:過去の研究とスコラーの関わりを測る
- Authors: Hong Chen, Misha Teplitskiy, David Jurgens,
- Abstract要約: 本稿では,大規模な引用忠実度を定量化する計算パイプラインを提案する。
論文の全文を用いて、パイプラインは引用論文における引用と引用論文における対応するクレームを識別する。
準実験を用いて「電話効果」を確立する - 引用論文が原主張に忠実度が低い場合、引用論文と原文を引用する将来の論文は原文に忠実度が低い。
- 参考スコア(独自算出の注目度): 20.649638393774048
- License:
- Abstract: Academic citations are widely used for evaluating research and tracing knowledge flows. Such uses typically rely on raw citation counts and neglect variability in citation types. In particular, citations can vary in their fidelity as original knowledge from cited studies may be paraphrased, summarized, or reinterpreted, possibly wrongly, leading to variation in how much information changes from cited to citing paper. In this study, we introduce a computational pipeline to quantify citation fidelity at scale. Using full texts of papers, the pipeline identifies citations in citing papers and the corresponding claims in cited papers, and applies supervised models to measure fidelity at the sentence level. Analyzing a large-scale multi-disciplinary dataset of approximately 13 million citation sentence pairs, we find that citation fidelity is higher when authors cite papers that are 1) more recent and intellectually close, 2) more accessible, and 3) the first author has a lower H-index and the author team is medium-sized. Using a quasi-experiment, we establish the "telephone effect" - when citing papers have low fidelity to the original claim, future papers that cite the citing paper and the original have lower fidelity to the original. Our work reveals systematic differences in citation fidelity, underscoring the limitations of analyses that rely on citation quantity alone and the potential for distortion of evidence.
- Abstract(参考訳): 学術的引用は研究の評価や知識の流れの追跡に広く用いられている。
このような使用は、通常、引用型における生の引用数に依存し、可変性を無視する。
特に引用された研究からの本来の知識がパラフレーズ化され、要約され、あるいは再解釈され、おそらく間違っているため、引用は、引用された論文から引用された論文への情報の変化の度合いに変化をもたらす。
本研究では,大規模な引用忠実度を定量化する計算パイプラインを提案する。
論文の全文を用いて、パイプラインは引用論文の引用における引用と引用論文の対応するクレームを識別し、文レベルでの忠実度を測定するために教師付きモデルを適用する。
約1300万の引用文対からなる大規模複数学際データセットを解析したところ、著者が論文を引用する場合、引用忠実度が高いことが判明した。
1) より最近で知的に近いもの
2)よりアクセスしやすく
3)第1の著者はH-インデックスが低く,第2の著者チームは中規模である。
準実験を用いて「電話効果」を確立する - 引用論文が原主張に忠実度が低い場合、引用論文と原文を引用する将来の論文は原文に忠実度が低い。
本研究は, 引用量のみに依存する解析の限界と, 証拠の歪曲の可能性について, 引用忠実性の体系的差異を明らかにした。
関連論文リスト
- HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction [14.731720495144112]
本稿では,表面的な言及を超越した批判的参照を識別する,コア引用という新しい概念を紹介する。
我々は、引用予測のための$textbfH$ybrid $textbfL$anguage $textbfM$odelワークフローである$textbfHLM-Citeを提案する。
我々はHLM-Citeを19分野にわたって評価し,SOTA法と比較して17.6%の性能向上を示した。
論文 参考訳(メタデータ) (2024-10-10T10:46:06Z) - ALiiCE: Evaluating Positional Fine-grained Citation Generation [54.19617927314975]
本稿では,微細な引用生成のための最初の自動評価フレームワークであるALiiCEを提案する。
我々のフレームワークはまず、文のクレームを依存性分析によって原子クレームに解析し、次に原子クレームレベルでの引用品質を計算する。
複数大言語モデルの2つの長文QAデータセット上での位置的きめ細かな引用生成性能を評価する。
論文 参考訳(メタデータ) (2024-06-19T09:16:14Z) - CausalCite: A Causal Formulation of Paper Citations [80.82622421055734]
CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - How are journals cited? characterizing journal citations by type of
citation [0.0]
本稿では,引用関数に基づく引用の統計的特徴付けに関する最初の結果を示す。
また,雑誌が受ける支持率と論争の比率を,品質の潜在的指標として特徴づける最初の結果も提示する。
論文 参考訳(メタデータ) (2021-02-22T14:15:50Z) - Virtual Proximity Citation (VCP): A Supervised Deep Learning Method to
Relate Uncited Papers On Grounds of Citation Proximity [0.0]
本稿では,仮想Citation Proximity (VCP) のアプローチについて議論する。
文書中の2つの引用の間の実際の距離は、基礎的な真実として使用される。
これは、2つの文書間の関連性を計算するために、たとえ文書が暗唱されていなくても、近接して引用されたであろう方法で計算することができる。
論文 参考訳(メタデータ) (2020-09-25T12:24:00Z) - Examining Citations of Natural Language Processing Literature [31.87319293259599]
AAの論文の約56%が10回以上引用されている。
CL Journalは最も引用された論文があるが、近年は引用の優位性が低下している。
感情分類、アナフォラ分解能、およびエンティティ認識に関する論文は、最も中央値の引用がある。
論文 参考訳(メタデータ) (2020-05-02T20:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。