論文の概要: Forgotten Knowledge: Examining the Citational Amnesia in NLP
- arxiv url: http://arxiv.org/abs/2305.18554v2
- Date: Mon, 31 Jul 2023 17:38:03 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 20:51:39.252435
- Title: Forgotten Knowledge: Examining the Citational Amnesia in NLP
- Title(参考訳): 忘れられた知識:NLPにおける鎮静覚醒の検討
- Authors: Janvijay Singh, Mukund Rungta, Diyi Yang, Saif M. Mohammad
- Abstract要約: 論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
- 参考スコア(独自算出の注目度): 63.13508571014673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Citing papers is the primary method through which modern scientific writing
discusses and builds on past work. Collectively, citing a diverse set of papers
(in time and area of study) is an indicator of how widely the community is
reading. Yet, there is little work looking at broad temporal patterns of
citation. This work systematically and empirically examines: How far back in
time do we tend to go to cite papers? How has that changed over time, and what
factors correlate with this citational attention/amnesia? We chose NLP as our
domain of interest and analyzed approximately 71.5K papers to show and quantify
several key trends in citation. Notably, around 62% of cited papers are from
the immediate five years prior to publication, whereas only about 17% are more
than ten years old. Furthermore, we show that the median age and age diversity
of cited papers were steadily increasing from 1990 to 2014, but since then, the
trend has reversed, and current NLP papers have an all-time low temporal
citation diversity. Finally, we show that unlike the 1990s, the highly cited
papers in the last decade were also papers with the least citation diversity,
likely contributing to the intense (and arguably harmful) recency focus. Code,
data, and a demo are available on the project homepage.
- Abstract(参考訳): 論文の引用は、現代の科学的著作が過去の作品に基づいて論じ、構築する主要な方法である。
集合的に、多種多様な論文(時間と研究領域)を引用することは、コミュニティがいかに広く読んでいるかを示す指標である。
しかし、引用の幅広い時間的パターンを考察する作業はほとんどない。
この作業は体系的かつ経験的に、次のように検証する。 時間の中で、論文を引用する傾向はどれくらいありますか?
それは時間とともにどのように変化し、どの要因がこの引用的注意/記憶と相関するか?
我々は、NLPを我々の関心領域として選び、約71.5Kの論文を分析して、引用におけるいくつかの重要な傾向を示し、定量化した。
特に引用された論文の約62%は出版直前の5年前のものであり、わずか17%が10年以上前のものである。
さらに,1990年から2014年にかけて,引用論文の平均年齢と年齢の多様性は着実に増加傾向にあったが,その後傾向が逆転し,現在のNLP論文は時間的引用の多様性が低かった。
最後に、1990年代とは異なり、過去10年間に引用された論文は、最も引用の多様性が低い論文であり、おそらく強い(そしておそらく有害な)傾向に寄与していることを示している。
コード、データ、デモはプロジェクトのホームページで公開されている。
関連論文リスト
- Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - Is there really a Citation Age Bias in NLP? [25.867690917154885]
自然言語処理(NLP)コミュニティには、引用年齢バイアスがある。
すべてのAIサブフィールドは、励起アムネシアの同様の傾向を持っている。
これをNLPコミュニティの引用年齢バイアスとして診断するのではなく、このパターンはこれらの研究分野のダイナミクスの成果であると考えている。
論文 参考訳(メタデータ) (2024-01-07T17:12:08Z) - CausalCite: A Causal Formulation of Paper Citations [80.82622421055734]
CausalCiteは紙の意義を測定するための新しい方法だ。
これは、従来のマッチングフレームワークを高次元のテキスト埋め込みに適応させる、新しい因果推論手法であるTextMatchに基づいている。
科学専門家が報告した紙衝撃と高い相関性など,各種基準におけるCausalCiteの有効性を実証する。
論文 参考訳(メタデータ) (2023-11-05T23:09:39Z) - NLLG Quarterly arXiv Report 06/23: What are the most influential current
AI Papers? [15.830129136642755]
目的は、最も関連性があり広く議論されている研究のクイックガイドを提供することであり、新参者や確立された研究者が現在の傾向を振り返り続けるのを助けることである。
我々は2023年前半に,大規模言語モデル(LLM),特にChatGPTに関連する論文の優位性を観察した。
NLP関連の論文は、私たちのデータにはML関連の論文の2倍の数の論文があるにもかかわらず、最も影響力がある(トップ論文の約60%)。
論文 参考訳(メタデータ) (2023-07-31T11:53:52Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Utilizing Citation Network Structure to Predict Citation Counts: A Deep
Learning Approach [0.0]
本稿では,情報カスケードの効果を組み合わせ,引用数予測問題に注目するエンド・ツー・エンドのディープラーニングネットワークであるDeepCCPを提案する。
6つの実データ集合の実験によると、DeepCCPは引用数予測の精度において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-06T05:27:50Z) - Examining Citations of Natural Language Processing Literature [31.87319293259599]
AAの論文の約56%が10回以上引用されている。
CL Journalは最も引用された論文があるが、近年は引用の優位性が低下している。
感情分類、アナフォラ分解能、およびエンティティ認識に関する論文は、最も中央値の引用がある。
論文 参考訳(メタデータ) (2020-05-02T20:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。