論文の概要: Is there really a Citation Age Bias in NLP?
- arxiv url: http://arxiv.org/abs/2401.03545v1
- Date: Sun, 7 Jan 2024 17:12:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 18:30:25.029886
- Title: Is there really a Citation Age Bias in NLP?
- Title(参考訳): NLPには本当にCitation Age Biasがありますか?
- Authors: Hoa Nguyen and Steffen Eger
- Abstract要約: 自然言語処理(NLP)コミュニティには、引用年齢バイアスがある。
すべてのAIサブフィールドは、励起アムネシアの同様の傾向を持っている。
これをNLPコミュニティの引用年齢バイアスとして診断するのではなく、このパターンはこれらの研究分野のダイナミクスの成果であると考えている。
- 参考スコア(独自算出の注目度): 25.867690917154885
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Citations are a key ingredient of scientific research to relate a paper to
others published in the community. Recently, it has been noted that there is a
citation age bias in the Natural Language Processing (NLP) community, one of
the currently fastest growing AI subfields, in that the mean age of the
bibliography of NLP papers has become ever younger in the last few years,
leading to `citation amnesia' in which older knowledge is increasingly
forgotten. In this work, we put such claims into perspective by analyzing the
bibliography of $\sim$300k papers across 15 different scientific fields
submitted to the popular preprint server Arxiv in the time period from 2013 to
2022. We find that all AI subfields (in particular: cs.AI, cs.CL, cs.CV, cs.LG)
have similar trends of citation amnesia, in which the age of the bibliography
has roughly halved in the last 10 years (from above 12 in 2013 to below 7 in
2022), on average. Rather than diagnosing this as a citation age bias in the
NLP community, we believe this pattern is an artefact of the dynamics of these
research fields, in which new knowledge is produced in ever shorter time
intervals.
- Abstract(参考訳): 引用は科学研究の重要な要素であり、コミュニティで出版された論文と関連づけられている。
近年,現在急速に成長しているAIサブフィールドの1つである自然言語処理(NLP)コミュニティでは,近年,NLP論文の書誌学の平均年齢がますます若くなり,古い知識が忘れられつつある「引用記憶症」につながることが指摘されている。
そこで本研究では,2013年から2022年までの期間に,人気のあるプレプリントサーバarxivに提出された15の学術分野を対象に,$3kの論文の書誌解析を行った。
すべてのAIサブフィールド(特にcs.AI、cs.CL、cs.CV、cs.LG)は、平均して引用記憶の傾向があり、文献学の年齢は過去10年間でほぼ半減した(2013年の12歳以上から2022年の7歳未満まで)。
これをNLPコミュニティの引用年齢バイアスとして診断するのではなく、このパターンはこれらの研究分野のダイナミクスの成果であり、より短い時間間隔で新たな知識が生み出されると考えている。
関連論文リスト
- NLLG Quarterly arXiv Report 09/24: What are the most influential current AI Papers? [21.68589129842815]
NLLGのarXivレポートは、cs.CL、cs.CV、cs.AI、cs.LGカテゴリにわたる、急速に進化するNLPとAI研究の展望をナビゲートするのに役立つ。
この4回目のインストールは、ChatGPTのデビュー後の2023年1月1日から2024年9月30日まで、AIの歴史の変革期を捉えている。
前回のレポート以来、最も暗黙の論文のトップ40のうち45%が新しい論文である。
論文 参考訳(メタデータ) (2024-12-02T22:10:38Z) - The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Citation Amnesia: On The Recency Bias of NLP and Other Academic Fields [30.550895983110806]
本研究は, 43年間にわたる20分野にわたる研究成果を引用する傾向について検討した(1980-2023)。
我々はこの減少を「引用年齢不況」と呼び、経済学者が経済活動の減少期間を定義する方法に類似している。
以上の結果から,近年の著作の引用は出版率の上昇によるものではないことが示唆された。
論文 参考訳(メタデータ) (2024-02-19T10:59:29Z) - Artificial intelligence adoption in the physical sciences, natural
sciences, life sciences, social sciences and the arts and humanities: A
bibliometric analysis of research publications from 1960-2021 [73.06361680847708]
1960年には333の研究分野の14%がAIに関連していたが、1972年には全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
1960年には、333の研究分野の14%がAI(コンピュータ科学の多くの分野)に関連していたが、1972年までに全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
我々は、現在の急上昇の状況が異なっており、学際的AI応用が持続する可能性が高いと結論付けている。
論文 参考訳(メタデータ) (2023-06-15T14:08:07Z) - Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - Geographic Citation Gaps in NLP Research [63.13508571014673]
この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
論文 参考訳(メタデータ) (2022-10-26T02:25:23Z) - Improving Wikipedia Verifiability with AI [116.69749668874493]
私たちはSideと呼ばれるニューラルネットワークベースのシステムを開発し、彼らの主張を支持できないWikipediaの引用を識別する。
本誌の最初の引用レコメンデーションは、既存のWikipediaの引用よりも60%多い選好を集めている。
以上の結果から,Wikipediaの妥当性を高めるために,AIベースのシステムを人間と共同で活用できることが示唆された。
論文 参考訳(メタデータ) (2022-07-08T15:23:29Z) - Examining Citations of Natural Language Processing Literature [31.87319293259599]
AAの論文の約56%が10回以上引用されている。
CL Journalは最も引用された論文があるが、近年は引用の優位性が低下している。
感情分類、アナフォラ分解能、およびエンティティ認識に関する論文は、最も中央値の引用がある。
論文 参考訳(メタデータ) (2020-05-02T20:01:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。