論文の概要: Geographic Citation Gaps in NLP Research
- arxiv url: http://arxiv.org/abs/2210.14424v1
- Date: Wed, 26 Oct 2022 02:25:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 14:12:54.147339
- Title: Geographic Citation Gaps in NLP Research
- Title(参考訳): nlp研究における地理的引用ギャップ
- Authors: Mukund Rungta, Janvijay Singh, Saif M. Mohammad and Diyi Yang
- Abstract要約: この研究は、地理的な位置と出版の成功との関係について一連の疑問を呈する。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続することを示す。
- 参考スコア(独自算出の注目度): 63.13508571014673
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In a fair world, people have equitable opportunities to education, to conduct
scientific research, to publish, and to get credit for their work, regardless
of where they live. However, it is common knowledge among researchers that a
vast number of papers accepted at top NLP venues come from a handful of western
countries and (lately) China; whereas, very few papers from Africa and South
America get published. Similar disparities are also believed to exist for paper
citation counts. In the spirit of "what we do not measure, we cannot improve",
this work asks a series of questions on the relationship between geographical
location and publication success (acceptance in top NLP venues and citation
impact). We first created a dataset of 70,000 papers from the ACL Anthology,
extracted their meta-information, and generated their citation network. We then
show that not only are there substantial geographical disparities in paper
acceptance and citation but also that these disparities persist even when
controlling for a number of variables such as venue of publication and
sub-field of NLP. Further, despite some steps taken by the NLP community to
improve geographical diversity, we show that the disparity in publication
metrics across locations is still on an increasing trend since the early 2000s.
We release our code and dataset here:
https://github.com/iamjanvijay/acl-cite-net
- Abstract(参考訳): 公平な世界では、人々は教育、科学研究の実施、出版、自分の仕事に対する信用を得るための公平な機会を持っている。
しかし研究者の間では、トップnlpの会場で受け入れられる膨大な数の論文が、少数の西側諸国や中国(最後は中国)からのものであるのに対して、アフリカや南米からの論文はごくわずかである。
論文引用数にも同様の相違があると考えられている。
測ることができないもの、改善できないもの」という精神の中で、この研究は地理的な位置と出版の成功(トップのNLP会場での受け入れと引用の影響)との関係について一連の質問をする。
われわれはまず,ACLアンソロジーから7万件の論文のデータセットを作成し,そのメタ情報を抽出し,引用ネットワークを生成した。
次に,論文の受理や引用において地理的に大きな差異があるだけでなく,出版場所やNLPのサブフィールドなどの変数を制御しても,これらの格差は持続していることを示す。
さらに,NLPコミュニティの地理的多様性向上に向けた取組にも拘わらず,2000年代初め以降,地域ごとの出版指標の格差が増加傾向にあることを示す。
コードとデータセットはここでリリースします。 https://github.com/iamjanvijay/acl-cite-net
関連論文リスト
- Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - Is there really a Citation Age Bias in NLP? [25.867690917154885]
自然言語処理(NLP)コミュニティには、引用年齢バイアスがある。
すべてのAIサブフィールドは、励起アムネシアの同様の傾向を持っている。
これをNLPコミュニティの引用年齢バイアスとして診断するのではなく、このパターンはこれらの研究分野のダイナミクスの成果であると考えている。
論文 参考訳(メタデータ) (2024-01-07T17:12:08Z) - We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.550895983110806]
自然言語処理の分野横断は減少している。
NLPの引用の8%以下は言語学に関するものである。
NLPの引用の3%以下は数学と心理学に関するものである。
論文 参考訳(メタデータ) (2023-10-23T12:42:06Z) - Forgotten Knowledge: Examining the Citational Amnesia in NLP [63.13508571014673]
論文を引用するのにどれくらいの時間がかかったのか、どのようにして変化したのか、そしてこの引用的注意/記憶に相関する要因は何か。
引用論文の約62%が出版直前の5年間のものであり,約17%が10年以上前のものであることを示す。
1990年から2014年にかけて、引用論文の中央値と年齢の多様性は着実に増加してきたが、その後傾向が逆転し、現在のNLP論文は、時間的引用の多様性が極端に低い。
論文 参考訳(メタデータ) (2023-05-29T18:30:34Z) - Square One Bias in NLP: Towards a Multi-Dimensional Exploration of the
Research Manifold [88.83876819883653]
我々は、最近のNLP研究論文のマニュアル分類を通して、これが事実であることを示す。
NLP研究は正方形ではなく、精度だけでなく、公平性や解釈可能性にも焦点をあてる。
論文 参考訳(メタデータ) (2022-06-20T13:04:23Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Examining Citations of Natural Language Processing Literature [31.87319293259599]
AAの論文の約56%が10回以上引用されている。
CL Journalは最も引用された論文があるが、近年は引用の優位性が低下している。
感情分類、アナフォラ分解能、およびエンティティ認識に関する論文は、最も中央値の引用がある。
論文 参考訳(メタデータ) (2020-05-02T20:01:59Z) - The Demise of Single-Authored Publications in Computer Science: A
Citation Network Analysis [0.0]
私は1940年から2019年までのコンピュータサイエンス文学における単行本の役割を研究するためにDBLPデータベースを分析した。
著者の人口比率、引用統計、一冊の出版物のスコアを計算して、人口統計と受容率について検討する。
論文 参考訳(メタデータ) (2020-01-02T07:47:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。