論文の概要: The Elephant in the Room: Analyzing the Presence of Big Tech in Natural
Language Processing Research
- arxiv url: http://arxiv.org/abs/2305.02797v2
- Date: Tue, 9 May 2023 10:39:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 15:09:39.051540
- Title: The Elephant in the Room: Analyzing the Presence of Big Tech in Natural
Language Processing Research
- Title(参考訳): 室内のエレファント:自然言語処理研究におけるビッグデータの存在分析
- Authors: Mohamed Abdalla and Jan Philip Wahle and Terry Ruas and Aur\'elie
N\'ev\'eol and Fanny Ducel and Saif M. Mohammad and Kar\"en Fort
- Abstract要約: 我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
- 参考スコア(独自算出の注目度): 22.002411461970574
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Recent advances in deep learning methods for natural language processing
(NLP) have created new business opportunities and made NLP research critical
for industry development. As one of the big players in the field of NLP,
together with governments and universities, it is important to track the
influence of industry on research. In this study, we seek to quantify and
characterize industry presence in the NLP community over time. Using a corpus
with comprehensive metadata of 78,187 NLP publications and 701 resumes of NLP
publication authors, we explore the industry presence in the field since the
early 90s. We find that industry presence among NLP authors has been steady
before a steep increase over the past five years (180% growth from 2017 to
2022). A few companies account for most of the publications and provide funding
to academic researchers through grants and internships. Our study shows that
the presence and impact of the industry on natural language processing research
are significant and fast-growing. This work calls for increased transparency of
industry influence in the field.
- Abstract(参考訳): 自然言語処理(NLP)の深層学習手法の最近の進歩は、新たなビジネス機会を生み出し、NLP研究を産業発展に欠かせないものにしている。
NLPの分野では、政府や大学とともに大きなプレーヤーの1つとして、産業が研究に与える影響を追跡することが重要である。
本研究では,NLPコミュニティにおける産業の存在を時間とともに定量化し,特徴付けることを目的とする。
78,187冊のNLP出版物と701冊のNLP出版物の包括的なメタデータを持つコーパスを用いて,90年代初め以降の分野における業界の存在を探求する。
NLP作家の業界の存在は、過去5年間で急激な増加(2017年から2022年までの180%)を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
本研究は,自然言語処理研究における産業の存在と影響が重要かつ急速に成長していることを示している。
この研究は、この分野における産業の影響の透明性を高めることを求めている。
関連論文リスト
- The Nature of NLP: Analyzing Contributions in NLP Papers [77.31665252336157]
我々は,NLP研究を構成するものについて,研究論文から定量的に検討する。
以上の結果から,NLPにおける機械学習の関与は,90年代前半から増加傾向にあることが明らかとなった。
2020年以降、言語と人々への関心が復活した。
論文 参考訳(メタデータ) (2024-09-29T01:29:28Z) - What Can Natural Language Processing Do for Peer Review? [173.8912784451817]
現代の科学ではピアレビューが広く使われているが、それは難しく、時間がかかり、エラーを起こしやすい。
ピアレビューに関わるアーティファクトは大部分がテキストベースであるため、自然言語処理はレビューを改善する大きな可能性を秘めている。
筆者らは、原稿提出からカメラ対応リビジョンまでの各工程について詳述し、NLP支援の課題と機会について論じる。
論文 参考訳(メタデータ) (2024-05-10T16:06:43Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Collaboration or Corporate Capture? Quantifying NLP's Reliance on Industry Artifacts and Contributions [2.6746207141044582]
EMNLP 2022で発表された100の論文を調査し,研究者が業界モデルにどの程度依存しているかを調査した。
私たちの研究は、将来の研究者が、代替手段がなければ、業界とのコラボレーションがまだコラボレーションであるかどうかをより正確に解決するための足場として役立ちます。
論文 参考訳(メタデータ) (2023-12-06T21:12:22Z) - Defining a New NLP Playground [85.41973504055588]
最近の大規模言語モデルの性能の爆発により、自然言語処理の分野は80年の歴史の中で他のどの変化よりも突然かつ地震的に変化した。
本稿では、理論解析、新しい課題、学習パラダイム、学際的応用など、20以上の博士論文にふさわしい研究方向性を提案する。
論文 参考訳(メタデータ) (2023-10-31T17:02:33Z) - We are Who We Cite: Bridges of Influence Between Natural Language Processing and Other Academic Fields [30.550895983110806]
自然言語処理の分野横断は減少している。
NLPの引用の8%以下は言語学に関するものである。
NLPの引用の3%以下は数学と心理学に関するものである。
論文 参考訳(メタデータ) (2023-10-23T12:42:06Z) - Natural Language Processing in the Legal Domain [3.0223880754806505]
我々は過去10年間に発行された600以上のNLP & Law関連論文のほぼ完全なコーパスを構築し分析した。
この適用状況において研究者が展開する手法の高度化を観察する。
これらの傾向は、この分野の将来によく影響すると考えているが、学術分野と商業分野の双方ではまだ多くの疑問が残っている。
論文 参考訳(メタデータ) (2023-02-23T14:02:47Z) - A Major Obstacle for NLP Research: Let's Talk about Time Allocation! [25.820755718678786]
本稿は、自然言語処理の分野では、私たちよりも成功しなかったことを論じる。
近年,NLP研究において,時間割当が大きな障害となっていることが実証された。
論文 参考訳(メタデータ) (2022-11-30T10:00:12Z) - Systematic Inequalities in Language Technology Performance across the
World's Languages [94.65681336393425]
本稿では,言語技術のグローバルな有用性を評価するためのフレームワークを紹介する。
本分析では, ユーザ対応技術と言語的NLPタスクの両面において, より深く研究されている。
論文 参考訳(メタデータ) (2021-10-13T14:03:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。