論文の概要: Structural shifts in institutional participation and collaboration within the AI arXiv preprint research ecosystem
- arxiv url: http://arxiv.org/abs/2602.03969v1
- Date: Tue, 03 Feb 2026 19:35:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-05 19:45:11.250296
- Title: Structural shifts in institutional participation and collaboration within the AI arXiv preprint research ecosystem
- Title(参考訳): AI arXivプレプリント研究エコシステムにおける機関参加とコラボレーションの構造変化
- Authors: Shama Magnur, Mayank Kejriwal,
- Abstract要約: 本稿では,2021年から2025年までのarXivプレプリント(cs.AI)のデータセットを用いて,AI研究環境の構造変化について検討する。
以上の結果から,ChatGPT導入以降の出版出力は前例のない増加傾向を示した。
しかし、ランダム混合ベースラインよりもかなり低い正規化コラボレーション指標(NCI)によって測定されるように、学術・産業連携は依然として抑制されている。
- 参考スコア(独自算出の注目度): 2.5782420501870296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The emergence of large language models (LLMs) represents a significant technological shift within the scientific ecosystem, particularly within the field of artificial intelligence (AI). This paper examines structural changes in the AI research landscape using a dataset of arXiv preprints (cs.AI) from 2021 through 2025. Given the rapid pace of AI development, the preprint ecosystem has become a critical barometer for real-time scientific shifts, often preceding formal peer-reviewed publication by months or years. By employing a multi-stage data collection and enrichment pipeline in conjunction with LLM-based institution classification, we analyze the evolution of publication volumes, author team sizes, and academic--industry collaboration patterns. Our results reveal an unprecedented surge in publication output following the introduction of ChatGPT, with academic institutions continuing to provide the largest volume of research. However, we observe that academic--industry collaboration is still suppressed, as measured by a Normalized Collaboration Index (NCI) that remains significantly below the random-mixing baseline across all major subfields. These findings highlight a continuing institutional divide and suggest that the capital-intensive nature of generative AI research may be reshaping the boundaries of scientific collaboration.
- Abstract(参考訳): 大規模言語モデル(LLM)の出現は、特に人工知能(AI)分野における科学エコシステムにおける重要な技術的な変化を表している。
本稿では,2021年から2025年までのarXivプレプリント(cs.AI)のデータセットを用いて,AI研究環境の構造変化について検討する。
AI開発が急速に進んでいることを踏まえると、プレプリントのエコシステムはリアルタイムな科学的シフトにとって重要なバロメーターになっている。
LLMに基づく機関分類と合わせて多段階のデータ収集・濃縮パイプラインを導入し、出版量、著作者チーム規模、学術・産業連携パターンの進化を分析した結果、ChatGPTの導入以降、学術機関が最大の研究量を提供し続ける中で、出版出力が前例のない急激な増加を見せていることが明らかとなった。しかし、すべての主要分野にわたるランダム混合ベースラインよりかなり低いまま、学術・産業連携は依然として抑制されていることを観察する。
これらの発見は、継続的な制度的な分割を浮き彫りにして、生成的AI研究の資本集約的な性質が、科学的コラボレーションの境界を再構築しているかもしれないことを示唆している。
関連論文リスト
- Does GenAI Rewrite How We Write? An Empirical Study on Two-Million Preprints [15.070885964897734]
生成型大規模言語モデル(LLM)は、原稿の書き方を変えることによって、さらなる破壊をもたらす可能性がある。
本稿は、2016年から2025年(115ヶ月)にかけての2100万件以上のプレプリントを4つの主要なリポジトリで大規模に分析することで、このギャップを解消する。
以上の結果から,LSMは提出サイクルと修正サイクルを加速し,言語的複雑性が緩やかに増加し,AI関連トピックが不均等に拡大したことが明らかとなった。
論文 参考訳(メタデータ) (2025-10-18T01:37:40Z) - The Role of Computing Resources in Publishing Foundation Model Research [84.20094600030092]
我々はこれらの資源と基礎モデル(FM)の科学的発展との関係を評価する。
我々は2022年から2024年にかけて発行された6517のFM論文をレビューし、計算資源が科学出力に与える影響について229人の第一著者を調査した。
計算量の増加は国家予算配分や引用と相関していることがわかったが,研究環境との強い相関はみられない。
論文 参考訳(メタデータ) (2025-10-15T14:50:45Z) - A Survey of Scientific Large Language Models: From Data Foundations to Agent Frontiers [251.23085679210206]
科学大規模言語モデル(Sci-LLMs)は、科学研究において、知識の表現、統合、適用の方法を変えつつある。
この調査は、モデルとその基盤となるデータ基板の共進化として、Sci-LLMの開発を再考する。
我々は、科学的データの統一された分類法と、科学的知識の階層的なモデルを定式化する。
論文 参考訳(メタデータ) (2025-08-28T18:30:52Z) - ResearchAgent: Iterative Research Idea Generation over Scientific Literature with Large Language Models [56.08917291606421]
ResearchAgentは、新しい作品のアイデアと運用のためのAIベースのシステムである。
ResearchAgentは、新しい問題を自動で定義し、手法と設計実験を提案し、繰り返し修正する。
我々は、複数の分野にわたる科学論文に関するResearchAgentを実験的に検証した。
論文 参考訳(メタデータ) (2024-04-11T13:36:29Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Analyzing the Impact of Companies on AI Research Based on Publications [1.450405446885067]
私たちは、過去10年間に出版された学術的および企業公認のAIパブリッシングを比較します。
個々の出版物が受ける引用回数は、会社によって(共著)される場合、著しく高いことが分かりました。
論文 参考訳(メタデータ) (2023-10-31T13:27:04Z) - A Comprehensive Study of Groundbreaking Machine Learning Research:
Analyzing highly cited and impactful publications across six decades [1.6442870218029522]
機械学習(ML)は、コンピュータ科学やその他の関連分野の研究分野として注目されている。
重要なトレンド、影響力のある著者、そしてこれまでの重要な貢献を識別するために、高度に引用された出版物の風景を理解することが不可欠である。
論文 参考訳(メタデータ) (2023-08-01T21:43:22Z) - Characterising Research Areas in the field of AI [68.8204255655161]
トピックの共起ネットワーク上でクラスタリング分析を行うことで,主要な概念テーマを特定した。
その結果は、ディープラーニングや機械学習、物のインターネットといった研究テーマに対する学術的関心の高まりを浮き彫りにしている。
論文 参考訳(メタデータ) (2022-05-26T16:30:30Z) - Studying the characteristics of scientific communities using
individual-level bibliometrics: the case of Big Data research [2.208242292882514]
我々は,ビッグデータ研究に携わる作家コミュニティの学齢,生産,研究の焦点について検討する。
以上の結果から,「ビッグデータ」の学術領域は,著者のコミュニティが拡大する中で,近年の話題となっている。
論文 参考訳(メタデータ) (2021-06-10T08:17:09Z) - Scientometric engineering: Exploring citation dynamics via arXiv eprints [0.0]
本稿では,arXiv上の150万以上の電子プリントの引用データについて検討する。
典型的成長パターンと可溶化パターンは, 分野によって異なることが判明した。
我々は, 励起成長と可溶化の観測量的, 時間的特性に整合したモデルを導出した。
論文 参考訳(メタデータ) (2021-06-09T12:38:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。