論文の概要: Topics, Authors, and Institutions in Large Language Model Research: Trends from 17K arXiv Papers
- arxiv url: http://arxiv.org/abs/2307.10700v4
- Date: Sun, 28 Apr 2024 23:13:16 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-01 01:14:26.080395
- Title: Topics, Authors, and Institutions in Large Language Model Research: Trends from 17K arXiv Papers
- Title(参考訳): 大規模言語モデル研究における話題・著者・機関:17K arXiv論文の動向
- Authors: Rajiv Movva, Sidhika Balachandar, Kenny Peng, Gabriel Agostini, Nikhil Garg, Emma Pierson,
- Abstract要約: 大規模言語モデル(LLM)がAI研究に劇的に影響を与えており、これまで何が変わったのか、どのようにフィールドの未来を形作るかについての議論が引き起こされている。
このような疑問を明らかにするために,我々は,2023年対2018-2022年の動向に着目し,16,979 LLM関連arXiv論文のデータセットを新たに分析した。
2023年に最初の著者の半数が、AIの非NLP分野から参入し、学際的な拡張を推進している。
驚いたことに、業界は2023年の出版シェアを減らした。
- 参考スコア(独自算出の注目度): 1.5362868418787874
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language models (LLMs) are dramatically influencing AI research, spurring discussions on what has changed so far and how to shape the field's future. To clarify such questions, we analyze a new dataset of 16,979 LLM-related arXiv papers, focusing on recent trends in 2023 vs. 2018-2022. First, we study disciplinary shifts: LLM research increasingly considers societal impacts, evidenced by 20x growth in LLM submissions to the Computers and Society sub-arXiv. An influx of new authors -- half of all first authors in 2023 -- are entering from non-NLP fields of CS, driving disciplinary expansion. Second, we study industry and academic publishing trends. Surprisingly, industry accounts for a smaller publication share in 2023, largely due to reduced output from Google and other Big Tech companies; universities in Asia are publishing more. Third, we study institutional collaboration: while industry-academic collaborations are common, they tend to focus on the same topics that industry focuses on rather than bridging differences. The most prolific institutions are all US- or China-based, but there is very little cross-country collaboration. We discuss implications around (1) how to support the influx of new authors, (2) how industry trends may affect academics, and (3) possible effects of (the lack of) collaboration.
- Abstract(参考訳): 大規模言語モデル(LLM)がAI研究に劇的に影響を与えており、これまで何が変わったのか、どのようにフィールドの未来を形作るかについての議論が引き起こされている。
このような疑問を明らかにするために,我々は,2023年対2018-2022年の動向に着目し,16,979 LLM関連arXiv論文のデータセットを新たに分析した。
LLM研究は、コンピュータと社会への20倍のLLMの提出によって証明される社会的な影響をますます考慮している。
2023年に最初の著者の半数が、CSの非NLP分野から参入し、学際的な拡張を推進している。
第2に、業界と学術出版の動向について研究する。
意外なことに、業界は2023年の出版シェアを減らしている。
第三に、私たちは制度的なコラボレーションについて研究している: 産学連携は一般的であるが、彼らは違いを橋渡しするよりも、業界が重視するのと同じトピックに焦点を合わせがちである。
最も多産な機関は米国か中国だが、国間の協力はほとんどない。
本稿では,(1)新著者の流入を支える方法,(2)産業界の動向が学術にどのような影響を及ぼすか,(3)協力の欠如がもたらす影響について論じる。
関連論文リスト
- Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews [51.453135368388686]
本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文 参考訳(メタデータ) (2024-03-11T21:51:39Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - The complementary contributions of academia and industry to AI research [0.0]
過去25年間で、業界と学界が生み出したAIの影響と種類を特徴づける。
業界チームが発行する記事は注目されがちで、高い引用と引用が破壊的になる可能性が高くなる。
学術と産業のコラボレーションは、学術チームのノベルティを再現するのに苦労しており、業界チームと似ている傾向があります。
論文 参考訳(メタデータ) (2024-01-04T03:08:13Z) - Artificial intelligence in social science: A study based on
bibliometrics analysis [0.0]
本稿では,過去10年間(2013-2022年)の社会科学におけるAI関連出版物の文献分析結果について述べる。
2008年から2022年までの85%という19,408件以上の論文が出版されており、この分野の研究は年々著しく増加している。
米国は、最も多く出版する国(20%)であり、次に中国(13%)である。
論文 参考訳(メタデータ) (2023-12-09T15:16:44Z) - Responsible AI Considerations in Text Summarization Research: A Review
of Current Practices [89.85174013619883]
私たちは、責任あるAIコミュニティがほとんど見落としている共通のNLPタスクである、テキスト要約に重点を置いています。
我々は,2020-2022年に出版されたACLアンソロジーから333の要約論文の多段階的質的分析を行った。
私たちは、どの、どの、どの責任あるAI問題がカバーされているか、どの関係するステークホルダーが考慮されているか、そして、述べられた研究目標と実現された研究目標のミスマッチに焦点を合わせます。
論文 参考訳(メタデータ) (2023-11-18T15:35:36Z) - Findings of the WMT 2023 Shared Task on Discourse-Level Literary
Translation: A Fresh Orb in the Cosmos of LLMs [80.05205710881789]
我々は、著作権と文書レベルの中国英語ウェブ小説コーパスをリリースする。
今年は7つのアカデミックチームと業界チームから14の応募を受け取りました。
システムの公式ランキングは、全体的な人間の判断に基づいている。
論文 参考訳(メタデータ) (2023-11-06T14:23:49Z) - Analyzing the Impact of Companies on AI Research Based on Publications [1.450405446885067]
私たちは、過去10年間に出版された学術的および企業公認のAIパブリッシングを比較します。
個々の出版物が受ける引用回数は、会社によって(共著)される場合、著しく高いことが分かりました。
論文 参考訳(メタデータ) (2023-10-31T13:27:04Z) - Artificial intelligence adoption in the physical sciences, natural
sciences, life sciences, social sciences and the arts and humanities: A
bibliometric analysis of research publications from 1960-2021 [73.06361680847708]
1960年には333の研究分野の14%がAIに関連していたが、1972年には全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
1960年には、333の研究分野の14%がAI(コンピュータ科学の多くの分野)に関連していたが、1972年までに全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
我々は、現在の急上昇の状況が異なっており、学際的AI応用が持続する可能性が高いと結論付けている。
論文 参考訳(メタデータ) (2023-06-15T14:08:07Z) - The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.382353702576314]
我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文 参考訳(メタデータ) (2023-05-04T12:57:18Z) - Ethical Considerations and Statistical Analysis of Industry Involvement
in Machine Learning Research [3.4773470589069473]
我々は,過去5年間の主要なMLカンファレンスであるNeurIPS,CVPR,ICMLの全論文を調査した。
私たちの統計的アプローチは、関心の対立、イノベーション、男女平等に焦点を当てています。
論文 参考訳(メタデータ) (2020-06-08T12:51:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。