論文の概要: Topics, Authors, and Networks in Large Language Model Research: Trends
from a Survey of 17K arXiv Papers
- arxiv url: http://arxiv.org/abs/2307.10700v2
- Date: Mon, 23 Oct 2023 17:04:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-25 08:09:54.592461
- Title: Topics, Authors, and Networks in Large Language Model Research: Trends
from a Survey of 17K arXiv Papers
- Title(参考訳): 大規模言語モデル研究におけるトピックス,著者,ネットワーク:17K arXiv論文の動向
- Authors: Rajiv Movva, Sidhika Balachandar, Kenny Peng, Gabriel Agostini, Nikhil
Garg, Emma Pierson
- Abstract要約: 我々は16,979大言語モデル(LLM)関連arXiv論文の新しいデータセットを収集し,注釈し,分析する。
コンピュータとソサエティは2023年にLSM関連の論文の割合で20倍の成長を遂げた。
著者が優先するトピックには性別と学術的・産業的な違いがあり、コラボレーションネットワークでは米国と中国の分裂が激化している。
- 参考スコア(独自算出の注目度): 1.6133250526830356
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language model (LLM) research is dramatically impacting society, making
it essential to understand the topics and values it prioritizes, the authors
and institutions driving it, and its networks of collaboration. Due to the
recent growth of the field, many of these fundamental attributes lack
systematic description. We gather, annotate, and analyze a new dataset of
16,979 LLM-related arXiv papers, focusing on changes in 2023 vs. 2018-2022. We
show that LLM research increasingly focuses on societal impacts: the Computers
and Society sub-arXiv has seen 20x growth in its proportion of LLM-related
papers in 2023. This change is driven in part by an influx of new authors: a
majority of 2023 papers are first-authored by researchers who have not
previously written an LLM-related paper, and these papers focus particularly on
applications and societal considerations. While a handful of companies hold
outsize influence, academia publishes a much larger fraction of papers than
industry overall, and this gap widens in 2023. LLM research is also being
shaped by social dynamics: there are gender and academic/industry differences
in the topics authors prioritize, and a stark U.S./China schism in the
collaboration network. Overall, our analysis documents how LLM research both
shapes and is shaped by society, attesting to the necessity of sociotechnical
lenses; we discuss implications for researchers and policymakers.
- Abstract(参考訳): 大規模言語モデル(llm)の研究は社会に劇的に影響を与えており、その優先するトピックや価値、それを推進する著者や機関、コラボレーションのネットワークを理解することが不可欠である。
この分野の最近の成長により、これらの基本的な特性の多くは体系的な記述を欠いている。
我々は2023年と2018-2022年の変化に注目し,16,979 llm関連arxiv論文のデータセットを収集,注釈,分析した。
LLM研究は、社会への影響にますます焦点が当てられている。2023年には、コンピュータと社会のサブarXivは、LSM関連の論文の割合で20倍に成長している。
2023年の論文の大半は、これまでLSM関連の論文を書いていない研究者によって最初に書かれたものであり、これらの論文は特に応用と社会的考察に焦点を当てている。
少数の企業が大きな影響力を持つ一方で、アカデミアは業界全体よりもはるかに大きな論文を出版しており、このギャップは2023年に拡大している。
LLMの研究は社会的ダイナミクスによっても形作られており、著者が優先するトピックには性別と学術的・産業的な違いがあり、コラボレーションネットワークでは米国と中国の分裂が激化している。
概して,LLM研究は社会が形成・形成し,社会技術レンズの必要性を証明し,研究者や政策立案者への影響を論じる。
関連論文リスト
- Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews [51.453135368388686]
本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文 参考訳(メタデータ) (2024-03-11T21:51:39Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - The complementary contributions of academia and industry to AI research [0.0]
過去25年間で、業界と学界が生み出したAIの影響と種類を特徴づける。
業界チームが発行する記事は注目されがちで、高い引用と引用が破壊的になる可能性が高くなる。
学術と産業のコラボレーションは、学術チームのノベルティを再現するのに苦労しており、業界チームと似ている傾向があります。
論文 参考訳(メタデータ) (2024-01-04T03:08:13Z) - Artificial intelligence in social science: A study based on
bibliometrics analysis [0.0]
本稿では,過去10年間(2013-2022年)の社会科学におけるAI関連出版物の文献分析結果について述べる。
2008年から2022年までの85%という19,408件以上の論文が出版されており、この分野の研究は年々著しく増加している。
米国は、最も多く出版する国(20%)であり、次に中国(13%)である。
論文 参考訳(メタデータ) (2023-12-09T15:16:44Z) - Responsible AI Considerations in Text Summarization Research: A Review
of Current Practices [89.85174013619883]
私たちは、責任あるAIコミュニティがほとんど見落としている共通のNLPタスクである、テキスト要約に重点を置いています。
我々は,2020-2022年に出版されたACLアンソロジーから333の要約論文の多段階的質的分析を行った。
私たちは、どの、どの、どの責任あるAI問題がカバーされているか、どの関係するステークホルダーが考慮されているか、そして、述べられた研究目標と実現された研究目標のミスマッチに焦点を合わせます。
論文 参考訳(メタデータ) (2023-11-18T15:35:36Z) - Findings of the WMT 2023 Shared Task on Discourse-Level Literary
Translation: A Fresh Orb in the Cosmos of LLMs [80.05205710881789]
我々は、著作権と文書レベルの中国英語ウェブ小説コーパスをリリースする。
今年は7つのアカデミックチームと業界チームから14の応募を受け取りました。
システムの公式ランキングは、全体的な人間の判断に基づいている。
論文 参考訳(メタデータ) (2023-11-06T14:23:49Z) - Analyzing the Impact of Companies on AI Research Based on Publications [1.450405446885067]
私たちは、過去10年間に出版された学術的および企業公認のAIパブリッシングを比較します。
個々の出版物が受ける引用回数は、会社によって(共著)される場合、著しく高いことが分かりました。
論文 参考訳(メタデータ) (2023-10-31T13:27:04Z) - Artificial intelligence adoption in the physical sciences, natural
sciences, life sciences, social sciences and the arts and humanities: A
bibliometric analysis of research publications from 1960-2021 [73.06361680847708]
1960年には333の研究分野の14%がAIに関連していたが、1972年には全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
1960年には、333の研究分野の14%がAI(コンピュータ科学の多くの分野)に関連していたが、1972年までに全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
我々は、現在の急上昇の状況が異なっており、学際的AI応用が持続する可能性が高いと結論付けている。
論文 参考訳(メタデータ) (2023-06-15T14:08:07Z) - The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.382353702576314]
我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文 参考訳(メタデータ) (2023-05-04T12:57:18Z) - Ethical Considerations and Statistical Analysis of Industry Involvement
in Machine Learning Research [3.4773470589069473]
我々は,過去5年間の主要なMLカンファレンスであるNeurIPS,CVPR,ICMLの全論文を調査した。
私たちの統計的アプローチは、関心の対立、イノベーション、男女平等に焦点を当てています。
論文 参考訳(メタデータ) (2020-06-08T12:51:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。