論文の概要: Large language models shape and are shaped by society: A survey of arXiv
publication patterns
- arxiv url: http://arxiv.org/abs/2307.10700v1
- Date: Thu, 20 Jul 2023 08:45:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-21 14:01:54.546541
- Title: Large language models shape and are shaped by society: A survey of arXiv
publication patterns
- Title(参考訳): 社会が形成・形成する大規模言語モデル:arXiv出版パターンの調査
- Authors: Rajiv Movva, Sidhika Balachandar, Kenny Peng, Gabriel Agostini, Nikhil
Garg, Emma Pierson
- Abstract要約: 近年,大規模言語モデル (LLM) 論文の数が急増している。
ここでは、CSとStat arXivsに投稿された388万件の論文を分析し、2023年と2018-2022年の出版パターンの変化に注目した。
- 参考スコア(独自算出の注目度): 3.2278821777253905
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: There has been a steep recent increase in the number of large language model
(LLM) papers, producing a dramatic shift in the scientific landscape which
remains largely undocumented through bibliometric analysis. Here, we analyze
388K papers posted on the CS and Stat arXivs, focusing on changes in
publication patterns in 2023 vs. 2018-2022. We analyze how the proportion of
LLM papers is increasing; the LLM-related topics receiving the most attention;
the authors writing LLM papers; how authors' research topics correlate with
their backgrounds; the factors distinguishing highly cited LLM papers; and the
patterns of international collaboration. We show that LLM research increasingly
focuses on societal impacts: there has been an 18x increase in the proportion
of LLM-related papers on the Computers and Society sub-arXiv, and authors newly
publishing on LLMs are more likely to focus on applications and societal
impacts than more experienced authors. LLM research is also shaped by social
dynamics: we document gender and academic/industry disparities in the topics
LLM authors focus on, and a US/China schism in the collaboration network.
Overall, our analysis documents the profound ways in which LLM research both
shapes and is shaped by society, attesting to the necessity of sociotechnical
lenses.
- Abstract(参考訳): 近年、大規模言語モデル(llm)の論文数が急増し、書誌分析によってほとんど文書化されていない科学的景観に劇的な変化をもたらした。
ここでは、CSとStat arXivsに投稿された388Kの論文を分析し、2023年と2018-2022年の出版パターンの変化に注目した。
本稿は, LLM論文の割合の増大, LLM論文の執筆者, LLM論文の執筆者, LLM論文の背景と著者研究の関連, 高度に引用された LLM 論文を区別する要因, 国際協力のパターンについて分析する。
LLM研究は、コンピュータと社会に関する論文の割合が18倍に増加しており、新たに出版されている著者は、より経験豊富な著者よりも、アプリケーションや社会への影響に重点を置いている可能性が高い。
LLM研究は、LLM著者がフォーカスするトピックにおけるジェンダーと学術的/産業的格差、そしてコラボレーションネットワークにおける米国と中国の分裂を文書化する。
概して、我々の分析は、llmが社会によって形と形の両方を研究する深い方法を文書化しており、社会学的レンズの必要性を証明している。
関連論文リスト
- Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - Monitoring AI-Modified Content at Scale: A Case Study on the Impact of ChatGPT on AI Conference Peer Reviews [51.453135368388686]
本稿では,大規模言語モデル (LLM) によって実質的に修正あるいは生成される可能性のある大規模コーパスにおけるテキストの分数推定手法を提案する。
我々の最大可能性モデルは、専門家による参照テキストとAIによる参照テキストを利用して、コーパスレベルでの実世界のLLM使用を正確かつ効率的に検証する。
論文 参考訳(メタデータ) (2024-03-11T21:51:39Z) - Position: AI/ML Influencers Have a Place in the Academic Process [82.2069685579588]
機械学習研究の可視性向上におけるソーシャルメディアインフルエンサーの役割について検討する。
2018年12月から2023年10月までの間に、8000以上の論文の包括的なデータセットを収集しました。
我々の統計的および因果推論分析は、これらのインフルエンサーが支持する論文の引用が著しく増加することを示している。
論文 参考訳(メタデータ) (2024-01-24T20:05:49Z) - The complementary contributions of academia and industry to AI research [0.0]
過去25年間で、業界と学界が生み出したAIの影響と種類を特徴づける。
業界チームが発行する記事は注目されがちで、高い引用と引用が破壊的になる可能性が高くなる。
学術と産業のコラボレーションは、学術チームのノベルティを再現するのに苦労しており、業界チームと似ている傾向があります。
論文 参考訳(メタデータ) (2024-01-04T03:08:13Z) - Artificial intelligence in social science: A study based on
bibliometrics analysis [0.0]
本稿では,過去10年間(2013-2022年)の社会科学におけるAI関連出版物の文献分析結果について述べる。
2008年から2022年までの85%という19,408件以上の論文が出版されており、この分野の研究は年々著しく増加している。
米国は、最も多く出版する国(20%)であり、次に中国(13%)である。
論文 参考訳(メタデータ) (2023-12-09T15:16:44Z) - Responsible AI Considerations in Text Summarization Research: A Review
of Current Practices [89.85174013619883]
私たちは、責任あるAIコミュニティがほとんど見落としている共通のNLPタスクである、テキスト要約に重点を置いています。
我々は,2020-2022年に出版されたACLアンソロジーから333の要約論文の多段階的質的分析を行った。
私たちは、どの、どの、どの責任あるAI問題がカバーされているか、どの関係するステークホルダーが考慮されているか、そして、述べられた研究目標と実現された研究目標のミスマッチに焦点を合わせます。
論文 参考訳(メタデータ) (2023-11-18T15:35:36Z) - Findings of the WMT 2023 Shared Task on Discourse-Level Literary
Translation: A Fresh Orb in the Cosmos of LLMs [80.05205710881789]
我々は、著作権と文書レベルの中国英語ウェブ小説コーパスをリリースする。
今年は7つのアカデミックチームと業界チームから14の応募を受け取りました。
システムの公式ランキングは、全体的な人間の判断に基づいている。
論文 参考訳(メタデータ) (2023-11-06T14:23:49Z) - Analyzing the Impact of Companies on AI Research Based on Publications [1.450405446885067]
私たちは、過去10年間に出版された学術的および企業公認のAIパブリッシングを比較します。
個々の出版物が受ける引用回数は、会社によって(共著)される場合、著しく高いことが分かりました。
論文 参考訳(メタデータ) (2023-10-31T13:27:04Z) - Artificial intelligence adoption in the physical sciences, natural
sciences, life sciences, social sciences and the arts and humanities: A
bibliometric analysis of research publications from 1960-2021 [73.06361680847708]
1960年には333の研究分野の14%がAIに関連していたが、1972年には全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
1960年には、333の研究分野の14%がAI(コンピュータ科学の多くの分野)に関連していたが、1972年までに全研究分野の半分以上、1986年には80%以上、現在では98%以上まで増加した。
我々は、現在の急上昇の状況が異なっており、学際的AI応用が持続する可能性が高いと結論付けている。
論文 参考訳(メタデータ) (2023-06-15T14:08:07Z) - The Elephant in the Room: Analyzing the Presence of Big Tech in Natural Language Processing Research [28.382353702576314]
我々は、78,187のNLP出版物と701のNLP出版物の包括的なメタデータを持つコーパスを使用する。
NLP作家の業界における存在感は、過去5年間で急激な増加を前に着実に推移している。
いくつかの企業は出版物の大半を占め、助成金やインターンシップを通じて学術研究者に資金を提供している。
論文 参考訳(メタデータ) (2023-05-04T12:57:18Z) - Ethical Considerations and Statistical Analysis of Industry Involvement
in Machine Learning Research [3.4773470589069473]
我々は,過去5年間の主要なMLカンファレンスであるNeurIPS,CVPR,ICMLの全論文を調査した。
私たちの統計的アプローチは、関心の対立、イノベーション、男女平等に焦点を当てています。
論文 参考訳(メタデータ) (2020-06-08T12:51:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。