論文の概要: The ATOM Report: Measuring the Open Language Model Ecosystem
- arxiv url: http://arxiv.org/abs/2604.07190v1
- Date: Wed, 08 Apr 2026 15:15:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.604038
- Title: The ATOM Report: Measuring the Open Language Model Ecosystem
- Title(参考訳): ATOMレポート:オープン言語モデルエコシステムの測定
- Authors: Nathan Lambert, Florian Brand,
- Abstract要約: 我々は、AlibabaのQwen、DeepSeek、MetaのLlamaといった1.5Kのメインラインオープンモデルに焦点を当てています。
われわれは2025年夏、中国製のモデルが米国内で製造されたモデルに匹敵する明確な傾向を報告している。
- 参考スコア(独自算出の注目度): 2.7247024097773203
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a comprehensive adoption snapshot of the leading open language models and who is building them, focusing on the ~1.5K mainline open models from the likes of Alibaba's Qwen, DeepSeek, Meta's Llama, that are the foundation of an ecosystem crucial to researchers, entrepreneurs, and policy advisors. We document a clear trend where Chinese models overtook their counterparts built in the U.S. in the summer of 2025 and subsequently widened the gap over their western counterparts. We study a mix of Hugging Face downloads and model derivatives, inference market share, performance metrics and more to make a comprehensive picture of the ecosystem.
- Abstract(参考訳): アリババのQwen、DeepSeek、MetaのLlamaといった、研究者、起業家、ポリシーアドバイザーにとって重要なエコシステムの基盤である、1.5Kのメインラインのオープンモデルに焦点を当てた、主要なオープン言語モデルの包括的な採用スナップショットを紹介します。
われわれは2025年夏、中国製のモデルが米国内で製造された車種を圧倒し、その後西側の車種とのギャップを広げたという明確な傾向を報告した。
我々はHugging Faceのダウンロードとモデルデリバティブ、推論市場シェア、パフォーマンス指標などを組み合わせて、エコシステムを包括的に分析する。
関連論文リスト
- Economies of Open Intelligence: Tracing Power & Participation in the Model Ecosystem [21.595922367237815]
Hugging Face Model Hubは、オープンウェイトAIモデルを共有するための主要なグローバルプラットフォームである。
私たちの分析は851,000モデル、1モデルあたり200以上の集約属性、2.2Bダウンロードに及びます。
論文 参考訳(メタデータ) (2025-11-27T12:50:25Z) - Challenges and Applications of Large Language Models: A Comparison of GPT and DeepSeek family of models [1.2952310333454082]
大規模言語モデル(LLM)は産業全体でAIを変革しているが、その開発と展開は依然として複雑である。
この調査は、LLMの構築と利用における16の課題を概観する。
OpenAIのクローズドソースGPT-4oと,大規模なオープンソースMixture-of-ExpertsモデルであるDeepSeek-V3-0324を比較した。
論文 参考訳(メタデータ) (2025-08-29T07:41:04Z) - DeepSeek: Paradigm Shifts and Technical Evolution in Large AI Models [73.99173041896884]
DeepSeekはV3およびR1シリーズモデルをリリースした。低コスト、高性能、オープンソースというメリットから、世界中の注目を集めている。
本稿では,MLA(Multi-head Latent Attention),Mixture-of-Experts(MoE),Multi-Token Prediction(MTP),GRPO(Group Relative Policy Optimization)など,DeepSeekが導入した新しいアルゴリズムを紹介する。
論文 参考訳(メタデータ) (2025-07-14T06:10:30Z) - Brief analysis of DeepSeek R1 and its implications for Generative AI [0.0]
DeepSeekは新しい推論モデル(DeepSeek R1)を2025年1月にリリースした。
本報告では、生成AI分野におけるモデルと、そのリリースの意味について論じる。
論文 参考訳(メタデータ) (2025-02-04T17:45:32Z) - Exploring Model Kinship for Merging Large Language Models [73.98345036483299]
我々は, モデル進化を反復的融合を通じて研究し, 生物進化の類似性について考察した。
モデル親和性はマージによって達成された性能改善と密接に関連していることを示す。
本稿では,新しいモデル統合戦略を提案する。
論文 参考訳(メタデータ) (2024-10-16T14:29:29Z) - YAYI 2: Multilingual Open-Source Large Language Models [53.92832054643197]
我々は,300億のパラメータを持つベースモデルとチャットモデルを含むYAYI 2を提案する。
YAYI 2は、トレーニング済みのデータ処理パイプラインによってフィルタされた2.65兆のトークンを含む多言語コーパス上で、スクラッチから事前トレーニングされる。
ベースモデルは、数百万の指示による教師付き微調整と、人間のフィードバックからの強化学習によって、人間の価値と整合する。
論文 参考訳(メタデータ) (2023-12-22T17:34:47Z) - Arabic Mini-ClimateGPT : A Climate Change and Sustainability Tailored
Arabic LLM [77.17254959695218]
ChatGPTやBardのような大規模言語モデル(LLM)は、優れた会話能力を示し、幅広いNLPタスクに優れています。
我々は,オープンソースのLLM上に構築され,アラビア語データセットClima500-Instructの対話型命令チューニングに特化して微調整された軽量のアラビア語ミニクリメートGPTを提案する。
本モデルは,ChatGPTによる評価において,88.3%の症例において,ベースラインLLMを上回った。
論文 参考訳(メタデータ) (2023-12-14T22:04:07Z) - EVA2.0: Investigating Open-Domain Chinese Dialogue Systems with
Large-Scale Pre-Training [73.98154158068134]
EVA2.0は280億のパラメータを持つ大規模な事前訓練された中国の対話モデルである。
提案するEVA2.0は,280億のパラメータを持つ,大規模で事前訓練されたオープンドメインの中国語対話モデルである。
論文 参考訳(メタデータ) (2022-03-17T13:33:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。