論文の概要: Analyzing the Evolution and Maintenance of ML Models on Hugging Face
- arxiv url: http://arxiv.org/abs/2311.13380v2
- Date: Mon, 5 Feb 2024 13:37:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-07 04:09:03.341783
- Title: Analyzing the Evolution and Maintenance of ML Models on Hugging Face
- Title(参考訳): 跳躍面におけるMLモデルの進化と維持の解析
- Authors: Joel Casta\~no, Silverio Mart\'inez-Fern\'andez, Xavier Franch, Justus
Bogner
- Abstract要約: Hugging Face(HF)は、マシンラーニング(ML)モデルの開発と共有のための重要なプラットフォームとして、自らを確立している。
このリポジトリマイニング調査は、HF Hub API経由で収集されたデータを使用して、380,000以上のモデルに分類し、HFにホストされたモデルに関するコミュニティの関与、進化、メンテナンスを探求することを目的としている。
- 参考スコア(独自算出の注目度): 8.409033836300761
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Hugging Face (HF) has established itself as a crucial platform for the
development and sharing of machine learning (ML) models. This repository mining
study, which delves into more than 380,000 models using data gathered via the
HF Hub API, aims to explore the community engagement, evolution, and
maintenance around models hosted on HF, aspects that have yet to be
comprehensively explored in the literature. We first examine the overall growth
and popularity of HF, uncovering trends in ML domains, framework usage, authors
grouping and the evolution of tags and datasets used. Through text analysis of
model card descriptions, we also seek to identify prevalent themes and insights
within the developer community. Our investigation further extends to the
maintenance aspects of models, where we evaluate the maintenance status of ML
models, classify commit messages into various categories (corrective,
perfective, and adaptive), analyze the evolution across development stages of
commits metrics and introduce a new classification system that estimates the
maintenance status of models based on multiple attributes. This study aims to
provide valuable insights about ML model maintenance and evolution that could
inform future model development strategies on platforms like HF.
- Abstract(参考訳): huging face(hf)は、機械学習(ml)モデルの開発と共有のための重要なプラットフォームとして確立された。
このリポジトリマイニング調査は、HF Hub API経由で収集されたデータを使用して380,000以上のモデルに分類し、HFにホストされたモデルを中心に、コミュニティの関与、進化、メンテナンスを探求することを目的としている。
まず、HFの成長と人気、MLドメインのトレンド、フレームワークの使用状況、著者グループ化、使用するタグとデータセットの進化について調べる。
モデルカード記述のテキスト解析を通じて,開発者コミュニティ内で広く普及しているテーマや洞察の特定も行なっています。
本研究は,MLモデルの保守状態を評価するとともに,コミットメッセージをさまざまなカテゴリ(補正,完全,適応)に分類し,コミットメトリクスの開発段階にわたる進化を分析し,複数の属性に基づいてモデルのメンテナンス状態を推定する新たな分類システムを提案する。
本研究の目的は、HFのようなプラットフォーム上での将来のモデル開発戦略に影響を及ぼすであろうMLモデルのメンテナンスと進化に関する貴重な洞察を提供することである。
関連論文リスト
- How do Machine Learning Models Change? [7.543685248926161]
本研究は,Huging Face (HF) 上の5万モデルから20万件以上のコミットと1200件のリリースを,リポジトリマイニングと縦断解析の両方を用いて調査する。
コミットを分類するためにML変更分類を複製して拡張し、ベイジアンネットワークを使用してコミットとリリースのアクティビティのパターンを時間とともに明らかにします。
その結果,コミット活動はCRISP-DMなどの確立したデータサイエンス方法論と一致し,反復的改善と継続的改善が強調された。
さらに、リリースパターンは重要なアップデート、特にドキュメントにおいて、細かい変更とマイルストーンベースのリリースを区別する傾向があります。
論文 参考訳(メタデータ) (2024-11-14T18:14:32Z) - Recommendation with Generative Models [35.029116616023586]
生成モデルは、統計分布から学習し、サンプリングすることで、データの新しいインスタンスを作成することができるAIモデルである。
これらのモデルは、画像生成、テキスト合成、音楽合成など、様々な領域に応用されている。
レコメンデーションシステムでは、Gen-RecSysと呼ばれる生成モデルは、レコメンデーションの正確性と多様性を改善する。
論文 参考訳(メタデータ) (2024-09-18T18:29:15Z) - Model Merging in LLMs, MLLMs, and Beyond: Methods, Theories, Applications and Opportunities [89.40778301238642]
モデルマージは、機械学習コミュニティにおける効率的なエンパワーメント技術である。
これらの手法の体系的かつ徹底的なレビューに関する文献には大きなギャップがある。
論文 参考訳(メタデータ) (2024-08-14T16:58:48Z) - DogeRM: Equipping Reward Models with Domain Knowledge through Model Merging [65.41765072566287]
textbfDomain knowledtextbfge merged textbfReward textbfModel(DogeRM)を提案する。
論文 参考訳(メタデータ) (2024-07-01T17:01:54Z) - Lessons Learned from Mining the Hugging Face Repository [5.394314536012109]
Hugging Face (HF) に関する2つの総合的研究から得られた知見を総合的に分析する
本研究の目的は,HFエコシステムにおけるソフトウェアリポジトリ研究の実践的ガイドを提供することである。
論文 参考訳(メタデータ) (2024-02-11T22:59:19Z) - Continual Learning with Pre-Trained Models: A Survey [61.97613090666247]
継続的な学習は、新しい知識を学ぶ際に、かつての知識の破滅的な忘れを克服することを目的としている。
本稿では, PTM を用いた CL の最近の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2024-01-29T18:27:52Z) - Comprehensive Exploration of Synthetic Data Generation: A Survey [4.485401662312072]
この研究は、過去10年間で417のSynthetic Data Generationモデルを調査します。
その結果、ニューラルネットワークベースのアプローチが普及し、モデルのパフォーマンスと複雑性が向上したことが明らかになった。
コンピュータビジョンが支配的であり、GANが主要な生成モデルであり、拡散モデル、トランスフォーマー、RNNが競合する。
論文 参考訳(メタデータ) (2024-01-04T20:23:51Z) - Model-as-a-Service (MaaS): A Survey [42.70857461774014]
ファウンデーションモデルは、生成人工知能(GenAI)の一形態である
モデル・アズ・ア・サービス(M: Model-as-a-Service)は、GenAIモデルのデプロイメントと利用に革命をもたらす画期的なパラダイムとして登場した。
論文 参考訳(メタデータ) (2023-11-10T00:35:00Z) - Towards Graph Foundation Models: A Survey and Beyond [66.37994863159861]
ファンデーションモデルは、さまざまな人工知能アプリケーションにおいて重要なコンポーネントとして現れてきた。
基礎モデルがグラフ機械学習研究者を一般化し、適応させる能力は、新しいグラフ学習パラダイムを開発する可能性について議論する。
本稿では,グラフ基礎モデル(GFM)の概念を紹介し,その重要な特徴と基礎技術について概説する。
論文 参考訳(メタデータ) (2023-10-18T09:31:21Z) - Learn From Model Beyond Fine-Tuning: A Survey [78.80920533793595]
Learn From Model (LFM) は、モデルインターフェースに基づいた基礎モデル(FM)の研究、修正、設計に焦点を当てている。
LFM技術の研究は、モデルチューニング、モデル蒸留、モデル再利用、メタラーニング、モデル編集の5つの分野に大別できる。
本稿では, LFM の観点から, FM に基づく現在の手法を概観する。
論文 参考訳(メタデータ) (2023-10-12T10:20:36Z) - Scaling Vision-Language Models with Sparse Mixture of Experts [128.0882767889029]
提案手法は, 等価計算コストの高密度モデルに対して, 様々なベンチマークにおいて, 最先端性能を実現することができることを示す。
我々の研究は、MoEモデルのトレーニングの安定化、モデル解釈可能性に対するMoEの影響の理解、ビジョン言語モデルをスケールする際の計算性能間のトレードオフのバランスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-13T16:00:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。