論文の概要: When AI Models Become Dependencies: Studying the Evolution of Pre-Trained Model Reuse in Downstream Software Systems
- arxiv url: http://arxiv.org/abs/2604.17940v1
- Date: Mon, 20 Apr 2026 08:20:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.761196
- Title: When AI Models Become Dependencies: Studying the Evolution of Pre-Trained Model Reuse in Downstream Software Systems
- Title(参考訳): AIモデルが依存する時 - 下流ソフトウェアシステムにおける事前学習モデル再利用の進化を研究する
- Authors: Peerachai Banyongrakkul, Mansooreh Zahedi, Christoph Treude, Haoyu Gao, Patanamon Thongtanunam,
- Abstract要約: 現代のソフトウェアシステムは、純粋にコードベースのアーキテクチャから、トレーニング済みモデル(PTM)が永続的な依存関係として機能するAI統合システムへと移行してきた。
ライブラリとは異なり、PTMは不透明な内部と、あまり標準化されておらず、急速に進化するリリースサイクルによって特徴づけられる。
PTMは標準のソフトウェアライブラリのように変化するのか、それとも分岐パターンに従うのか?
我々は,323のGitHub OSSリポジトリにわたる4,988リリースの包括的なデータセットを分析し,下流PTM変更に関する最初の実証的研究を行った。
- 参考スコア(独自算出の注目度): 11.477328199957356
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern software systems have transitioned from purely code-based architectures to AI-integrated systems where pre-trained models (PTMs) serve as permanent dependencies. However, while the evolution of traditional software libraries is well-documented, we lack a clear understanding of how these "PTM dependencies" change over time. Unlike libraries, PTMs are characterized by opaque internals and less standardized, rapidly evolving release cycles. Furthermore, their multi-role nature enables developers to treat individual instances of a single PTM as separate functional dependencies based on their specific downstream tasks. This raises a critical question for software maintenance: do PTMs change like standard software libraries or do they follow a divergent pattern? To answer this, we present the first empirical study of downstream PTM changes, analyzing a comprehensive dataset of 4,988 releases across 323 GitHub OSS repositories that reuse open-source PTMs. Using traditional software libraries as a baseline, we find that PTMs follow a qualitatively distinct pattern. PTMs are typically added late in the project life-cycle and tend to accumulate rather than be replaced as a project matures. Our findings show that PTM changes are three times less frequent (406 of 2,814 release transitions) than library changes. PTM changes are also less routinely documented, but more likely to carry explicit rationale. Unlike libraries, which evolve reactively, PTM evolution is proactively driven by capability expansion, with a unique documented rationale of PTM testing uncertainty. Our work calls for a rethinking of how PTMs are tracked and managed as dependencies in modern software engineering.
- Abstract(参考訳): 現代のソフトウェアシステムは、純粋にコードベースのアーキテクチャから、トレーニング済みモデル(PTM)が永続的な依存関係として機能するAI統合システムへと移行してきた。
しかしながら、従来のソフトウェアライブラリの進化は十分に文書化されていますが、これらの"PTM依存性"が時間とともにどのように変化するのかを明確に理解していません。
ライブラリとは異なり、PTMは不透明な内部と、あまり標準化されておらず、急速に進化するリリースサイクルによって特徴づけられる。
さらに、そのマルチロールな性質により、開発者は特定の下流タスクに基づいて、単一のPTMの個々のインスタンスを独立した機能依存として扱うことができる。
PTMは標準のソフトウェアライブラリのように変化するのか、それとも分岐パターンに従うのか?
これに対応するために、オープンソースPTMを再利用する323のGitHub OSSリポジトリにわたる4,988リリースの包括的なデータセットを分析し、下流PTMの変更に関する最初の実証的研究を紹介する。
従来のソフトウェアライブラリをベースラインとして、PTMが質的に異なるパターンに従うことが分かりました。
PTMは通常、プロジェクトのライフサイクルの後半に追加され、プロジェクトが成熟するにつれて置き換えられるのではなく、蓄積される傾向があります。
以上の結果より, PTMの変更頻度は図書館の3倍(リリース移行2,814件中406件)であった。
PTMの変更は、定期的な文書化は少ないが、明確な合理性を持つ可能性が高い。
リアクティブに進化するライブラリとは異なり、PTMの進化は能力拡張によって積極的に駆動される。
私たちの仕事は、現代のソフトウェアエンジニアリングにおける依存関係として、どのようにPTMが追跡され、管理されるかを再考することを求めている。
関連論文リスト
- Software Dependencies 2.0: An Empirical Study of Reuse and Integration of Pre-Trained Models in Open-Source Projects [9.22889135297242]
事前訓練されたモデル(PTM)は、前もってトレーニングされた機械学習モデルであり、しばしば大規模データに基づいており、新しいタスクのために再利用することができる。
Software Dependencies 2.0は、Software Dependencies 2.0という、ソフトウェア依存の新しいクラスを導入します。
論文 参考訳(メタデータ) (2025-09-07T15:00:22Z) - How do Pre-Trained Models Support Software Engineering? An Empirical Study in Hugging Face [52.257764273141184]
オープンソースの事前訓練モデル(PTM)は、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
私たちは147のSEタスクを含む分類法を導き、人気のあるオープンソースMLリポジトリであるHugging Face (HF)において、SE指向の分類をPTMに適用する。
PTMではコード生成が最も一般的なSEタスクであるのに対して、要件エンジニアリングとソフトウェア設計のアクティビティは限定的な注目を集めている。
論文 参考訳(メタデータ) (2025-06-03T15:51:17Z) - Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文 参考訳(メタデータ) (2024-11-14T18:52:05Z) - UniTST: Effectively Modeling Inter-Series and Intra-Series Dependencies for Multivariate Time Series Forecasting [98.12558945781693]
フラット化されたパッチトークンに統一された注意機構を含む変圧器ベースモデルUniTSTを提案する。
提案モデルでは単純なアーキテクチャを採用しているが,時系列予測のためのいくつかのデータセットの実験で示されたような,魅力的な性能を提供する。
論文 参考訳(メタデータ) (2024-06-07T14:39:28Z) - PeaTMOSS: A Dataset and Initial Analysis of Pre-Trained Models in
Open-Source Software [6.243303627949341]
本稿では,281,638PTMのメタデータと全PTMの詳細なスナップショットを含むPeaTMOSSデータセットを提案する。
データセットには15,129のダウンストリームGitHubリポジトリから2,530のPTMへの44,337のマッピングが含まれている。
我々の分析は、PTMサプライチェーンに関する最初の要約統計を提供し、PTM開発の動向とPTMパッケージドキュメンテーションの共通の欠点を示している。
論文 参考訳(メタデータ) (2024-02-01T15:55:50Z) - PeaTMOSS: Mining Pre-Trained Models in Open-Source Software [6.243303627949341]
PeaTMOSSデータセットを提示する。 オープンソースソフトウェアにおける事前学習モデル。
PeaTMOSSには3つの部分がある: スナップショットは281,638 PTM、 (2) PTMを使用するオープンソースソフトウェアリポジトリ27,270、(3) PTMとそれを使用するプロジェクトの間のマッピング。
論文 参考訳(メタデータ) (2023-10-05T15:58:45Z) - Efficient Federated Prompt Tuning for Black-box Large Pre-trained Models [62.838689691468666]
我々は,各ローカルデータセットを最適に活用するためのフェデレートブラックボックス・プロンプト・チューニング(Fed-BBPT)を提案する。
Fed-BBPTは、ローカルユーザーがレギュラーアグリゲーションを通じてプロンプトジェネレータを協調的に訓練するのを支援する中央サーバーに重点を置いている。
大規模な微調整とは対照的に、Fed-BBPTは、PTMストレージとローカルマシンの微調整に関連するメモリの課題を、十分にサイドステップで解決している。
論文 参考訳(メタデータ) (2023-10-04T19:30:49Z) - Revisiting Class-Incremental Learning with Pre-Trained Models: Generalizability and Adaptivity are All You Need [84.3507610522086]
クラスインクリメンタルラーニング(Class-incremental Learning, CIL)は、古いクラスを忘れずに新しいクラスに適応することを目的としている。
近年の事前訓練は大きな進歩を遂げており、CILには膨大な事前訓練モデル(PTM)が利用できるようになった。
CILの中核となる要素は、モデル更新の適応性と知識伝達の一般化性である。
論文 参考訳(メタデータ) (2023-03-13T17:59:02Z) - An Empirical Study of Pre-Trained Model Reuse in the Hugging Face Deep
Learning Model Registry [2.1346819928536687]
機械学習エンジニアが大規模事前学習モデル(PTM)の再利用を開始
私たちは、最も人気のあるPTMエコシステムであるHugging Faceの実践者12人にインタビューして、PTM再利用のプラクティスと課題を学びました。
PTM再利用の3つの課題は、属性の欠如、クレームと実際のパフォーマンスの相違、モデルリスクである。
論文 参考訳(メタデータ) (2023-03-05T02:28:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。