論文の概要: Model Lake: a New Alternative for Machine Learning Models Management and Governance
- arxiv url: http://arxiv.org/abs/2503.22754v1
- Date: Thu, 27 Mar 2025 10:35:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:40:00.949997
- Title: Model Lake: a New Alternative for Machine Learning Models Management and Governance
- Title(参考訳): Model Lake: マシンラーニングモデル管理とガバナンスの新しい代替手段
- Authors: Moncef Garouani, Franck Ravat, Nathalie Valles-Parlangeau,
- Abstract要約: 私たちはML Model Lakeという概念を、組織環境内のデータセット、コード、モデルの集中管理フレームワークとして開発しています。
モデルのライフサイクル管理の強化,発見,監査,再利用性など,モデルレイクアプローチを採用する上での変革的可能性について議論する。
モデルレイクの現実的な応用と、データ、コード、モデル管理プラクティスに対する変革的な影響を説明します。
- 参考スコア(独自算出の注目度): 0.18434042562191813
- License:
- Abstract: The rise of artificial intelligence and data science across industries underscores the pressing need for effective management and governance of machine learning (ML) models. Traditional approaches to ML models management often involve disparate storage systems and lack standardized methodologies for versioning, audit, and re-use. Inspired by data lake concepts, this paper develops the concept of ML Model Lake as a centralized management framework for datasets, codes, and models within organizations environments. We provide an in-depth exploration of the Model Lake concept, delineating its architectural foundations, key components, operational benefits, and practical challenges. We discuss the transformative potential of adopting a Model Lake approach, such as enhanced model lifecycle management, discovery, audit, and reusability. Furthermore, we illustrate a real-world application of Model Lake and its transformative impact on data, code and model management practices.
- Abstract(参考訳): 産業全体にわたる人工知能とデータサイエンスの台頭は、機械学習(ML)モデルの効果的な管理とガバナンスの必要性を強く求めている。
MLモデル管理に対する従来のアプローチは、しばしば異なるストレージシステムを含み、バージョニング、監査、再使用のための標準化された方法論が欠如している。
データレイクの概念にインスパイアされた本論文では,機械学習モデルレイクの概念を,組織環境内のデータセット,コード,モデルを対象とした集中管理フレームワークとして開発する。
私たちはModel Lakeの概念を深く探求し、アーキテクチャの基礎、重要なコンポーネント、運用上のメリット、実践上の課題について述べています。
モデルのライフサイクル管理の強化,発見,監査,再利用性など,モデルレイクアプローチを採用する上での変革的可能性について議論する。
さらに、Model Lakeの現実的な応用と、データ、コード、モデル管理プラクティスに対する変革的な影響を説明します。
関連論文リスト
- Configurable Foundation Models: Building LLMs from a Modular Perspective [115.63847606634268]
LLMを多数の機能モジュールに分解する傾向が高まり、複雑なタスクに取り組むためにモジュールの一部とモジュールの動的アセンブリを推論することができる。
各機能モジュールを表すブロックという用語を造語し、モジュール化された構造をカスタマイズ可能な基礎モデルとして定義する。
検索とルーティング,マージ,更新,成長という,レンガ指向の4つの操作を提示する。
FFN層はニューロンの機能的特殊化と機能的ニューロン分割を伴うモジュラーパターンに従うことが判明した。
論文 参考訳(メタデータ) (2024-09-04T17:01:02Z) - Towards Synthetic Trace Generation of Modeling Operations using In-Context Learning Approach [1.8874331450711404]
本稿では,イベントログのモデリング,インテリジェントなモデリングアシスタント,モデリング操作の生成を組み合わせた概念的フレームワークを提案する。
特に、アーキテクチャは、設計者がシステムを指定するのを助け、その操作をグラフィカルなモデリング環境内で記録し、関連する操作を自動的に推奨する、モデリングコンポーネントから構成される。
論文 参考訳(メタデータ) (2024-08-26T13:26:44Z) - Model Lakes [23.115769188365967]
ディープラーニングモデルのセットを考えると、タスクに適したモデルを見つけるのは難しいかもしれません。
データレイクの研究からヒントを得て,モデルレイクの概念を紹介した。
モデル属性、バージョニング、検索、ベンチマークなどの重要なモデルレイクタスクを形式化する。
論文 参考訳(メタデータ) (2024-03-04T18:55:50Z) - ZhiJian: A Unifying and Rapidly Deployable Toolbox for Pre-trained Model
Reuse [59.500060790983994]
本稿では、PyTorchバックエンドを利用して、モデル再利用のための包括的でユーザフレンドリなツールボックスであるZhiJianを紹介する。
ZhiJianは、PTMによるターゲットアーキテクチャ構築、PTMによるターゲットモデルチューニング、およびPTMに基づく推論を含む、モデル再利用に関するさまざまな視点を統一する新しいパラダイムを提示している。
論文 参考訳(メタデータ) (2023-08-17T19:12:13Z) - Towards Efficient Task-Driven Model Reprogramming with Foundation Models [52.411508216448716]
ビジョンファウンデーションモデルは、非常に大きなモデルキャパシティと幅広いトレーニングデータから恩恵を受け、印象的なパワーを示す。
しかし、実際には、下流のシナリオは限られた計算資源や効率上の考慮のため、小さなモデルしかサポートできない。
これは、ファンデーションモデルの現実的な応用に重要な課題をもたらします。
論文 参考訳(メタデータ) (2023-04-05T07:28:33Z) - Scaling Vision-Language Models with Sparse Mixture of Experts [128.0882767889029]
提案手法は, 等価計算コストの高密度モデルに対して, 様々なベンチマークにおいて, 最先端性能を実現することができることを示す。
我々の研究は、MoEモデルのトレーニングの安定化、モデル解釈可能性に対するMoEの影響の理解、ビジョン言語モデルをスケールする際の計算性能間のトレードオフのバランスに関する貴重な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-13T16:00:31Z) - Model LEGO: Creating Models Like Disassembling and Assembling Building Blocks [53.09649785009528]
本稿では,新しいモデルを得るためのトレーニングを必要としないパラダイムについて検討する。
生体視覚系における受容野にインスパイアされたCNNの誕生と同様、モデル分解と組み立てを提案する。
モデル組立には、特定のタスクに適した新しいモデルを構築するために、アライメントパディング戦略とパラメータスケーリング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-25T05:27:28Z) - Concept for a Technical Infrastructure for Management of Predictive
Models in Industrial Applications [0.0]
モデル管理システムの技術的概念について述べる。
このコンセプトには、データのバージョニングストレージ、さまざまな機械学習アルゴリズムのサポート、モデルの微調整、その後のモデルのデプロイ、デプロイ後のモデルパフォーマンスの監視が含まれる。
論文 参考訳(メタデータ) (2021-07-29T08:38:46Z) - Knowledge-Guided Dynamic Systems Modeling: A Case Study on Modeling
River Water Quality [8.110949636804774]
実世界の現象をモデル化することは、エコロジーモデリングや財務予測など、多くの科学と工学の取り組みの焦点である。
複雑な動的システムのための正確なモデルの構築は、基盤となるプロセスの理解を改善し、リソース効率に繋がる。
反対の極端に、データ駆動モデリングはデータから直接モデルを学び、広範囲なデータと潜在的に過剰なフィッティングを生成する。
中間的アプローチであるモデルリビジョンに注目し,事前知識とデータを組み合わせることで,両世界のベストを達成する。
論文 参考訳(メタデータ) (2021-03-01T06:31:38Z) - Model Reuse with Reduced Kernel Mean Embedding Specification [70.044322798187]
現在のアプリケーションで有用なモデルを見つけるための2段階のフレームワークを提案する。
アップロードフェーズでは、モデルがプールにアップロードされている場合、モデルの仕様としてカーネル平均埋め込み(RKME)を縮小する。
デプロイフェーズでは、RKME仕様の値に基づいて、現在のタスクと事前訓練されたモデルの関連性を測定する。
論文 参考訳(メタデータ) (2020-01-20T15:15:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。