論文の概要: SOLIS -- The MLOps journey from data acquisition to actionable insights
- arxiv url: http://arxiv.org/abs/2112.11925v1
- Date: Wed, 22 Dec 2021 14:45:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-23 15:35:58.938326
- Title: SOLIS -- The MLOps journey from data acquisition to actionable insights
- Title(参考訳): SOLIS -- データ取得から実行可能な洞察へのMLOpsの旅
- Authors: Razvan Ciobanu, Alexandru Purdila, Laurentiu Piciu and Andrei Damian
- Abstract要約: 本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
- 参考スコア(独自算出の注目度): 62.997667081978825
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine Learning operations is unarguably a very important and also one of
the hottest topics in Artificial Intelligence lately. Being able to define very
clear hypotheses for actual real-life problems that can be addressed by machine
learning models, collecting and curating large amounts of data for model
training and validation followed by model architecture search and actual
optimization and finally presenting the results fits very well the scenario of
Data Science experiments. This approach however does not supply the needed
procedures and pipelines for the actual deployment of machine learning
capabilities in real production grade systems. Automating live configuration
mechanisms, on the fly adapting to live or offline data capture and
consumption, serving multiple models in parallel either on edge or cloud
architectures, addressing specific limitations of GPU memory or compute power,
post-processing inference or prediction results and serving those either as
APIs or with IoT based communication stacks in the same end-to-end pipeline are
the real challenges that we try to address in this particular paper. In this
paper we present a unified deployment pipeline and freedom-to-operate approach
that supports all above requirements while using basic cross-platform tensor
framework and script language engines.
- Abstract(参考訳): 機械学習の操作は間違いなく非常に重要であり、最近は人工知能で最もホットなトピックの1つでもある。
機械学習モデルによって対処できる実際の実生活問題の非常に明確な仮説を定義し、モデルトレーニングとバリデーションのために大量のデータを収集、キュレーションし、続いてモデルアーキテクチャ検索と実際の最適化を行い、最終的に結果がデータサイエンス実験のシナリオに非常によく適合することを示した。
しかしこのアプローチは、実際のプロダクショングレードシステムにおける機械学習機能の実際のデプロイに必要な手順やパイプラインを提供しない。
ライブ構成メカニズムをオンザフライで自動化し、ライブまたはオフラインのデータキャプチャと消費に適応し、エッジまたはクラウドアーキテクチャのいずれかで複数のモデルを並列に提供し、GPUメモリまたは計算能力の特定の制限に対処し、後処理の推論または予測結果に対処し、同じエンドツーエンドパイプラインでAPIまたはIoTベースの通信スタックでそれらを提供する、というのが、この特定の論文で解決しようとしている真の課題です。
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,上記の要件をすべてサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
関連論文リスト
- The Compressor-Retriever Architecture for Language Model OS [20.56093501980724]
オペレーティングシステム(OS)のコアコンポーネントとして言語モデルを用いるという概念について検討する。
このようなLM OSを実現する上で重要な課題は、寿命の長いコンテキストを管理し、セッション間のステートフルネスを確保することだ。
本稿では,生涯のコンテキスト管理のために設計されたモデル非依存アーキテクチャであるコンプレッサー・レトリバーを紹介する。
論文 参考訳(メタデータ) (2024-09-02T23:28:15Z) - ToolACE: Winning the Points of LLM Function Calling [139.07157814653638]
ToolACEは、正確で複雑で多様なツール学習データを生成するように設計された自動エージェントパイプラインである。
我々は、合成データに基づいてトレーニングされたモデルが、8Bパラメータだけで、バークレー・ファンクション・カリング・リーダーボード上で最先端のパフォーマンスを達成することを実証した。
論文 参考訳(メタデータ) (2024-09-02T03:19:56Z) - In Situ Framework for Coupling Simulation and Machine Learning with
Application to CFD [51.04126395480625]
近年、流体力学計算を容易にする機械学習(ML)の多くの成功例が報告されている。
シミュレーションが大きくなるにつれて、従来のオフライン学習のための新しいトレーニングデータセットの生成は、I/Oとストレージのボトルネックを生み出します。
この作業は、この結合を単純化し、異種クラスタでのその場トレーニングと推論を可能にするソリューションを提供する。
論文 参考訳(メタデータ) (2023-06-22T14:07:54Z) - Continual-Learning-as-a-Service (CLaaS): On-Demand Efficient Adaptation
of Predictive Models [17.83007940710455]
機械学習ベースのアプリケーションを構築したい企業にとって、将来の2つのトレンドは、リアルタイムの推論と継続的な更新である。
本稿では,これらの課題に対処するため,新しいソフトウェアサービスと継続的学習・アズ・ア・サービス(CL)と呼ばれるモデル配信基盤を定義した。
オンプレミスソリューションなしで、効率的でステートフルで使いやすい方法で、データサイエンティストのためのモデル更新とバリデーションツールをサポートする。
論文 参考訳(メタデータ) (2022-06-14T16:22:54Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - Gradient-Based Training and Pruning of Radial Basis Function Networks
with an Application in Materials Physics [0.24792948967354234]
本稿では,高速かつスケーラブルなオープンソース実装による放射状基底関数ネットワークのトレーニング手法を提案する。
連立データと連立データのモデル解析のための新しいクローズドフォーム最適化基準を導出する。
論文 参考訳(メタデータ) (2020-04-06T11:32:37Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。