論文の概要: Data Pricing in Machine Learning Pipelines
- arxiv url: http://arxiv.org/abs/2108.07915v1
- Date: Wed, 18 Aug 2021 00:57:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 23:33:16.038556
- Title: Data Pricing in Machine Learning Pipelines
- Title(参考訳): 機械学習パイプラインにおけるデータ価格
- Authors: Zicun Cong, Xuan Luo, Pei Jian, Feida Zhu, Yong Zhang
- Abstract要約: マシンラーニングパイプラインでは,3つの重要なステップで価格設定に重点を置いています。
データ収集のトレーニング段階における価格の理解のために、原データセットとデータラベルの価格についてレビューする。
また、機械学習モデルの協調トレーニングの段階における価格についても検討する。
- 参考スコア(独自算出の注目度): 6.739583754307253
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine learning is disruptive. At the same time, machine learning can only
succeed by collaboration among many parties in multiple steps naturally as
pipelines in an eco-system, such as collecting data for possible machine
learning applications, collaboratively training models by multiple parties and
delivering machine learning services to end users. Data is critical and
penetrating in the whole machine learning pipelines. As machine learning
pipelines involve many parties and, in order to be successful, have to form a
constructive and dynamic eco-system, marketplaces and data pricing are
fundamental in connecting and facilitating those many parties. In this article,
we survey the principles and the latest research development of data pricing in
machine learning pipelines. We start with a brief review of data marketplaces
and pricing desiderata. Then, we focus on pricing in three important steps in
machine learning pipelines. To understand pricing in the step of training data
collection, we review pricing raw data sets and data labels. We also
investigate pricing in the step of collaborative training of machine learning
models, and overview pricing machine learning models for end users in the step
of machine learning deployment. We also discuss a series of possible future
directions.
- Abstract(参考訳): 機械学習は破壊的だ。
同時に、マシンラーニングは、可能なマシンラーニングアプリケーションのデータ収集、複数のパーティによる協調トレーニング、エンドユーザへのマシンラーニングサービスの提供など、エコシステム内のパイプラインとして、複数のステップで多数の関係者が自然に協力することによってのみ成功することができる。
データは非常に重要で、マシンラーニングパイプライン全体に浸透している。
マシンラーニングパイプラインには多くのパーティが関与し、成功するためには、建設的でダイナミックなエコシステムを形成する必要があるため、マーケットプレースとデータ価格設定は、これら多くのパーティを接続し、促進する上で基本となる。
本稿では、機械学習パイプラインにおけるデータ価格の原理と最新の研究動向について調査する。
まず、データマーケットプレースと価格のデシデラタに関する簡単なレビューから始める。
次に、機械学習パイプラインの3つの重要なステップで価格に焦点を合わせます。
データ収集のトレーニング段階における価格の理解のために、原データセットとデータラベルの価格についてレビューする。
また、機械学習モデルの協調トレーニングの段階における価格設定や、マシンラーニングデプロイメントの段階におけるエンドユーザーの機械学習モデルの価格設定の概要についても検討する。
また,今後の方向性についても検討する。
関連論文リスト
- Machine Learning Operations: A Mapping Study [0.0]
この記事では、MLOpsパイプラインのいくつかのコンポーネントに存在する問題について論じる。
MLOpsシステムで発生する課題を、異なる焦点領域に分類するために、システマティックマッピング研究が実施されている。
この研究の主な価値は、MLOpsの独特な課題と、私たちの研究で概説された推奨された解決策をマッピングすることです。
論文 参考訳(メタデータ) (2024-09-28T17:17:40Z) - Data Pipeline Training: Integrating AutoML to Optimize the Data Flow of
Machine Learning Models [17.091169031023714]
Data Pipelineは、マシンラーニングのモデリングやデータ製品の開発といったタスクにおいて、必須の役割を果たす。
本稿では,機械学習の自動化によるデータフローの最適化について検討する。
私たちは、AutoML技術を活用してData Pipelineのインテリジェンスを強化する方法について論じる。
論文 参考訳(メタデータ) (2024-02-20T11:06:42Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Machine Learning for QoS Prediction in Vehicular Communication:
Challenges and Solution Approaches [46.52224306624461]
最大スループット予測の強化,例えばストリーミングや高精細マッピングアプリケーションについて検討する。
収集したデータの基盤となる特性をよりよく理解することで、マシンラーニング技術上に信頼性を構築することができるかを強調します。
我々は、説明可能なAIを使用して、機械学習が明示的にプログラムされることなく、無線ネットワークの基本原理を学習できることを示す。
論文 参考訳(メタデータ) (2023-02-23T12:29:20Z) - Privacy-Preserving Machine Learning for Collaborative Data Sharing via
Auto-encoder Latent Space Embeddings [57.45332961252628]
データ共有プロセスにおけるプライバシ保護機械学習は、極めて重要なタスクである。
本稿では、オートエンコーダによる表現学習を用いて、プライバシーを保護した組込みデータを生成する革新的なフレームワークを提案する。
論文 参考訳(メタデータ) (2022-11-10T17:36:58Z) - Process-BERT: A Framework for Representation Learning on Educational
Process Data [68.8204255655161]
本稿では,教育プロセスデータの表現を学習するためのフレームワークを提案する。
我々のフレームワークは、BERT型の目的を用いて、シーケンシャルなプロセスデータから表現を学習する事前学習ステップで構成されています。
当社のフレームワークは,2019年国のレポートカードデータマイニングコンペティションデータセットに適用しています。
論文 参考訳(メタデータ) (2022-04-28T16:07:28Z) - Where Is My Training Bottleneck? Hidden Trade-Offs in Deep Learning
Preprocessing Pipelines [77.45213180689952]
ディープラーニングにおける前処理パイプラインは、トレーニングプロセスを忙しくするための十分なデータスループットの提供を目的としている。
エンドツーエンドのディープラーニングパイプラインのためのデータセットを効率的に準備する新たな視点を導入する。
チューニングされていないシステムに比べてスループットが3倍から13倍に向上する。
論文 参考訳(メタデータ) (2022-02-17T14:31:58Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - ProcK: Machine Learning for Knowledge-Intensive Processes [30.371382331613532]
ProcK(Process & Knowledge)はビジネスプロセス予測モデルを構築するための新しいパイプラインである。
リレーショナルデータベースからリンクされたイベントログとナレッジベースを抽出するコンポーネントは、パイプラインの一部である。
我々は、OULADのeラーニングデータセット上で予測タスクをトレーニングすることで、ProcKのパワーを実証する。
論文 参考訳(メタデータ) (2021-09-10T13:51:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。