論文の概要: A Data Quality-Driven View of MLOps
- arxiv url: http://arxiv.org/abs/2102.07750v1
- Date: Mon, 15 Feb 2021 18:46:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-16 15:33:04.132270
- Title: A Data Quality-Driven View of MLOps
- Title(参考訳): MLOpsのデータ品質駆動型ビュー
- Authors: Cedric Renggli, Luka Rimanic, Nezihe Merve G\"urel, Bojan Karla\v{s},
Wentao Wu, Ce Zhang
- Abstract要約: 機械学習開発において、データ品質の異なる側面がいかに様々な段階に伝播するかを示す。
よく知られたデータ品質寸法と下流の機械学習プロセスの影響を共同分析することにより、典型的なMLOpsパイプラインの異なるコンポーネントを効率的に設計できることを示します。
- 参考スコア(独自算出の注目度): 7.232560137828175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Developing machine learning models can be seen as a process similar to the
one established for traditional software development. A key difference between
the two lies in the strong dependency between the quality of a machine learning
model and the quality of the data used to train or perform evaluations. In this
work, we demonstrate how different aspects of data quality propagate through
various stages of machine learning development. By performing a joint analysis
of the impact of well-known data quality dimensions and the downstream machine
learning process, we show that different components of a typical MLOps pipeline
can be efficiently designed, providing both a technical and theoretical
perspective.
- Abstract(参考訳): 機械学習モデルの開発は、従来のソフトウェア開発で確立されたものと同様のプロセスと見なすことができる。
この2つの重要な違いは、マシンラーニングモデルの品質と、評価のトレーニングや実行に使用されるデータの品質との強い依存関係にある。
本研究では,データ品質の異なる側面が,機械学習開発の様々な段階にどのように伝播するかを実証する。
よく知られたデータ品質寸法と下流の機械学習プロセスの影響を共同分析することにより、典型的なMLOpsパイプラインの異なるコンポーネントを効率的に設計することができ、技術的および理論的視点の両方を提供する。
関連論文リスト
- A Novel Metric for Measuring Data Quality in Classification Applications
(extended version) [0.0]
データ品質を測定するための新しい指標を紹介し説明する。
この尺度は、分類性能とデータの劣化の相関した進化に基づいている。
各基準の解釈と評価レベルの例を提供する。
論文 参考訳(メタデータ) (2023-12-13T11:20:09Z) - Robustness and Generalization Performance of Deep Learning Models on
Cyber-Physical Systems: A Comparative Study [71.84852429039881]
調査は、センサーの故障やノイズなど、様々な摂動を扱うモデルの能力に焦点を当てている。
我々は,これらのモデルの一般化と伝達学習能力を,アウト・オブ・ディストリビューション(OOD)サンプルに公開することによって検証する。
論文 参考訳(メタデータ) (2023-06-13T12:43:59Z) - Striving for data-model efficiency: Identifying data externalities on
group performance [75.17591306911015]
信頼できる、効果的で責任ある機械学習システムの構築は、トレーニングデータとモデリング決定の違いが、予測パフォーマンスにどのように影響するかを理解することに集中する。
我々は、特定のタイプのデータモデル非効率性に注目し、一部のソースからトレーニングデータを追加することで、集団の重要なサブグループで評価されるパフォーマンスを実際に低下させることができる。
以上の結果から,データ効率が正確かつ信頼性の高い機械学習の鍵となることが示唆された。
論文 参考訳(メタデータ) (2022-11-11T16:48:27Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Differential Property Prediction: A Machine Learning Approach to
Experimental Design in Advanced Manufacturing [2.905624971705889]
機械学習フレームワークである差分特性分類(DPC)を提案する。
DPCは2つの可能な実験パラメータ集合を持ち、演算子によって指定されたより望ましい特性を持つ材料を生成する予測を出力する。
実験者は,複数の候補となる実験パラメータを選択する必要があることに注目することにより,材料特性を処理パラメータから予測する困難な回帰タスクを,機械学習モデルが優れた性能を達成できる分類タスクに再編成できることを示す。
論文 参考訳(メタデータ) (2021-12-03T02:51:15Z) - The effects of data size on Automated Essay Scoring engines [0.415623340386296]
自動エッセイスコアリングエンジンの性能に及ぼすデータサイズと品質の影響について検討する。
この研究は、実運用で使用されるニューラルネットワークのより良いトレーニングデータを確立する方法について、私たちに情報を提供しようとしている。
論文 参考訳(メタデータ) (2021-08-30T14:39:59Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Using machine-learning modelling to understand macroscopic dynamics in a
system of coupled maps [0.0]
本稿では,グローバルに結合した地図システムから生じるマクロな動きについて考察する。
我々は、機械学習アプローチと粗粒度プロセスの遷移確率の直接数値計算の両方を用いて、マクロ力学のための粗粒度マルコフプロセスを構築した。
我々は,アトラクタの有効次元,メモリ効果の持続性,ダイナミクスのマルチスケール構造について重要な情報を推測することができる。
論文 参考訳(メタデータ) (2020-11-08T15:38:12Z) - Ethical behavior in humans and machines -- Evaluating training data
quality for beneficial machine learning [0.0]
本研究では、教師付き機械学習アプリケーションのためのデータ品質の新しい次元について述べる。
本研究の目的は、その行動の倫理的評価に基づいて、トレーニングデータをどのように選択できるかを説明することである。
論文 参考訳(メタデータ) (2020-08-26T09:48:38Z) - Graph signal processing for machine learning: A review and new
perspectives [57.285378618394624]
本稿では,GSPの概念とツール,例えばグラフフィルタや変換による新しい機械学習アルゴリズム開発への重要な貢献について概説する。
本稿では,データ構造とリレーショナル事前の活用,データと計算効率の向上,モデル解釈可能性の向上について論じる。
我々は,応用数学と信号処理の橋渡しとなるGSP技術と,他方の機械学習とネットワーク科学の橋渡しとなる新たな視点を提供する。
論文 参考訳(メタデータ) (2020-07-31T13:21:33Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。