論文の概要: Experiment Based Crafting and Analyzing of Machine Learning Solutions
- arxiv url: http://arxiv.org/abs/2201.00355v1
- Date: Sun, 2 Jan 2022 13:11:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-04 21:38:47.013597
- Title: Experiment Based Crafting and Analyzing of Machine Learning Solutions
- Title(参考訳): 実験に基づく機械学習ソリューションの作成と分析
- Authors: Samuel Ackerman, Eitan Farchi, Orna Raz, Onn Shehory
- Abstract要約: この本は機械学習(ML)ベースのシステムの構築と開発について教えている。
プロジェクトライフサイクルの始めから統計実験を定義する必要性を強調する"実験ファースト"アプローチを提唱している。
- 参考スコア(独自算出の注目度): 1.6746303554275583
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The crafting of machine learning (ML) based systems requires statistical
control throughout its life cycle. Careful quantification of business
requirements and identification of key factors that impact the business
requirements reduces the risk of a project failure. The quantification of
business requirements results in the definition of random variables
representing the system key performance indicators that need to be analyzed
through statistical experiments. In addition, available data for training and
experiment results impact the design of the system. Once the system is
developed, it is tested and continually monitored to ensure it meets its
business requirements. This is done through the continued application of
statistical experiments to analyze and control the key performance indicators.
This book teaches the art of crafting and developing ML based systems. It
advocates an "experiment first" approach stressing the need to define
statistical experiments from the beginning of the project life cycle. It also
discusses in detail how to apply statistical control on the ML based system
throughout its lifecycle.
- Abstract(参考訳): 機械学習(ML)ベースのシステムの製作には、そのライフサイクルを通して統計的制御が必要である。
ビジネス要件の慎重に定量化とビジネス要件に影響を与える重要な要因の特定は、プロジェクトの失敗のリスクを低減します。
ビジネス要件の定量化は、統計実験を通じて分析する必要があるシステムキーのパフォーマンス指標を表すランダム変数の定義をもたらす。
さらに、トレーニングと実験結果の利用可能なデータは、システムの設計に影響を与える。
システムが開発されると、ビジネス要件を満たすようにテストされ、継続的に監視される。
これは、主要なパフォーマンス指標を分析し制御するための統計実験の継続的な応用を通して行われる。
この本はMLベースのシステムの構築と開発について教えている。
プロジェクトライフサイクルの始めから統計的実験を定義する必要性を強調した"実験ファースト"アプローチを提唱している。
また、ライフサイクルを通してMLベースのシステムに統計的制御を適用する方法についても詳細に論じている。
関連論文リスト
- The Significance of Latent Data Divergence in Predicting System Degradation [1.2058600649065616]
条件ベースのメンテナンスは、エンジニアリングシステムにおける潜在的な障害を早期に検出する上で、重要である。
本稿では,システムコンポーネントの潜在データ内における統計的類似性の分析を基礎とした新しい手法を提案する。
システム間の類似性は、これらの先行の相違を評価し、個々のシステム行動の微妙な理解を提供することによって推測する。
論文 参考訳(メタデータ) (2024-06-13T11:41:20Z) - A Mathematical Model of the Hidden Feedback Loop Effect in Machine Learning Systems [44.99833362998488]
意図しない隠れフィードバックループに起因するいくつかの現象を共同で記述するために,繰り返し学習プロセスを導入する。
このような繰り返し学習設定の特徴は、環境の状態が時間とともに学習者自身に因果的に依存することである。
本稿では,繰り返し学習過程の力学系モデルを提案し,正および負のフィードバックループモードに対する確率分布の制限セットを証明した。
論文 参考訳(メタデータ) (2024-05-04T17:57:24Z) - Designing monitoring strategies for deployed machine learning
algorithms: navigating performativity through a causal lens [6.329470650220206]
この研究の目的は、監視戦略を設計する際の比較的過小評価されている複雑さを強調することである。
MLに基づく未計画の読み出し予測のためのリスク予測アルゴリズムについて検討する。
このケーススタディの結果は、すべての監視システムが平等に作成されるわけではないという、一見単純な(そして明らかな)事実を強調します。
論文 参考訳(メタデータ) (2023-11-20T00:15:16Z) - Distribution-Free Statistical Dispersion Control for Societal
Applications [16.43522470711466]
モデル性能に関する有限サンプル統計保証は、責任ある機械学習において重要な要素である。
これまでの研究は主に、予測器の期待損失と、個々の予測が特定の範囲で損失値をもたらす確率のどちらかを束縛することに焦点を当ててきた。
我々は,従来よりもはるかにリッチな統計関数のクラスを扱える,シンプルで柔軟なフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-25T00:31:55Z) - A Domain-Agnostic Approach for Characterization of Lifelong Learning
Systems [128.63953314853327]
「生涯学習」システムには,1)継続的学習,2)伝達と適応,3)拡張性があります。
この一連のメトリクスは、様々な複雑な生涯学習システムの開発に役立てることができることを示す。
論文 参考訳(メタデータ) (2023-01-18T21:58:54Z) - Multi Agent System for Machine Learning Under Uncertainty in Cyber
Physical Manufacturing System [78.60415450507706]
近年の予測機械学習の進歩は、製造における様々なユースケースに応用されている。
ほとんどの研究は、それに関連する不確実性に対処することなく予測精度を最大化することに焦点を当てた。
本稿では,機械学習における不確実性の原因を特定し,不確実性下での機械学習システムの成功基準を確立する。
論文 参考訳(メタデータ) (2021-07-28T10:28:05Z) - Estimating Structural Target Functions using Machine Learning and
Influence Functions [103.47897241856603]
統計モデルから特定可能な関数として生じる対象関数の統計的機械学習のための新しい枠組みを提案する。
このフレームワークは問題とモデルに依存しないものであり、応用統計学における幅広い対象パラメータを推定するのに使用できる。
我々は、部分的に観測されていない情報を持つランダム/二重ロバストな問題において、いわゆる粗大化に特に焦点をあてた。
論文 参考訳(メタデータ) (2020-08-14T16:48:29Z) - An Uncertainty-based Human-in-the-loop System for Industrial Tool Wear
Analysis [68.8204255655161]
人間のループシステムにおけるモンテカルロのドロップアウトに基づく不確実性対策により,システムの透明性と性能が向上することを示す。
シミュレーション研究により、不確実性に基づく「ループ内人間システム」は、様々なレベルの人間の関与に対する性能を高めることが示されている。
論文 参考訳(メタデータ) (2020-07-14T15:47:37Z) - Targeting Learning: Robust Statistics for Reproducible Research [1.1455937444848387]
ターゲティング・ラーニング(Targeted Learning)は、因果推論、機械学習、統計理論の進歩を統一して、科学的に影響のある質問に統計的信頼性で答えるのに役立つ統計分野である。
ターゲット学習のロードマップは、仮説を最小化し、利用可能な科学的知識にのみ注意深く根ざすように、統計的手続きを調整することを強調する。
論文 参考訳(メタデータ) (2020-06-12T17:17:01Z) - How Training Data Impacts Performance in Learning-based Control [67.7875109298865]
本稿では,トレーニングデータの密度と制御性能の関係を考察する。
データセットの品質尺度を定式化し、$rho$-gap と呼ぶ。
フィードバック線形化制御法に$rho$-gapを適用する方法を示す。
論文 参考訳(メタデータ) (2020-05-25T12:13:49Z) - Towards CRISP-ML(Q): A Machine Learning Process Model with Quality
Assurance Methodology [53.063411515511056]
本稿では,機械学習アプリケーション開発のためのプロセスモデルを提案する。
第1フェーズでは、データの可用性がプロジェクトの実現可能性に影響を与えることが多いため、ビジネスとデータの理解が結合されます。
第6フェーズでは、機械学習アプリケーションの監視とメンテナンスに関する最先端のアプローチがカバーされている。
論文 参考訳(メタデータ) (2020-03-11T08:25:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。