論文の概要: Sample selection from a given dataset to validate machine learning
models
- arxiv url: http://arxiv.org/abs/2104.14401v1
- Date: Tue, 27 Apr 2021 13:39:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-30 13:04:44.312508
- Title: Sample selection from a given dataset to validate machine learning
models
- Title(参考訳): 機械学習モデル検証のためのデータセットからのサンプル選択
- Authors: Bertrand Iooss (EDF R&D PRISME, GdR MASCOT-NUM)
- Abstract要約: 統計的基準を用いて「実験設計」の視点を採用することを提案する。
EDFの工業試験ケースでは、方法論の実践的関心が示されています。
- 参考スコア(独自算出の注目度): 42.375965874635526
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The selection of a validation basis from a full dataset is often required in
industrial use of supervised machine learning algorithm. This validation basis
will serve to realize an independent evaluation of the machine learning model.
To select this basis, we propose to adopt a "design of experiments" point of
view, by using statistical criteria. We show that the "support points" concept,
based on Maximum Mean Discrepancy criteria, is particularly relevant. An
industrial test case from the company EDF illustrates the practical interest of
the methodology.
- Abstract(参考訳): 完全なデータセットから検証ベースを選択することは、教師あり機械学習アルゴリズムの工業的利用においてしばしば必要となる。
この検証ベースは、機械学習モデルの独立した評価を実現するのに役立ちます。
この基盤を選択するために,統計的基準を用いて「実験設計」の視点を採用することを提案する。
本稿では,最大平均離散度基準に基づく「サポートポイント」の概念が特に重要であることを示す。
EDFの工業試験ケースでは、方法論の実践的関心が示されています。
関連論文リスト
- Verifiable evaluations of machine learning models using zkSNARKs [40.538081946945596]
本研究は,zkSNARKによるモデル推論を用いたモデル評価の検証手法を提案する。
結果として得られたデータセット上のモデル出力のゼロ知識計算証明は、検証可能な評価証明にパッケージ化することができる。
実世界のモデルのサンプルでこれを初めてデモし、重要な課題と設計ソリューションを強調します。
論文 参考訳(メタデータ) (2024-02-05T02:21:11Z) - Machine Unlearning for Causal Inference [0.6621714555125157]
モデルが与えられたユーザに関する情報(マシンアンラーニング)の学習/取得の一部を忘れることが重要である。
本稿では、因果推論のための機械学習の概念、特に確率スコアマッチングと治療効果推定について紹介する。
この研究で使用されるデータセットは、ジョブトレーニングプログラムの有効性を評価するために広く使用されているデータセットであるLalondeデータセットである。
論文 参考訳(メタデータ) (2023-08-24T17:27:01Z) - A Review of Benchmarks for Visual Defect Detection in the Manufacturing
Industry [63.52264764099532]
本稿では,既存のベンチマークを用いて,それらの特性とユースケースを比較し,公開する。
産業メトリクスの要求と試験手順についての研究は、研究されたベンチマークに提示され、適用されます。
論文 参考訳(メタデータ) (2023-05-05T07:44:23Z) - Metrics for Bayesian Optimal Experiment Design under Model
Misspecification [3.04585143845864]
ユーティリティ関数は、共通ユーティリティ関数が情報ゲインである実験の目的を定義する。
この記事では、従来の期待情報獲得基準を超えて、このプロセスのための拡張されたフレームワークを紹介します。
フレームワークの機能は、線形化スプリングマッサーダンパーシステムとF-16モデルを含むシナリオに適用することで紹介される。
論文 参考訳(メタデータ) (2023-04-17T02:13:20Z) - In Search of Insights, Not Magic Bullets: Towards Demystification of the
Model Selection Dilemma in Heterogeneous Treatment Effect Estimation [92.51773744318119]
本稿では,異なるモデル選択基準の長所と短所を実験的に検討する。
選択戦略,候補推定器,比較に用いるデータの間には,複雑な相互作用があることを強調した。
論文 参考訳(メタデータ) (2023-02-06T16:55:37Z) - Consistent Range Approximation for Fair Predictive Modeling [10.613912061919775]
このフレームワークは、トレーニング中の外部データの可用性に関わらず、ターゲット個体数に対して確実に公正な予測モデルを構築する。
このフレームワークの有効性は、実データの評価を通じて実証され、既存の最先端手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2022-12-21T08:27:49Z) - Learning to be a Statistician: Learned Estimator for Number of Distinct
Values [54.629042119819744]
列内の異なる値の数(NDV)を推定することは、データベースシステムにおける多くのタスクに有用である。
本研究では、ランダム(オンライン/オフライン)サンプルから正確なNDV推定を導出する方法に焦点を当てる。
教師付き学習フレームワークにおいて,NDV推定タスクを定式化し,モデルを推定対象として学習することを提案する。
論文 参考訳(メタデータ) (2022-02-06T15:42:04Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Beyond traditional assumptions in fair machine learning [5.029280887073969]
この論文は、連続的な意思決定における公正性に対する従来の機械学習アプローチの基礎となる一般的な仮定を精査する。
観測データの統計的特性に基づいたグループフェアネス基準は, 基本的に限定的であることを示す。
我々は、機密データが実際に容易に利用できるという仮定を克服する。
論文 参考訳(メタデータ) (2021-01-29T09:02:15Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。