論文の概要: Design choice and machine learning model performances
- arxiv url: http://arxiv.org/abs/2201.10239v1
- Date: Tue, 25 Jan 2022 11:14:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-27 02:02:14.076037
- Title: Design choice and machine learning model performances
- Title(参考訳): 設計選択と機械学習モデルのパフォーマンス
- Authors: Rosa Arboretti, Riccardo Ceccato, Luca Pegoraro, Luigi Salmaso
- Abstract要約: 本稿では,機械学習モデルの性能に関する設計選択について論じる。
12の実験的設計、7つの予測モデル、7つの物理過程をエミュレートする7つのテスト関数、8つのノイズ設定について検討した。
本研究の結果は, 実践者の作業に即時に影響を与え, DOE と ML の実践的応用に関するガイドラインを提供することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An increasing number of publications present the joint application of Design
of Experiments (DOE) and machine learning (ML) as a methodology to collect and
analyze data on a specific industrial phenomenon. However, the literature shows
that the choice of the design for data collection and model for data analysis
is often driven by incidental factors, rather than by statistical or
algorithmic advantages, thus there is a lack of studies which provide
guidelines on what designs and ML models to jointly use for data collection and
analysis. This is the first time in the literature that a paper discusses the
choice of design in relation to the ML model performances. An extensive study
is conducted that considers 12 experimental designs, 7 families of predictive
models, 7 test functions that emulate physical processes, and 8 noise settings,
both homoscedastic and heteroscedastic. The results of the research can have an
immediate impact on the work of practitioners, providing guidelines for
practical applications of DOE and ML.
- Abstract(参考訳): 実験設計(doe)と機械学習(ml)を、特定の産業現象に関するデータを収集・分析するための方法論として併用する出版物が増えている。
しかし,データ収集とデータ解析のためのモデルの設計の選択は,統計的・アルゴリズム的な利点ではなく,付随的な要因によって行われることが多いため,データ収集と分析にどのような設計とmlモデルを併用するかに関するガイドラインを提供する研究が不足している。
mlモデルの性能に関連して設計の選択を論じた文献は,今回が初めてである。
12の実験設計、7種類の予測モデル、物理過程をエミュレートする7つのテスト関数、8つのノイズ設定、ホモシドスティックとヘテロシドスティックの両方を考慮した広範な研究が行われた。
本研究の結果は, 実践者の作業に即時に影響を与え, DOE と ML の実践的応用に関するガイドラインを提供することができる。
関連論文リスト
- Extending Variability-Aware Model Selection with Bias Detection in
Machine Learning Projects [0.7646713951724013]
本稿では,機械学習プロジェクトにおけるバイアス検出による適応変数認識モデル選択手法の拡張について述べる。
提案手法は, モデル選択, 特にバイアスに関連する要因, およびそれらの相互作用に影響を及ぼす因子を明示することによって, 技術の現状を推し進めることを目的としている。
論文 参考訳(メタデータ) (2023-11-23T22:08:29Z) - A Comprehensive Evaluation and Analysis Study for Chinese Spelling Check [53.152011258252315]
音声とグラフィックの情報を合理的に使用することは,中国語のスペルチェックに有効であることを示す。
モデルはテストセットのエラー分布に敏感であり、モデルの欠点を反映している。
一般的なベンチマークであるSIGHANは、モデルの性能を確実に評価できない。
論文 参考訳(メタデータ) (2023-07-25T17:02:38Z) - Online simulator-based experimental design for cognitive model selection [74.76661199843284]
本稿では,抽出可能な確率を伴わない計算モデルを選択する実験設計手法BOSMOSを提案する。
シミュレーション実験では,提案手法により,既存のLFI手法に比べて最大2桁の精度でモデルを選択することができることを示した。
論文 参考訳(メタデータ) (2023-03-03T21:41:01Z) - A prediction and behavioural analysis of machine learning methods for
modelling travel mode choice [0.26249027950824505]
我々は、モデル選択に影響を及ぼす可能性のある重要な要因の観点から、複数のモデリング問題に対して異なるモデリングアプローチを体系的に比較する。
その結果,非凝集性予測性能が最も高いモデルでは,行動指標やアグリゲーションモードのシェアが低下することが示唆された。
MNLモデルは様々な状況において堅牢に機能するが、ML手法はWillingness to Payのような行動指標の推定を改善することができる。
論文 参考訳(メタデータ) (2023-01-11T11:10:32Z) - Empirical Analysis of Model Selection for Heterogeneous Causal Effect
Estimation [28.408998847597882]
因果推論におけるモデル選択の問題,特に2次的治療下での条件平均治療効果(CATE)推定について検討した。
機械学習におけるモデル選択とは異なり、あらゆるデータポイントに対する反実的ポテンシャルの結果が観察されないため、クロスバリデーションの完全な類似は存在しない。
論文 参考訳(メタデータ) (2022-11-03T16:26:06Z) - Deep Learning for Choice Modeling [5.173001988341294]
我々は,機能フリーと機能ベースという2つの選択モデルに基づいて,ディープラーニングに基づく選択モデルを構築した。
本モデルでは,候補選択に対する本質的効用と,候補選択が選択確率に与える影響の両方を捉える。
論文 参考訳(メタデータ) (2022-08-19T13:10:17Z) - Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach [91.62936410696409]
本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
論文 参考訳(メタデータ) (2021-11-13T01:50:36Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。