論文の概要: Test Set Optimization by Machine Learning Algorithms
- arxiv url: http://arxiv.org/abs/2010.15240v1
- Date: Wed, 28 Oct 2020 21:24:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-02 04:53:14.740818
- Title: Test Set Optimization by Machine Learning Algorithms
- Title(参考訳): 機械学習アルゴリズムによるテストセット最適化
- Authors: Kaiming Fu and Yulu Jin and Zhousheng Chen
- Abstract要約: 本稿では,比較的正確な診断を行う最小限のテストデータ量を予測するために,機械学習に基づくいくつかの手法を提案する。
我々は、データに適合し、テストの終了時期を決定する予測モデルを開発した。
数値的な結果は、SVMが診断精度90.4%に達する一方で、テストのボリュームを35.24%減らしていることを示している。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diagnosis results are highly dependent on the volume of test set. To derive
the most efficient test set, we propose several machine learning based methods
to predict the minimum amount of test data that produces relatively accurate
diagnosis. By collecting outputs from failing circuits, the feature matrix and
label vector are generated, which involves the inference information of the
test termination point. Thus we develop a prediction model to fit the data and
determine when to terminate testing. The considered methods include LASSO and
Support Vector Machine(SVM) where the relationship between goals(label) and
predictors(feature matrix) are considered to be linear in LASSO and nonlinear
in SVM. Numerical results show that SVM reaches a diagnosis accuracy of 90.4%
while deducting the volume of test set by 35.24%.
- Abstract(参考訳): 診断結果はテストセットの量に大きく依存する。
最も効率的なテストセットを導出するために,比較的正確な診断を行う最小限のテストデータを予測するための機械学習に基づくいくつかの手法を提案する。
故障した回路から出力を収集することにより、テスト終了点の推論情報を含む特徴行列とラベルベクトルを生成する。
そこで我々は,データに適合する予測モデルを開発し,テスト終了時期を決定する。
検討された手法は,LASSO と Support Vector Machine (SVM) で,目標(ラベル) と予測器(フィーチャーマトリックス) の関係は LASSO では線形であり,SVM では非線形であると考えられる。
その結果、svmの診断精度は90.4%に達し、テストの体積は35.24%減少した。
関連論文リスト
- Training on the Benchmark Is Not All You Need [52.01920740114261]
本稿では,複数選択肢の内容に基づいた簡易かつ効果的なデータ漏洩検出手法を提案する。
本手法は,モデルトレーニングデータや重みを使用せずに,ブラックボックス条件下で動作することができる。
我々は,4つのベンチマークデータセットを用いて,31個の主要なオープンソースLCMのデータ漏洩の程度を評価する。
論文 参考訳(メタデータ) (2024-09-03T11:09:44Z) - Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。
提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文 参考訳(メタデータ) (2024-05-24T17:11:27Z) - Machine Learning Data Suitability and Performance Testing Using Fault
Injection Testing Framework [0.0]
本稿では,入力データ(FIUL-Data)テストフレームワークにおける望ましくない学習のためのフォールトインジェクションを提案する。
データミュータは、さまざまな障害注入の影響に対して、MLシステムの脆弱性を探索する。
本稿では, アンチセンスオリゴヌクレオチドの保持時間測定を含む分析化学データを用いて, フレームワークの評価を行った。
論文 参考訳(メタデータ) (2023-09-20T12:58:35Z) - Closing the loop: Autonomous experiments enabled by
machine-learning-based online data analysis in synchrotron beamline
environments [80.49514665620008]
機械学習は、大規模または高速に生成されたデータセットを含む研究を強化するために使用できる。
本研究では,X線反射法(XRR)のための閉ループワークフローへのMLの導入について述べる。
本研究では,ビームライン制御ソフトウェア環境に付加的なソフトウェア依存関係を導入することなく,実験中の基本データ解析をリアルタイムで行うソリューションを提案する。
論文 参考訳(メタデータ) (2023-06-20T21:21:19Z) - Lab-scale Vibration Analysis Dataset and Baseline Methods for Machinery
Fault Diagnosis with Machine Learning [1.8352113484137629]
本稿では,実験装置からの振動信号のデータセットについて述べる。
データのバランスが取れているため、重み付け精度(WA)を用いてアルゴリズムの性能を評価する。
最高の性能のアルゴリズムは、5倍のクロスバリデーションに対して WA が 99.75% の SVM である。
論文 参考訳(メタデータ) (2022-12-27T00:23:59Z) - Learning to predict test effectiveness [1.4213973379473652]
この記事では、テストがクラスをカバーできる範囲を、Coverageabilityと呼ばれる新しいメトリクスで予測する機械学習モデルを提供する。
各クラスで自動生成されるテストスイートのサイズとカバレッジの観点から,テストの有効性を評価する数学的モデルを提供する。
論文 参考訳(メタデータ) (2022-08-20T07:26:59Z) - Primal Estimated Subgradient Solver for SVM for Imbalanced
Classification [0.0]
我々は,PEGASOS SVMが8.6:1から130:1までのマイノリティ比に大きく依存する不均衡データセットに対して,優れた性能を達成できることを実証することを目的とする。
学習曲線を調べて評価する。
PEGASOS Cost-Sensitive SVM's results of Ding's LINEAR SVM DECIDL method。
論文 参考訳(メタデータ) (2022-06-19T02:33:14Z) - Cognitive Diagnosis with Explicit Student Vector Estimation and
Unsupervised Question Matrix Learning [53.79108239032941]
本研究では,DINA の学生ベクトルを推定するための明示的な学生ベクトル推定法を提案する。
また,Q行列を自動的にラベル付けする双方向キャリブレーションアルゴリズム (HBCA) を提案する。
2つの実世界のデータセットによる実験結果から,ESVE-DINAはDINAモデルよりも精度が高く,HBCAによって自動的にラベル付けされたQ行列は,手動でラベル付けしたQ行列に匹敵する性能が得られることが示された。
論文 参考訳(メタデータ) (2022-03-01T03:53:19Z) - Conformal prediction for the design problem [72.14982816083297]
機械学習の現実的な展開では、次にテストすべきデータを選択するために予測アルゴリズムを使用します。
このような設定では、トレーニングデータとテストデータの間には、異なるタイプの分散シフトがある。
このような環境で予測の不確実性を定量化する手法を提案する。
論文 参考訳(メタデータ) (2022-02-08T02:59:12Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - What is the Vocabulary of Flaky Tests? An Extended Replication [0.0]
本研究は,コード識別子を用いたテストフレキネスの予測に関する実証的研究である。
トレーニング済みモデルのパフォーマンスを他のフラスコテストと異なるプロジェクトからデータセットを使用して検証しました。
論文 参考訳(メタデータ) (2021-03-23T16:42:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。