論文の概要: Ensuring Dataset Quality for Machine Learning Certification
- arxiv url: http://arxiv.org/abs/2011.01799v1
- Date: Tue, 3 Nov 2020 15:45:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-30 04:36:22.168268
- Title: Ensuring Dataset Quality for Machine Learning Certification
- Title(参考訳): 機械学習認定のためのデータセット品質の確保
- Authors: Sylvaine Picard, Camille Chapdelaine, Cyril Cappi, Laurent Gardes,
Eric Jenn, Baptiste Lef\`evre, Thomas Soumarmon
- Abstract要約: 機械学習のコンテキストの特異性は適切に把握されず、ccountにも適用されないことを示す。
本稿では,鉄道領域からの信号認識システムに適用し,データセットの仕様と検証プロセスを提案する。
- 参考スコア(独自算出の注目度): 0.6927055673104934
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we address the problem of dataset quality in the context of
Machine Learning (ML)-based critical systems. We briefly analyse the
applicability of some existing standards dealing with data and show that the
specificities of the ML context are neither properly captured nor taken into
ac-count. As a first answer to this concerning situation, we propose a dataset
specification and verification process, and apply it on a signal recognition
system from the railway domain. In addi-tion, we also give a list of
recommendations for the collection and management of datasets. This work is one
step towards the dataset engineering process that will be required for ML to be
used on safety critical systems.
- Abstract(参考訳): 本稿では,機械学習(ML)に基づくクリティカルシステムにおいて,データセットの品質の問題に対処する。
我々は、データを扱う既存の標準の適用性を短時間で分析し、MLコンテキストの特異性は適切にキャプチャされず、cカウントにも適用されないことを示す。
この状況に対する第1の答えとして,我々は,データセットの仕様と検証プロセスを提案し,鉄道ドメインからの信号認識システムに適用する。
addi-tionでは、データセットの収集と管理のための推奨リストも提供します。
この作業は、MLが安全クリティカルシステムで使用されるために必要なデータセットエンジニアリングプロセスへの一歩です。
関連論文リスト
- How to design a dataset compliant with an ML-based system ODD? [5.432478272457867]
本稿では、ビジョンベースのランディングタスクに着目し、機械学習(ML)システムの操作設計ドメイン(ODD)に準拠したデータセットの設計と検証を行う。
新たな認証基準に基づき,ODDをシステムレベルと画像レベルで確立するプロセスについて述べる。
論文 参考訳(メタデータ) (2024-06-20T06:48:34Z) - A Systematic Review of Available Datasets in Additive Manufacturing [56.684125592242445]
視覚およびその他のセンサー技術を組み込んだその場監視により、追加製造プロセス中に広範なデータセットの収集が可能になる。
これらのデータセットは、製造された出力の品質を判断し、機械学習を使用して欠陥を検出する可能性がある。
本稿では,AMプロセスから派生したオープン画像ベースデータセットの利用可能性について検討する。
論文 参考訳(メタデータ) (2024-01-27T16:13:32Z) - ECS -- an Interactive Tool for Data Quality Assurance [63.379471124899915]
データ品質の保証のための新しいアプローチを提案する。
この目的のために、まず数学的基礎を議論し、そのアプローチを複数の例を用いて提示する。
これにより、安全クリティカルなシステムにおいて、潜在的に有害な特性を持つデータポイントが検出される。
論文 参考訳(メタデータ) (2023-07-10T06:49:18Z) - QI2 -- an Interactive Tool for Data Quality Assurance [63.379471124899915]
欧州委員会による計画されたAI法では、データ品質に関する法的要件が規定されている。
複数のデータ品質面におけるデータ品質保証プロセスをサポートする新しいアプローチを導入する。
論文 参考訳(メタデータ) (2023-07-07T07:06:38Z) - Quality In / Quality Out: Assessing Data quality in an Anomaly Detection
Benchmark [0.13764085113103217]
同じベンチマークデータセット(異常検出のためのフローベースリアルタイムデータセットであるUGR'16)に対する比較的小さな変更は、考慮した機械学習技術よりも、モデルパフォーマンスに著しく影響することを示します。
この結果から,自律型ネットワークにおけるデータ品質評価と最適化技術に,より注意を払う必要があることが示唆された。
論文 参考訳(メタデータ) (2023-05-31T12:03:12Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Training from Zero: Radio Frequency Machine Learning Data Quantity Forecasting [0.0]
任意のアプリケーション空間でトレーニング中に使用されるデータは、一度デプロイされたシステムのパフォーマンスに直接関連している。
機械学習の分野で使われている親指の基本的なルールの1つは、より多くのデータがより良いモデルにつながることだ。
本研究では,電波周波数領域における変調分類問題について検討する。
論文 参考訳(メタデータ) (2022-05-07T18:45:06Z) - Automatic Feasibility Study via Data Quality Analysis for ML: A
Case-Study on Label Noise [21.491392581672198]
我々はSnoopyを紹介し、データサイエンティストと機械学習エンジニアが体系的で理論的に確立された実現可能性研究を行うのを支援することを目的としている。
我々は、基礎となるタスクの既約誤差を推定し、この問題にアプローチする。
エンド・ツー・エンドの実験では、ユーザーがかなりのラベリング時間と金銭的努力を節約できることを示す。
論文 参考訳(メタデータ) (2020-10-16T14:21:19Z) - Unsupervised Quality Estimation for Neural Machine Translation [63.38918378182266]
既存のアプローチでは、大量の専門家アノテートデータ、計算、トレーニング時間が必要です。
MTシステム自体以外に、トレーニングや追加リソースへのアクセスが不要なQEに対して、教師なしのアプローチを考案する。
我々は品質の人間の判断と非常によく相関し、最先端の教師付きQEモデルと競合する。
論文 参考訳(メタデータ) (2020-05-21T12:38:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。