論文の概要: How to design a dataset compliant with an ML-based system ODD?
- arxiv url: http://arxiv.org/abs/2406.14027v1
- Date: Thu, 20 Jun 2024 06:48:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 15:10:05.740715
- Title: How to design a dataset compliant with an ML-based system ODD?
- Title(参考訳): MLベースのシステム ODD に準拠したデータセットを設計するにはどうすればよいか?
- Authors: Cyril Cappi, Noémie Cohen, Mélanie Ducoffe, Christophe Gabreau, Laurent Gardes, Adrien Gauffriau, Jean-Brice Ginestet, Franck Mamalet, Vincent Mussot, Claire Pagetti, David Vigouroux,
- Abstract要約: 本稿では、ビジョンベースのランディングタスクに着目し、機械学習(ML)システムの操作設計ドメイン(ODD)に準拠したデータセットの設計と検証を行う。
新たな認証基準に基づき,ODDをシステムレベルと画像レベルで確立するプロセスについて述べる。
- 参考スコア(独自算出の注目度): 5.432478272457867
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper focuses on a Vision-based Landing task and presents the design and the validation of a dataset that would comply with the Operational Design Domain (ODD) of a Machine-Learning (ML) system. Relying on emerging certification standards, we describe the process for establishing ODDs at both the system and image levels. In the process, we present the translation of high-level system constraints into actionable image-level properties, allowing for the definition of verifiable Data Quality Requirements (DQRs). To illustrate this approach, we use the Landing Approach Runway Detection (LARD) dataset which combines synthetic imagery and real footage, and we focus on the steps required to verify the DQRs. The replicable framework presented in this paper addresses the challenges of designing a dataset compliant with the stringent needs of ML-based systems certification in safety-critical applications.
- Abstract(参考訳): 本稿では、ビジョンに基づくランディングタスクに着目し、機械学習(ML)システムの運用設計ドメイン(ODD)に準拠したデータセットの設計と検証を行う。
新たな認証基準に基づき,ODDをシステムレベルと画像レベルで確立するプロセスについて述べる。
本プロセスでは,高レベルの制約を動作可能な画像レベルに変換することで,検証可能なデータ品質要件(DQR)の定義を可能にする。
このアプローチを説明するために、合成画像と実写映像を組み合わせたLanding Approach Runway Detection (LARD)データセットを使用し、DQRを検証するために必要なステップに焦点を当てる。
本稿では,MLベースのシステム認証の厳密なニーズに適合するデータセットを安全クリティカルなアプリケーションで設計する上での課題について論じる。
関連論文リスト
- Web-Scale Visual Entity Recognition: An LLM-Driven Data Approach [56.55633052479446]
Webスケールのビジュアルエンティティ認識は、クリーンで大規模なトレーニングデータがないため、重大な課題を呈している。
本稿では,ラベル検証,メタデータ生成,合理性説明に多モーダル大言語モデル(LLM)を活用することによって,そのようなデータセットをキュレートする新しい手法を提案する。
実験により、この自動キュレートされたデータに基づいてトレーニングされたモデルは、Webスケールの視覚的エンティティ認識タスクで最先端のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2024-10-31T06:55:24Z) - RAGEval: Scenario Specific RAG Evaluation Dataset Generation Framework [69.4501863547618]
本稿では,様々なシナリオにまたがってRAGシステムを評価するためのフレームワークであるRAGvalを紹介する。
事実の正確性に着目し, 完全性, 幻覚, 不適切性の3つの新しい指標を提案する。
実験結果から, RAGEvalは, 生成した試料の明瞭度, 安全性, 適合性, 豊かさにおいて, ゼロショット法とワンショット法より優れていた。
論文 参考訳(メタデータ) (2024-08-02T13:35:11Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - A Systematic Review of Available Datasets in Additive Manufacturing [56.684125592242445]
視覚およびその他のセンサー技術を組み込んだその場監視により、追加製造プロセス中に広範なデータセットの収集が可能になる。
これらのデータセットは、製造された出力の品質を判断し、機械学習を使用して欠陥を検出する可能性がある。
本稿では,AMプロセスから派生したオープン画像ベースデータセットの利用可能性について検討する。
論文 参考訳(メタデータ) (2024-01-27T16:13:32Z) - Runway Sign Classifier: A DAL C Certifiable Machine Learning System [4.012351415340318]
本稿では,空港標識の検出・分類にディープニューラルネットワーク(DNN)を用いた航空機システムの事例研究を行う。
DAL Cを実現するために、冗長かつ異種な2つのDNNを含む確立されたアーキテクチャ緩和手法を用いる。
この研究は、MLベースのシステムの認定課題が、中程度臨界航空機アプリケーションにどのように対処できるかを説明することを目的としている。
論文 参考訳(メタデータ) (2023-10-10T10:26:30Z) - Data-centric Operational Design Domain Characterization for Machine
Learning-based Aeronautical Products [4.8461049669050915]
機械学習(ML)に基づく航空製品のための操作設計ドメイン(ODD)の厳密な特徴付けを初めて与える。
我々は,ODDを定義するパラメータを明示的にキャプチャできる次元と,MLベースのアプリケーションが操作中に遭遇する可能性のあるデータの分類を提案する。
論文 参考訳(メタデータ) (2023-07-15T02:08:33Z) - QI2 -- an Interactive Tool for Data Quality Assurance [63.379471124899915]
欧州委員会による計画されたAI法では、データ品質に関する法的要件が規定されている。
複数のデータ品質面におけるデータ品質保証プロセスをサポートする新しいアプローチを導入する。
論文 参考訳(メタデータ) (2023-07-07T07:06:38Z) - Zero-shot Composed Text-Image Retrieval [72.43790281036584]
合成画像検索(CIR)の問題点を考察する。
テキストや画像などのマルチモーダル情報を融合し、クエリにマッチする画像を正確に検索し、ユーザの表現能力を拡張できるモデルをトレーニングすることを目的としている。
論文 参考訳(メタデータ) (2023-06-12T17:56:01Z) - Ensuring Dataset Quality for Machine Learning Certification [0.6927055673104934]
機械学習のコンテキストの特異性は適切に把握されず、ccountにも適用されないことを示す。
本稿では,鉄道領域からの信号認識システムに適用し,データセットの仕様と検証プロセスを提案する。
論文 参考訳(メタデータ) (2020-11-03T15:45:43Z) - Manifold for Machine Learning Assurance [9.594432031144716]
本稿では,機械学習(ML)システムにおいて,要求システムを暗黙的に記述した高次元学習データから抽出する機械学習手法を提案する。
その後、テストの精度測定、テスト入力生成、ターゲットのMLシステムの実行時の監視など、さまざまな品質保証タスクに利用されます。
予備実験により, 提案手法により, 試験精度が試験データの多様性を推し進めるとともに, テスト生成手法が故障を防止し, 現実的なテストケースを生み出すことが確認され, 実行時モニタリングは, 対象システムの出力の信頼性を独立的に評価する手段を提供する。
論文 参考訳(メタデータ) (2020-02-08T11:39:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。