論文の概要: DC-Check: A Data-Centric AI checklist to guide the development of
reliable machine learning systems
- arxiv url: http://arxiv.org/abs/2211.05764v1
- Date: Wed, 9 Nov 2022 17:32:09 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:21:58.567192
- Title: DC-Check: A Data-Centric AI checklist to guide the development of
reliable machine learning systems
- Title(参考訳): DC-Check: 信頼できる機械学習システムの開発をガイドするデータ中心AIチェックリスト
- Authors: Nabeel Seedat, Fergus Imrie, Mihaela van der Schaar
- Abstract要約: データ中心のAIは、信頼できるエンドツーエンドパイプラインを可能にする統一パラダイムとして登場しています。
データ中心の考慮事項を抽出する実行可能なチェックリストスタイルのフレームワークであるDC-Checkを提案する。
この開発におけるデータ中心のレンズは、システム開発に先立って思考力と透明性を促進することを目的としている。
- 参考スコア(独自算出の注目度): 81.21462458089142
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While there have been a number of remarkable breakthroughs in machine
learning (ML), much of the focus has been placed on model development. However,
to truly realize the potential of machine learning in real-world settings,
additional aspects must be considered across the ML pipeline. Data-centric AI
is emerging as a unifying paradigm that could enable such reliable end-to-end
pipelines. However, this remains a nascent area with no standardized framework
to guide practitioners to the necessary data-centric considerations or to
communicate the design of data-centric driven ML systems. To address this gap,
we propose DC-Check, an actionable checklist-style framework to elicit
data-centric considerations at different stages of the ML pipeline: Data,
Training, Testing, and Deployment. This data-centric lens on development aims
to promote thoughtfulness and transparency prior to system development.
Additionally, we highlight specific data-centric AI challenges and research
opportunities. DC-Check is aimed at both practitioners and researchers to guide
day-to-day development. As such, to easily engage with and use DC-Check and
associated resources, we provide a DC-Check companion website
(https://www.vanderschaar-lab.com/dc-check/). The website will also serve as an
updated resource as methods and tooling evolve over time.
- Abstract(参考訳): 機械学習(ML)には目覚ましいブレークスルーがいくつかあるが、その多くがモデル開発に重点を置いている。
しかし、現実の環境で機械学習の可能性を真に実現するためには、MLパイプライン全体で追加の側面を考慮する必要がある。
データ中心のAIは、信頼できるエンドツーエンドパイプラインを可能にする統一パラダイムとして登場しています。
しかし、これはまだ初期段階であり、実践者がデータ中心の考慮を導き、データ中心のMLシステムの設計を伝えるための標準化されたフレームワークがない。
このギャップに対処するため、私たちは、データ、トレーニング、テスト、デプロイメントというMLパイプラインのさまざまな段階におけるデータ中心の考慮を引き出す、実行可能なチェックリストスタイルのフレームワークであるDC-Checkを提案する。
このデータ中心開発レンズは、システム開発に先立って、思慮と透明性を促進することを目的としている。
さらに、データ中心のAIの課題と研究の機会を強調します。
DC-Checkは、実践者と研究者の両方が日々の開発をガイドすることを目的としている。
そのため、DC-Checkとその関連リソースを容易に利用するために、DC-CheckのコンパニオンWebサイト(https://www.vanderschaar-lab.com/dc-check/)を提供する。
メソッドやツールが時間とともに進化するにつれて、webサイトはリソースのアップデートとしても機能する。
関連論文リスト
- Survey and Taxonomy: The Role of Data-Centric AI in Transformer-Based Time Series Forecasting [36.31269406067809]
データ中心のAIは、AIモデルのトレーニング、特にトランスフォーマーベースのTSFモデルの効率的なトレーニングに不可欠である、と私たちは主張する。
我々は、データ中心のAIの観点から、これまでの研究成果をレビューし、トランスフォーマーベースのアーキテクチャとデータ中心のAIの将来の開発のための基礎的な作業を行うつもりです。
論文 参考訳(メタデータ) (2024-07-29T08:27:21Z) - On-Demand Earth System Data Cubes [2.062646422366945]
ESDCは構造化され直感的なデータ分析フレームワークを提供する。
ESDCは、幅広いAI駆動タスクに理想的だ。
我々は、AIにフォーカスしたESDCを簡単に生成できるように設計されたオープンソースのPythonツールであるcuboを紹介する。
論文 参考訳(メタデータ) (2024-04-19T13:50:30Z) - ActiveAD: Planning-Oriented Active Learning for End-to-End Autonomous
Driving [96.92499034935466]
自動運転のためのエンドツーエンドの差別化学習は、最近顕著なパラダイムになっている。
第一のボトルネックは、高品質なラベル付きデータに対する大胆な欲求にある。
収集した生データの一部を段階的に注釈付けする計画指向のアクティブラーニング手法を提案する。
論文 参考訳(メタデータ) (2024-03-05T11:39:07Z) - CUDC: A Curiosity-Driven Unsupervised Data Collection Method with
Adaptive Temporal Distances for Offline Reinforcement Learning [62.58375643251612]
本稿では,Curiosity-driven Unsupervised Data Collection (CUDC)法を提案する。
この適応的な到達性機構により、特徴表現は多様化することができ、エージェントは、好奇心で高品質なデータを集めるために自分自身をナビゲートすることができる。
実験的に、CUDCはDeepMindコントロールスイートの様々なダウンストリームオフラインRLタスクにおいて、既存の教師なし手法よりも効率と学習性能が優れている。
論文 参考訳(メタデータ) (2023-12-19T14:26:23Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Deep Class Incremental Learning from Decentralized Data [103.2386956343121]
我々は、対処すべきデータの継続的な流入がある、新しい、挑戦的な分散機械学習パラダイムに焦点を当てています。
典型的な(分散化された)クラスインクリメンタルな学習手法の基本的な分散化を実現するためのパラダイムを導入する。
本稿では, 歴史的モデルや複数のローカルサイトからの知識を連続的に一般モデルに伝達するための分散複合知識増分蒸留フレームワーク(DCID)を提案する。
論文 参考訳(メタデータ) (2022-03-11T15:09:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。