論文の概要: Data-centric Artificial Intelligence: A Survey
- arxiv url: http://arxiv.org/abs/2303.10158v3
- Date: Sun, 11 Jun 2023 07:25:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-14 00:52:22.214648
- Title: Data-centric Artificial Intelligence: A Survey
- Title(参考訳): データ中心の人工知能:調査
- Authors: Daochen Zha, Zaid Pervaiz Bhat, Kwei-Herng Lai, Fan Yang, Zhimeng
Jiang, Shaochen Zhong, Xia Hu
- Abstract要約: 近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
- 参考スコア(独自算出の注目度): 47.24049907785989
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artificial Intelligence (AI) is making a profound impact in almost every
domain. A vital enabler of its great success is the availability of abundant
and high-quality data for building machine learning models. Recently, the role
of data in AI has been significantly magnified, giving rise to the emerging
concept of data-centric AI. The attention of researchers and practitioners has
gradually shifted from advancing model design to enhancing the quality and
quantity of the data. In this survey, we discuss the necessity of data-centric
AI, followed by a holistic view of three general data-centric goals (training
data development, inference data development, and data maintenance) and the
representative methods. We also organize the existing literature from
automation and collaboration perspectives, discuss the challenges, and tabulate
the benchmarks for various tasks. We believe this is the first comprehensive
survey that provides a global view of a spectrum of tasks across various stages
of the data lifecycle. We hope it can help the readers efficiently grasp a
broad picture of this field, and equip them with the techniques and further
research ideas to systematically engineer data for building AI systems. A
companion list of data-centric AI resources will be regularly updated on
https://github.com/daochenzha/data-centric-AI
- Abstract(参考訳): 人工知能(AI)は、ほぼすべての領域で大きな影響を与えています。
その大きな成功の重要な有効要因は、マシンラーニングモデルを構築するための豊富な高品質のデータの提供である。
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
研究者や実践者の関心は、徐々にモデル設計の進展から、データの品質や量の向上へと移りつつある。
本調査では,データ中心型AIの必要性について論じるとともに,データ中心型目標(データ開発,推論データ開発,データ保守)と代表的な手法を総合的に考察する。
また、自動化やコラボレーションの観点から既存の文献を整理し、課題を議論し、さまざまなタスクのベンチマークを集計します。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査であると考えています。
読者がこの分野の全体像を効率的に把握し、aiシステム構築のためのデータを体系的に設計するための技術やさらなる研究アイデアを読者に提供できることを願っている。
データ中心AIリソースのコンパニオンリストは、https://github.com/daochenzha/data-centric-AIで定期的に更新される。
関連論文リスト
- What About the Data? A Mapping Study on Data Engineering for AI Systems [0.0]
AIシステムのためのデータ準備方法を知っているデータエンジニアの必要性はますます高まっている。
2019年1月から2023年6月までの間に25の関連論文を発見し、AIデータエンジニアリング活動について説明した。
本稿では,AIのデータ工学に関する知識の体系について概観する。
論文 参考訳(メタデータ) (2024-02-07T16:31:58Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - Why is AI not a Panacea for Data Workers? An Interview Study on Human-AI
Collaboration in Data Storytelling [59.08591308749448]
業界と学界の18人のデータワーカーにインタビューして、AIとのコラボレーションの場所と方法を聞いた。
驚いたことに、参加者はAIとのコラボレーションに興奮を見せたが、彼らの多くは反感を表明し、曖昧な理由を指摘した。
論文 参考訳(メタデータ) (2023-04-17T15:30:05Z) - Data-centric AI: Perspectives and Challenges [51.70828802140165]
データ中心AI(DCAI)は、モデル進歩からデータ品質と信頼性の確保への根本的なシフトを提唱している。
データ開発、推論データ開発、データメンテナンスの3つの一般的なミッションをまとめます。
論文 参考訳(メタデータ) (2023-01-12T05:28:59Z) - Data-Centric Artificial Intelligence [2.5874041837241304]
データ中心の人工知能(データ中心のAI)は、効率的で効率的なAIベースのシステムを構築する上で、データの体系的な設計とエンジニアリングが不可欠であることを強調する新しいパラダイムである。
関連する用語を定義し、データ中心のパラダイムとモデル中心のパラダイムを対比するための重要な特徴を提供し、データ中心のAIのためのフレームワークを導入します。
論文 参考訳(メタデータ) (2022-12-22T16:41:03Z) - Fantastic Data and How to Query Them [3.464871689508835]
異なるデータセットに対する統一されたフレームワークに関するビジョンを提示し、それらを統合し、簡単にクエリできるようにします。
我々は、コンピュータビジョンにおけるデータセットのためのフレームワークを作成し、その利点をさまざまなシナリオで示すために、現在進行中の作業でこれを実証しています。
論文 参考訳(メタデータ) (2022-01-13T15:24:46Z) - Empowering Things with Intelligence: A Survey of the Progress,
Challenges, and Opportunities in Artificial Intelligence of Things [98.10037444792444]
AIがIoTをより速く、より賢く、よりグリーンで、より安全にするための力を与える方法を示します。
まず、認識、学習、推論、行動の4つの視点から、IoTのためのAI研究の進歩を示す。
最後に、私たちの世界を深く再形成する可能性が高いAIoTの有望な応用をいくつかまとめる。
論文 参考訳(メタデータ) (2020-11-17T13:14:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。