論文の概要: What can Data-Centric AI Learn from Data and ML Engineering?
- arxiv url: http://arxiv.org/abs/2112.06439v1
- Date: Mon, 13 Dec 2021 06:40:05 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-15 03:39:34.386522
- Title: What can Data-Centric AI Learn from Data and ML Engineering?
- Title(参考訳): データ中心AIはデータとMLエンジニアリングから何を学ぶことができるのか?
- Authors: Neoklis Polyzotis and Matei Zaharia
- Abstract要約: データ中心のAIは、AIコミュニティで新しくてエキサイティングな研究トピックです。
すでに多くの組織が、さまざまな“データ中心”アプリケーションを構築し、メンテナンスしている。
我々は、データ中心のAIに適用することに興味のあるデータとMLエンジニアリングからいくつかの教訓について論じる。
- 参考スコア(独自算出の注目度): 17.247372757533185
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-centric AI is a new and exciting research topic in the AI community, but
many organizations already build and maintain various "data-centric"
applications whose goal is to produce high quality data. These range from
traditional business data processing applications (e.g., "how much should we
charge each of our customers this month?") to production ML systems such as
recommendation engines. The fields of data and ML engineering have arisen in
recent years to manage these applications, and both include many interesting
novel tools and processes. In this paper, we discuss several lessons from data
and ML engineering that could be interesting to apply in data-centric AI, based
on our experience building data and ML platforms that serve thousands of
applications at a range of organizations.
- Abstract(参考訳): データ中心のAIは、AIコミュニティで新しくてエキサイティングな研究トピックだが、多くの企業がすでに、高品質なデータを生成することを目的とした、さまざまな“データ中心”アプリケーションを構築し、メンテナンスしている。
これらは、従来のビジネスデータ処理アプリケーション(例:「今月、各顧客にいくら課金すべきか?」)から、レコメンデーションエンジンなどのMLシステムまで様々です。
データとMLエンジニアリングの分野は、これらのアプリケーションを管理するために近年出現し、興味深いツールやプロセスが数多く含まれている。
本稿では、さまざまな組織で数千のアプリケーションをサポートするデータとMLプラットフォームを構築した経験に基づいて、データ中心のAIに適用することに興味のあるデータとMLエンジニアリングからの教訓について論じる。
関連論文リスト
- What About the Data? A Mapping Study on Data Engineering for AI Systems [0.0]
AIシステムのためのデータ準備方法を知っているデータエンジニアの必要性はますます高まっている。
2019年1月から2023年6月までの間に25の関連論文を発見し、AIデータエンジニアリング活動について説明した。
本稿では,AIのデータ工学に関する知識の体系について概観する。
論文 参考訳(メタデータ) (2024-02-07T16:31:58Z) - Benchmarking Large Language Models As AI Research Agents [105.65277755304277]
我々は,AI研究エージェントをベンチマークするMLタスクスイートであるMLAgentBenchを提案する。
我々は, GPT-4をベースとした研究エージェントが, MLAgentBenchの多くのタスクにおいて, 魅力的なMLモデルを構築できることを発見した。
長期計画や幻覚など,LSMをベースとした研究エージェントにとって重要な課題をいくつか挙げる。
論文 参考訳(メタデータ) (2023-10-05T04:06:12Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。
本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。
これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文 参考訳(メタデータ) (2023-03-17T17:44:56Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。
このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。
データの継続的な削除と モデル再訓練のステップはスケールしません
この課題に対処するために、textitMachine Unlearningを提案する。
論文 参考訳(メタデータ) (2022-12-19T16:06:45Z) - Machine Learning for Software Engineering: A Tertiary Study [13.832268599253412]
機械学習(ML)技術は、ソフトウェアエンジニアリング(SE)ライフサイクルアクティビティの有効性を高める。
2009~2022年に発行されたML for SEで, 体系的, 品質評価, 要約, 分類を行い, 初等研究6,117件について検討した。
MLに最も取り組まれているSE領域は、ソフトウェアの品質とテストである。
論文 参考訳(メタデータ) (2022-11-17T09:19:53Z) - An Empirical Evaluation of Flow Based Programming in the Machine
Learning Deployment Context [11.028123436097616]
データ指向アーキテクチャ(DOA)は,課題に対処する上で,データサイエンティストやソフトウェア開発者を支援する,新たなアプローチである。
本稿では,フローベースプログラミング(FBP)をDOAアプリケーション作成のパラダイムとして考える。
我々は、典型的なデータサイエンスプロジェクトを表す4つのアプリケーション上で、MLデプロイメントの文脈において、FBPを実証的に評価する。
論文 参考訳(メタデータ) (2022-04-27T09:08:48Z) - Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。
特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文 参考訳(メタデータ) (2022-03-06T10:12:56Z) - Towards Productizing AI/ML Models: An Industry Perspective from Data
Scientists [10.27276267081559]
AI/MLモデルから生産可能なAIベースのシステムへの移行は、データサイエンティストとソフトウェアエンジニアの両方にとって課題です。
本稿では,この移行が実践者によってどのように認識されるかを理解するため,コンサルティング会社におけるワークショップの結果を報告する。
論文 参考訳(メタデータ) (2021-03-18T22:25:44Z) - Data Engineering for Everyone [1.2585165426919136]
データエンジニアリングは機械学習(ML)における最速成長分野の1つである
MLは、データエンジニアの個々のチームが簡単に生成できる以上のデータを必要とします。
この記事では、大規模なAI組織でも、オープンソースのデータセットが研究とイノベーションのためのロケット燃料であることを示す。
論文 参考訳(メタデータ) (2021-02-23T01:24:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。