Fugu-MT 論文翻訳(概要): What can Data-Centric AI Learn from Data and ML Engineering?

論文の概要: What can Data-Centric AI Learn from Data and ML Engineering?

arxiv url: http://arxiv.org/abs/2112.06439v1
Date: Mon, 13 Dec 2021 06:40:05 GMT
ステータス: 翻訳完了
システム内更新日: 2021-12-15 03:39:34.386522
Title: What can Data-Centric AI Learn from Data and ML Engineering?
Title（参考訳）: データ中心AIはデータとMLエンジニアリングから何を学ぶことができるのか?
Authors: Neoklis Polyzotis and Matei Zaharia
Abstract要約: データ中心のAIは、AIコミュニティで新しくてエキサイティングな研究トピックです。すでに多くの組織が、さまざまな“データ中心”アプリケーションを構築し、メンテナンスしている。我々は、データ中心のAIに適用することに興味のあるデータとMLエンジニアリングからいくつかの教訓について論じる。
参考スコア（独自算出の注目度）: 17.247372757533185
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Data-centric AI is a new and exciting research topic in the AI community, but many organizations already build and maintain various "data-centric" applications whose goal is to produce high quality data. These range from traditional business data processing applications (e.g., "how much should we charge each of our customers this month?") to production ML systems such as recommendation engines. The fields of data and ML engineering have arisen in recent years to manage these applications, and both include many interesting novel tools and processes. In this paper, we discuss several lessons from data and ML engineering that could be interesting to apply in data-centric AI, based on our experience building data and ML platforms that serve thousands of applications at a range of organizations.
Abstract（参考訳）: データ中心のAIは、AIコミュニティで新しくてエキサイティングな研究トピックだが、多くの企業がすでに、高品質なデータを生成することを目的とした、さまざまな“データ中心”アプリケーションを構築し、メンテナンスしている。これらは、従来のビジネスデータ処理アプリケーション(例:「今月、各顧客にいくら課金すべきか?」)から、レコメンデーションエンジンなどのMLシステムまで様々です。データとMLエンジニアリングの分野は、これらのアプリケーションを管理するために近年出現し、興味深いツールやプロセスが数多く含まれている。本稿では、さまざまな組織で数千のアプリケーションをサポートするデータとMLプラットフォームを構築した経験に基づいて、データ中心のAIに適用することに興味のあるデータとMLエンジニアリングからの教訓について論じる。

関連論文リスト

Towards Human-Guided, Data-Centric LLM Co-Pilots [53.35493881390917]
CliMB-DCは、機械学習コパイロットのための、ヒューマンガイド付き、データ中心のフレームワークである。高度なデータ中心ツールとLLM駆動推論を組み合わせることで、堅牢でコンテキスト対応のデータ処理を可能にする。 CliMB-DCが未処理のデータセットをML対応フォーマットに変換する方法を示す。
論文参考訳（メタデータ） (2025-01-17T17:51:22Z)
Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。 Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文参考訳（メタデータ） (2024-07-15T17:54:37Z)
A Systematic Literature Review on the Use of Machine Learning in Software Engineering [0.0]
本研究は,ソフトウェア工学プロセスに機械学習技術を適用する際の技術の現状を探るため,その目的と研究課題に従って実施された。レビューでは、ソフトウェア品質保証、ソフトウェア保守、ソフトウェア理解、ソフトウェアドキュメントなど、MLが適用されたソフトウェアエンジニアリングにおける重要な領域を特定している。
論文参考訳（メタデータ） (2024-06-19T23:04:27Z)
What About the Data? A Mapping Study on Data Engineering for AI Systems [0.0]
AIシステムのためのデータ準備方法を知っているデータエンジニアの必要性はますます高まっている。 2019年1月から2023年6月までの間に25の関連論文を発見し、AIデータエンジニアリング活動について説明した。本稿では,AIのデータ工学に関する知識の体系について概観する。
論文参考訳（メタデータ） (2024-02-07T16:31:58Z)
Data-centric Artificial Intelligence: A Survey [47.24049907785989]
近年、AIにおけるデータの役割は大幅に拡大し、データ中心AIという新たな概念が生まれた。本稿では,データ中心型AIの必要性について論じ,続いて3つの一般的なデータ中心型目標の全体像を考察する。これは、データライフサイクルのさまざまな段階にわたるタスクのグローバルなビューを提供する、初めての総合的な調査である、と私たちは信じています。
論文参考訳（メタデータ） (2023-03-17T17:44:56Z)
OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文参考訳（メタデータ） (2023-03-01T13:35:22Z)
Privacy Adhering Machine Un-learning in NLP [66.17039929803933]
現実の業界では、機械学習を使ってユーザデータに基づくモデルを構築します。このような委任事項には、データだけでなく、モデルの再トレーニングにも労力が要る。データの継続的な削除とモデル再訓練のステップはスケールしませんこの課題に対処するために、textitMachine Unlearningを提案する。
論文参考訳（メタデータ） (2022-12-19T16:06:45Z)
Machine Learning for Software Engineering: A Tertiary Study [13.832268599253412]
機械学習(ML)技術は、ソフトウェアエンジニアリング(SE)ライフサイクルアクティビティの有効性を高める。 2009～2022年に発行されたML for SEで, 体系的, 品質評価, 要約, 分類を行い, 初等研究6,117件について検討した。 MLに最も取り組まれているSE領域は、ソフトウェアの品質とテストである。
論文参考訳（メタデータ） (2022-11-17T09:19:53Z)
A Survey of Machine Unlearning [56.017968863854186]
最近の規制では、要求に応じて、ユーザに関する個人情報をコンピュータシステムから削除する必要がある。 MLモデルは古いデータをよく記憶します。機械学習に関する最近の研究は、この問題を完全に解決することはできなかった。
論文参考訳（メタデータ） (2022-09-06T08:51:53Z)
Enabling Automated Machine Learning for Model-Driven AI Engineering [60.09869520679979]
モデル駆動型ソフトウェアエンジニアリングとモデル駆動型AIエンジニアリングを実現するための新しいアプローチを提案する。特に、私たちはAutomated MLをサポートし、AI集約システムの開発において、AIの深い知識のないソフトウェアエンジニアを支援します。
論文参考訳（メタデータ） (2022-03-06T10:12:56Z)
Towards Productizing AI/ML Models: An Industry Perspective from Data Scientists [10.27276267081559]
AI/MLモデルから生産可能なAIベースのシステムへの移行は、データサイエンティストとソフトウェアエンジニアの両方にとって課題です。本稿では,この移行が実践者によってどのように認識されるかを理解するため,コンサルティング会社におけるワークショップの結果を報告する。
論文参考訳（メタデータ） (2021-03-18T22:25:44Z)
Data Engineering for Everyone [1.2585165426919136]
データエンジニアリングは機械学習(ML)における最速成長分野の1つである MLは、データエンジニアの個々のチームが簡単に生成できる以上のデータを必要とします。この記事では、大規模なAI組織でも、オープンソースのデータセットが研究とイノベーションのためのロケット燃料であることを示す。
論文参考訳（メタデータ） (2021-02-23T01:24:37Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。