論文の概要: Towards an Efficient ML System: Unveiling a Trade-off between Task
Accuracy and Engineering Efficiency in a Large-scale Car Sharing Platform
- arxiv url: http://arxiv.org/abs/2210.06585v1
- Date: Mon, 10 Oct 2022 15:40:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-14 14:48:44.026342
- Title: Towards an Efficient ML System: Unveiling a Trade-off between Task
Accuracy and Engineering Efficiency in a Large-scale Car Sharing Platform
- Title(参考訳): 効率的なmlシステムを目指して:大規模カーシェアリングプラットフォームにおけるタスク精度とエンジニアリング効率のトレードオフを明らかにする
- Authors: Kyung Ho Park, Hyunhee Chung, and Soonwoo Kwon
- Abstract要約: 本稿では,実践者のドメインに存在する多数のデータセット,分類器,配布外検知器,予測テーブルを単一のMLに記述する,テキスト効率中心型MLシステムを提案する。
実世界のカーシェアリングプラットフォームにおける様々な画像認識タスクの下で、提案システムの構築と、この旅から学んだ教訓について検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Upon the significant performance of the supervised deep neural networks,
conventional procedures of developing ML system are \textit{task-centric},
which aims to maximize the task accuracy. However, we scrutinized this
\textit{task-centric} ML system lacks in engineering efficiency when the ML
practitioners solve multiple tasks in their domain. To resolve this problem, we
propose an \textit{efficiency-centric} ML system that concatenates numerous
datasets, classifiers, out-of-distribution detectors, and prediction tables
existing in the practitioners' domain into a single ML pipeline. Under various
image recognition tasks in the real world car-sharing platform, our study
illustrates how we established the proposed system and lessons learned from
this journey as follows. First, the proposed ML system accomplishes supreme
engineering efficiency while achieving a competitive task accuracy. Moreover,
compared to the \textit{task-centric} paradigm, we discovered that the
\textit{efficiency-centric} ML system yields satisfactory prediction results on
multi-labelable samples, which frequently exist in the real world. We analyze
these benefits derived from the representation power, which learned broader
label spaces from the concatenated dataset. Last but not least, our study
elaborated how we deployed this \textit{efficiency-centric} ML system is
deployed in the real world live cloud environment. Based on the proposed
analogies, we highly expect that ML practitioners can utilize our study to
elevate engineering efficiency in their domain.
- Abstract(参考訳): 教師付きディープニューラルネットワークの大幅な性能向上に伴い、従来のmlシステムの開発手順は、タスク精度の最大化を目的とした \textit{task-centric} である。
しかし、この‘textit{task-centric} MLシステムは、ML実践者がドメイン内の複数のタスクを解決する際に、エンジニアリング効率に欠ける。
この問題を解決するために,実践者のドメインに存在する多数のデータセット,分類器,アウト・オブ・ディストリビューション・ディテクタ,予測テーブルを単一のMLパイプラインに結合する,‘textit{efficiency-centric} MLシステムを提案する。
実世界のカーシェアリングプラットフォームにおける様々な画像認識タスクにおいて、提案システムの構築方法と、この旅から学んだ教訓を以下に示す。
まず,提案するMLシステムは,競争力のあるタスク精度を達成しつつ,最高のエンジニアリング効率を達成する。
さらに, \textit{task-centric}パラダイムと比較して,実世界で頻繁に存在するマルチラベルサンプルに対して, \textit{efficiency-centric} mlシステムが十分な予測結果をもたらすことを見出した。
これらの利点は、連結されたデータセットからより広いラベル空間を学習した表現力に由来する。
最後に、私たちの研究は、この \textit{efficiency-centric} mlシステムが現実世界のクラウド環境にどのようにデプロイされているかを詳しく説明したものです。
提案したアナロジーに基づいて,機械学習の実践者が,その領域における工学的効率を高めるために,我々の研究を活用できることを強く期待する。
関連論文リスト
- Efficient Multimodal Large Language Models: A Survey [60.7614299984182]
MLLM(Multimodal Large Language Models)は、視覚的質問応答、視覚的理解、推論などのタスクにおいて顕著な性能を示す。
モデルサイズと高いトレーニングと推論コストが、MLLMのアカデミックや産業への応用を妨げている。
本調査は,効率的なMLLMの現状を包括的かつ体系的に概観するものである。
論文 参考訳(メタデータ) (2024-05-17T12:37:10Z) - Characterization of Large Language Model Development in the Datacenter [55.9909258342639]
大きな言語モデル(LLM)は、いくつかの変換タスクにまたがって素晴らしいパフォーマンスを示している。
しかし,大規模クラスタ資源を効率よく利用してLCMを開発することは容易ではない。
我々は,GPUデータセンタAcmeから収集した6ヶ月のLDM開発ワークロードの詳細な評価を行った。
論文 参考訳(メタデータ) (2024-03-12T13:31:14Z) - LLM Inference Unveiled: Survey and Roofline Model Insights [62.92811060490876]
大規模言語モデル(LLM)推論は急速に進化しており、機会と課題のユニークなブレンドを提示している。
本調査は, 研究状況を要約するだけでなく, 屋上モデルに基づく枠組みを導入することによって, 従来の文献レビューから際立っている。
このフレームワークは、ハードウェアデバイスにLSMをデプロイする際のボトルネックを特定し、実用上の問題を明確に理解する。
論文 参考訳(メタデータ) (2024-02-26T07:33:05Z) - Distribution Matching for Multi-Task Learning of Classification Tasks: a
Large-Scale Study on Faces & Beyond [62.406687088097605]
マルチタスク学習(MTL)は、複数の関連するタスクを共同で学習し、共有表現空間から恩恵を受けるフレームワークである。
MTLは、ほとんど重複しない、あるいは重複しないアノテーションで分類タスクで成功することを示す。
本稿では,分散マッチングによるタスク間の知識交換を可能にする新しい手法を提案する。
論文 参考訳(メタデータ) (2024-01-02T14:18:11Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - Understanding the Complexity and Its Impact on Testing in ML-Enabled
Systems [8.630445165405606]
世界中の企業で広く採用されている産業対話システムであるRasa 3.0について検討する。
私たちのゴールは、このような大規模なML対応システムの複雑さを特徴づけ、テストにおける複雑さの影響を理解することです。
本研究は,ML対応システムにおけるソフトウェア工学の実践的意義を明らかにする。
論文 参考訳(メタデータ) (2023-01-10T08:13:24Z) - Truthful Meta-Explanations for Local Interpretability of Machine
Learning Models [10.342433824178825]
本稿では,忠実度に基づく計量である真理度測定に基づいて,局所的メタ説明手法を提案する。
本研究は,すべての概念を具体的に定義し,実験を通じて,技術と計量の両立を実証する。
論文 参考訳(メタデータ) (2022-12-07T08:32:04Z) - Towards Perspective-Based Specification of Machine Learning-Enabled
Systems [1.3406258114080236]
本稿では、ML対応システムを特定するための視点に基づくアプローチに向けた取り組みについて述べる。
このアプローチでは、目標、ユーザエクスペリエンス、インフラストラクチャ、モデル、データという5つの視点にグループ化された45のML関心事のセットを分析する。
本論文の主な貢献は、ML対応システムを特定するのに役立つ2つの新しいアーティファクトを提供することである。
論文 参考訳(メタデータ) (2022-06-20T13:09:23Z) - Towards Intelligent Load Balancing in Data Centers [0.5505634045241288]
本稿では,機械学習とネットワークシステムのギャップを埋めるため,Aquariusを提案する。
オフラインデータ分析とオンラインモデル展開の両方を現実的なシステムで実行する能力を示している。
論文 参考訳(メタデータ) (2021-10-27T12:47:30Z) - Characterizing and Detecting Mismatch in Machine-Learning-Enabled
Systems [1.4695979686066065]
機械学習システムの開発と展開は依然として課題だ。
本論文では,エンドツーエンドのML対応システム開発における知見とその意義について報告する。
論文 参考訳(メタデータ) (2021-03-25T19:40:29Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。