論文の概要: Desiderata for next generation of ML model serving
- arxiv url: http://arxiv.org/abs/2210.14665v1
- Date: Wed, 26 Oct 2022 12:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 16:00:30.900579
- Title: Desiderata for next generation of ML model serving
- Title(参考訳): 次世代MLモデルサービスのためのDesiderata
- Authors: Sherif Akoush, Andrei Paleyes, Arnaud Van Looveren and Clive Cox
- Abstract要約: 本稿では,次世代の推論プラットフォームが目指すべき重要な特徴について述べる。
包括的な設計パターンはデータ中心性であり、MLシステム操作におけるよりスマートな監視を可能にする。
- 参考スコア(独自算出の注目度): 0.34410212782758054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference is a significant part of ML software infrastructure. Despite the
variety of inference frameworks available, the field as a whole can be
considered in its early days. This paper puts forth a range of important
qualities that next generation of inference platforms should be aiming for. We
present our rationale for the importance of each quality, and discuss ways to
achieve it in practice. An overarching design pattern is data-centricity, which
enables smarter monitoring in ML system operation.
- Abstract(参考訳): 推論はMLソフトウェアインフラの重要な部分です。
様々な推論フレームワークが利用可能であるにもかかわらず、フィールド全体が初期の段階で考慮できる。
本稿では,次世代の推論プラットフォームが目指すべき重要な品質について述べる。
我々は,各品質の重要性の理論的根拠を提示し,その実現方法について議論する。
包括的な設計パターンはデータ中心性であり、MLシステム操作におけるよりスマートな監視を可能にする。
関連論文リスト
- Rethinking Word-Level Auto-Completion in Computer-Aided Translation [76.34184928621477]
Word-Level Auto-Completion (WLAC) はコンピュータ翻訳において重要な役割を果たす。
それは、人間の翻訳者に対して単語レベルの自動補完提案を提供することを目的としている。
我々は、この質問に答えるために測定可能な基準を導入し、既存のWLACモデルがこの基準を満たしていないことを発見する。
評価基準の遵守を促進することによってWLAC性能を向上させる効果的な手法を提案する。
論文 参考訳(メタデータ) (2023-10-23T03:11:46Z) - Stochastic Deep Koopman Model for Quality Propagation Analysis in
Multistage Manufacturing Systems [1.178566843877027]
本研究では、MMSの複雑な振る舞いをモデル化するための深いクープマン(SDK)フレームワークを紹介する。
本稿では,変分オートエンコーダから抽出した臨界品質情報を伝搬するクープマン演算子の新たな応用法を提案する。
論文 参考訳(メタデータ) (2023-09-18T22:53:17Z) - Data-centric Operational Design Domain Characterization for Machine
Learning-based Aeronautical Products [4.8461049669050915]
機械学習(ML)に基づく航空製品のための操作設計ドメイン(ODD)の厳密な特徴付けを初めて与える。
我々は,ODDを定義するパラメータを明示的にキャプチャできる次元と,MLベースのアプリケーションが操作中に遭遇する可能性のあるデータの分類を提案する。
論文 参考訳(メタデータ) (2023-07-15T02:08:33Z) - A Survey on Large Language Models for Recommendation [80.01023231943205]
大規模言語モデル(LLM)は自然言語処理(NLP)の分野で強力なツールとして登場した。
本調査では,これらのモデルを2つの主要なパラダイム(DLLM4Rec)とジェネレーティブLSM4Rec(GLLM4Rec)に分類する。
論文 参考訳(メタデータ) (2023-05-31T13:51:26Z) - Optimal Event Monitoring through Internet Mashup over Multivariate Time
Series [77.34726150561087]
このフレームワークは、モデル定義、クエリ、パラメータ学習、モデル評価、データ監視、決定レコメンデーション、Webポータルのサービスをサポートする。
さらに、MTSAデータモデルとクエリ言語を拡張して、学習、監視、レコメンデーションのサービスにおいて、この種の問題をサポートする。
論文 参考訳(メタデータ) (2022-10-18T16:56:17Z) - Exploring the potential of flow-based programming for machine learning
deployment in comparison with service-oriented architectures [8.677012233188968]
理由のひとつは、データ収集と分析に関するアクティビティのために設計されていないインフラストラクチャである、と私たちは論じています。
本稿では,データストリームを用いたフローベースのプログラミングを,ソフトウェアアプリケーション構築に広く使用されるサービス指向アーキテクチャの代替として検討する。
論文 参考訳(メタデータ) (2021-08-09T15:06:02Z) - The Benchmark Lottery [114.43978017484893]
ベンチマーク宝くじ」は、機械学習ベンチマークプロセスの全体的な脆弱さを記述している。
アルゴリズムの相対的性能は、異なるベンチマークタスクを選択するだけで大幅に変化する可能性がある。
論文 参考訳(メタデータ) (2021-07-14T21:08:30Z) - AutonoML: Towards an Integrated Framework for Autonomous Machine
Learning [9.356870107137095]
Reviewは、自動化された自動MLシステムを構成するものに関して、より広範な視点を動機付けようとしている。
その上で、以下の研究領域の開発状況を調査します。
我々は、各トピックによって拡張されたレビューを通して概念的枠組みを開発し、高レベルなメカニズムを自律mlシステムに融合する方法を1つ紹介する。
論文 参考訳(メタデータ) (2020-12-23T11:01:10Z) - Counterfactual Explanations for Machine Learning on Multivariate Time
Series Data [0.9274371635733836]
本稿では、教師付き機械学習フレームワークに対して、対実的説明を提供するための新しい説明可能性手法を提案する。
提案手法は,信頼性やロバスト性など,いくつかの異なるMLフレームワークやデータセット上での最先端の説明可能性手法よりも優れている。
論文 参考訳(メタデータ) (2020-08-25T02:04:59Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z) - Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。
Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。
大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文 参考訳(メタデータ) (2020-06-15T22:22:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。