論文の概要: Desiderata for next generation of ML model serving
- arxiv url: http://arxiv.org/abs/2210.14665v1
- Date: Wed, 26 Oct 2022 12:29:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-27 16:00:30.900579
- Title: Desiderata for next generation of ML model serving
- Title(参考訳): 次世代MLモデルサービスのためのDesiderata
- Authors: Sherif Akoush, Andrei Paleyes, Arnaud Van Looveren and Clive Cox
- Abstract要約: 本稿では,次世代の推論プラットフォームが目指すべき重要な特徴について述べる。
包括的な設計パターンはデータ中心性であり、MLシステム操作におけるよりスマートな監視を可能にする。
- 参考スコア(独自算出の注目度): 0.34410212782758054
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference is a significant part of ML software infrastructure. Despite the
variety of inference frameworks available, the field as a whole can be
considered in its early days. This paper puts forth a range of important
qualities that next generation of inference platforms should be aiming for. We
present our rationale for the importance of each quality, and discuss ways to
achieve it in practice. An overarching design pattern is data-centricity, which
enables smarter monitoring in ML system operation.
- Abstract(参考訳): 推論はMLソフトウェアインフラの重要な部分です。
様々な推論フレームワークが利用可能であるにもかかわらず、フィールド全体が初期の段階で考慮できる。
本稿では,次世代の推論プラットフォームが目指すべき重要な品質について述べる。
我々は,各品質の重要性の理論的根拠を提示し,その実現方法について議論する。
包括的な設計パターンはデータ中心性であり、MLシステム操作におけるよりスマートな監視を可能にする。
関連論文リスト
- Matchmaker: Self-Improving Large Language Model Programs for Schema Matching [60.23571456538149]
本稿では,スキーママッチングのための合成言語モデルプログラムを提案する。
Matchmakerは、ラベル付きデモを必要とせずに、ゼロショットで自己改善する。
実証的に、Matchmakerが以前のMLベースのアプローチより優れている実世界の医療スキーママッチングベンチマークを実証する。
論文 参考訳(メタデータ) (2024-10-31T16:34:03Z) - Deciphering Cross-Modal Alignment in Large Vision-Language Models with Modality Integration Rate [118.37653302885607]
本稿では,LVLM(Large Vision Language Models)のマルチモーダル事前学習品質を示すために,MIR(Modality Integration Rate)を提案する。
MIRは、トレーニングデータ選択、トレーニング戦略スケジュール、モデルアーキテクチャ設計に重点を置いて、トレーニング前の結果を改善する。
論文 参考訳(メタデータ) (2024-10-09T17:59:04Z) - MIP-GAF: A MLLM-annotated Benchmark for Most Important Person Localization and Group Context Understanding [12.572321050617571]
社会的イベント設定において最も重要な人物(MIP)を推定することは、ラベル付きデータのコンテキスト的複雑さと不足のために難しい問題である。
我々は、画像中のMIPに関する人間の知覚を識別するために、大規模な「ワイルド」データセットに注釈を付けることで、この問題に対処することを目指している。
提案するデータセットは,次世代の社会状況理解手法を構築する上で重要な役割を果たす。
論文 参考訳(メタデータ) (2024-09-10T05:28:38Z) - A Survey on Efficient Inference for Large Language Models [25.572035747669275]
大きな言語モデル(LLM)は、様々なタスクにまたがる顕著なパフォーマンスのために、広く注目を集めている。
LLM推論のかなりの計算とメモリ要件は、リソース制約のあるシナリオへの展開に困難をもたらす。
本稿では,LLMの効率的な推論について,既存の文献を包括的に調査する。
論文 参考訳(メタデータ) (2024-04-22T15:53:08Z) - A Large-Scale Evaluation of Speech Foundation Models [110.95827399522204]
音声処理ユニバーサルパフォーマンスベンチマーク(SUPERB)を構築し,基礎モデルパラダイムの有効性について検討する。
凍結基盤モデルを用いてSUPERBにおける音声処理タスクに対処する統合マルチタスクフレームワークを提案する。
論文 参考訳(メタデータ) (2024-04-15T00:03:16Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Data-centric Operational Design Domain Characterization for Machine
Learning-based Aeronautical Products [4.8461049669050915]
機械学習(ML)に基づく航空製品のための操作設計ドメイン(ODD)の厳密な特徴付けを初めて与える。
我々は,ODDを定義するパラメータを明示的にキャプチャできる次元と,MLベースのアプリケーションが操作中に遭遇する可能性のあるデータの分類を提案する。
論文 参考訳(メタデータ) (2023-07-15T02:08:33Z) - Exploring the potential of flow-based programming for machine learning
deployment in comparison with service-oriented architectures [8.677012233188968]
理由のひとつは、データ収集と分析に関するアクティビティのために設計されていないインフラストラクチャである、と私たちは論じています。
本稿では,データストリームを用いたフローベースのプログラミングを,ソフトウェアアプリケーション構築に広く使用されるサービス指向アーキテクチャの代替として検討する。
論文 参考訳(メタデータ) (2021-08-09T15:06:02Z) - The Benchmark Lottery [114.43978017484893]
ベンチマーク宝くじ」は、機械学習ベンチマークプロセスの全体的な脆弱さを記述している。
アルゴリズムの相対的性能は、異なるベンチマークタスクを選択するだけで大幅に変化する可能性がある。
論文 参考訳(メタデータ) (2021-07-14T21:08:30Z) - Counterfactual Explanations for Machine Learning on Multivariate Time
Series Data [0.9274371635733836]
本稿では、教師付き機械学習フレームワークに対して、対実的説明を提供するための新しい説明可能性手法を提案する。
提案手法は,信頼性やロバスト性など,いくつかの異なるMLフレームワークやデータセット上での最先端の説明可能性手法よりも優れている。
論文 参考訳(メタデータ) (2020-08-25T02:04:59Z) - A Survey on Large-scale Machine Learning [67.6997613600942]
機械学習はデータに対する深い洞察を与え、マシンが高品質な予測を行うことを可能にする。
ほとんどの高度な機械学習アプローチは、大規模なデータを扱う場合の膨大な時間コストに悩まされる。
大規模機械学習は、ビッグデータからパターンを、同等のパフォーマンスで効率的に学習することを目的としている。
論文 参考訳(メタデータ) (2020-08-10T06:07:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。