論文の概要: PLAIground: SLO-Driven Runtime Model Selection for Compound AI Systems in the Edge-Cloud-Space Continuum
- arxiv url: http://arxiv.org/abs/2606.14356v1
- Date: Fri, 12 Jun 2026 11:34:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-15 16:00:42.877891
- Title: PLAIground: SLO-Driven Runtime Model Selection for Compound AI Systems in the Edge-Cloud-Space Continuum
- Title(参考訳): PLAIground: エッジクラウド空間連続体における複合AIシステムのためのSLO駆動ランタイムモデル選択
- Authors: Milos Gravara, Cynthia Marcelino, Andrija Stanisic, Stefan Nastic,
- Abstract要約: 複合AIシステムは、正確性、レイテンシ、コストに関して、厳格なサービスレベルオブジェクト(SLO)を満たす必要があります。
既存の分散および複合AIフレームワークは、ランタイムモデル選択をサポートしない。
本稿では,複合AIシステムの実行時モデル選択を可能にするフレームワークPLAIgroundを提案する。
- 参考スコア(独自算出の注目度): 1.0499611180329804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Applications in the 3D Computing Continuum, which unifies edge, cloud, and space, require combining multiple AI tasks such as object detection, time-series analytics, and natural language processing into Compound AI systems. These systems must satisfy stringent Service Level Objectives (SLOs) on accuracy, latency, and cost. A key mechanism for maintaining SLO compliance of Compound AI systems is runtime model selection, where AI models are dynamically switched for each workflow task. However, existing distributed and compound AI frameworks do not natively support runtime model selection. We present PLAIground, a framework that enables runtime model selection for Compound AI systems. PLAIground introduces Compoundable AI Model (CAIM) abstraction, which decouples task semantics from AI model implementations via Task and Data Contracts, enabling model switching without workflow changes. Additionally, PLAIground introduces Pixie, an SLO-driven runtime model selection algorithm, which dynamically selects the most suitable model for each task during execution. Our evaluation on two realistic Compound AI workflows demonstrates that Pixie achieves up to 91.3% accuracy while maintaining SLO compliance where fixed-model strategies either violate cost and latency budgets up to 21x or miss accuracy targets by 4%.
- Abstract(参考訳): エッジ、クラウド、スペースを統一する3D Computing Continuumのアプリケーションは、オブジェクト検出、時系列分析、自然言語処理などの複数のAIタスクを複合AIシステムに統合する必要がある。
これらのシステムは、正確性、レイテンシ、コストに関して、厳密なサービスレベルオブジェクト(SLO)を満たす必要があります。
複合AIシステムのSLOコンプライアンスを維持するための重要なメカニズムは、ワークフロータスク毎にAIモデルを動的に切り替えるランタイムモデル選択である。
しかし、既存の分散複合AIフレームワークは、ランタイムモデルの選択をネイティブにサポートしていない。
本稿では,複合AIシステムの実行時モデル選択を可能にするフレームワークPLAIgroundを提案する。
PLAIgroundは、タスクセマンティクスをタスクとデータコントラクトを介してAIモデル実装から切り離し、ワークフローの変更なしにモデル切り替えを可能にする、複合型AIモデル(CAIM)抽象化を導入した。
さらにPLAIgroundは、SLO駆動のランタイムモデル選択アルゴリズムであるPixieを導入し、実行中の各タスクに最適なモデルを動的に選択する。
2つの現実的な複合AIワークフローに対する我々の評価は、PixieがSLOコンプライアンスを維持しながら最大91.3%の精度を達成したことを示している。
関連論文リスト
- Design Methodology and Performance Trade-offs Management for Distributed and Compound AI Systems [1.1470070927586018]
複合AIシステムは、明示的な制御ロジックを通じて、分散AIシステムとして複数のモデル、アルゴリズム、ツールを編成することで、このシフトを実現する。
本稿では、この空間をワークフロートポロジと構成選択という2つの次元に沿って整理し、8つのデザインパターンを識別する設計方法論を提案する。
論文 参考訳(メタデータ) (2026-06-12T11:09:57Z) - Scalable Inference Architectures for Compound AI Systems: A Production Deployment Study [0.0]
本稿では、Salesforceが開発し、複合AIユースケースをサポートするモジュール型プラットフォームに依存しない推論アーキテクチャの運用展開に関する研究について述べる。
生産結果は、テールレイテンシ(P95)が50%以上削減され、スループットが3.9倍に向上し、以前の静的デプロイメントに比べて30~40%のコスト削減が達成された。
論文 参考訳(メタデータ) (2026-04-28T14:53:11Z) - RC-NF: Robot-Conditioned Normalizing Flow for Real-Time Anomaly Detection in Robotic Manipulation [68.7948300643741]
ロボットの異常検出と介入をリアルタイムに監視するロボット・コンディションド・ノーマライゼーション・フロー(RC-NF)を提案する。
RC-NFは、正規化フロー内のタスク認識ロボットとオブジェクト状態の処理を分離する。
従来のロボットタスクの監視方法と比較して、あらゆる異常なタイプで最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2026-03-11T10:14:37Z) - Scalable, Symbiotic, AI and Non-AI Agent Based Parallel Discrete Event Simulations [0.0]
本稿では,複数のAIエージェントと非AIエージェントを組み合わせた並列離散イベントシミュレーション(PDES)手法を提案する。
我々は、4つの異なるドメインから4つの問題を解き、その結果をAIモデルだけで比較することで、我々のアプローチを評価する。
その結果,バニラモデルの精度が23%未満であるため,アプローチ全体の精度は68%であった。
論文 参考訳(メタデータ) (2025-05-28T17:50:01Z) - Automatic AI Model Selection for Wireless Systems: Online Learning via Digital Twinning [50.332027356848094]
AIベースのアプリケーションは、スケジューリングや電力制御などの機能を実行するために、インテリジェントコントローラにデプロイされる。
コンテキストとAIモデルのパラメータのマッピングは、ゼロショット方式で理想的に行われる。
本稿では,AMSマッピングのオンライン最適化のための一般的な手法を紹介する。
論文 参考訳(メタデータ) (2024-06-22T11:17:50Z) - MOSEL: Inference Serving Using Dynamic Modality Selection [4.849058875921672]
モデル品質を維持しながら、推論入力からモダリティを適応的に選択するダイナミズム、モダリティ選択という形式を導入する。
MOSELはマルチモーダルMLモデルのための自動推論システムであり,ユーザ定義の性能と精度の要求に基づいて,要求毎の入力モダリティを慎重に選択する。
論文 参考訳(メタデータ) (2023-10-27T20:50:56Z) - Fully Decentralized Model-based Policy Optimization for Networked
Systems [23.46407780093797]
本研究の目的は,モデルベース学習によるマルチエージェント制御のデータ効率の向上である。
エージェントが協力的であり、隣人とのみローカルに通信するネットワークシステムについて検討する。
提案手法では,各エージェントが将来の状態を予測し,通信によって予測をブロードキャストする動的モデルを学習し,その後,モデルロールアウトに基づいてポリシーをトレーニングする。
論文 参考訳(メタデータ) (2022-07-13T23:52:14Z) - Parallel Successive Learning for Dynamic Distributed Model Training over
Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。
我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。
我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文 参考訳(メタデータ) (2022-02-07T05:11:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。