論文の概要: High-Fidelity Network Management for Federated AI-as-a-Service: Cross-Domain Orchestration
- arxiv url: http://arxiv.org/abs/2602.15281v2
- Date: Wed, 18 Feb 2026 08:17:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 13:51:30.979403
- Title: High-Fidelity Network Management for Federated AI-as-a-Service: Cross-Domain Orchestration
- Title(参考訳): フェデレーションAI・アズ・ア・サービスのための高忠実ネットワーク管理:クロスドメインオーケストレーション
- Authors: Mohaned Chraiti, Ozgur Ercetin, Merve Saimler,
- Abstract要約: 本稿では,Tail-Risk Envelopes(TRE)に基づく保証指向AI管理プレーンを提案する。
TREは、決定論的ガードレールとレート・レイテンシ・インペアメントモデルを組み合わせた、ドメインごとの構成可能な記述子に署名される。
テナントレベルの予約は,TRE契約下でのテール遅延の増大を防止する。
- 参考スコア(独自算出の注目度): 0.12234742322758417
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To support the emergence of AI-as-a-Service (AIaaS), communication service providers (CSPs) are on the verge of a radical transformation-from pure connectivity providers to AIaaS a managed network service (control-and-orchestration plane that exposes AI models). In this model, the CSP is responsible not only for transport/communications, but also for intent-to-model resolution and joint network-compute orchestration, i.e., reliable and timely end-to-end delivery. The resulting end-to-end AIaaS service thus becomes governed by communications impairments (delay, loss) and inference impairments (latency, error). A central open problem is an operational AIaaS control-and-orchestration framework that enforces high fidelity, particularly under multi-domain federation. This paper introduces an assurance-oriented AIaaS management plane based on Tail-Risk Envelopes (TREs): signed, composable per-domain descriptors that combine deterministic guardrails with stochastic rate-latency-impairment models. Using stochastic network calculus, we derive bounds on end-to-end delay violation probabilities across tandem domains and obtain an optimization-ready risk-budget decomposition. We show that tenant-level reservations prevent bursty traffic from inflating tail latency under TRE contracts. An auditing layer then uses runtime telemetry to estimate extreme-percentile performance, quantify uncertainty, and attribute tail-risk to each domain for accountability. Packet-level Monte-Carlo simulations demonstrate improved p99.9 compliance under overload via admission control and robust tenant isolation under correlated burstiness.
- Abstract(参考訳): AI-as-a-Service(AIaaS)の出現をサポートするため、通信サービスプロバイダ(CSP)は、純粋な接続プロバイダからマネージドネットワークサービス(AIモデルを公開するコントロール・アンド・オーケストレーションプレーン)であるAIaaSへの、急進的な転換に向かっている。
このモデルでは、CSPはトランスポート/通信だけでなく、インテント・ツー・モデルの解決や、信頼性とタイムリーなエンドツーエンドの配信といった、統合されたネットワーク・コンピュート・オーケストレーションにも責任を負う。
結果として生じるエンドツーエンドのAIaaSサービスは、通信障害(遅延、損失)と推論障害(レイテンシ、エラー)によって管理される。
中心的なオープンな問題は、特にマルチドメインのフェデレーションの下で、高い忠実さを強制する運用上のAIaaSコントロールとオーケストレーションのフレームワークである。
本稿では,Tail-Risk Envelopes (TRE) に基づく保証指向のAIaaS管理プレーンを提案する。
確率的ネットワーク計算を用いて、タンデム領域にまたがるエンドツーエンド遅延違反確率の限界を導出し、最適化可能なリスク予算分解を得る。
テナントレベルの予約は,TRE契約下でのテール遅延の増大を防止する。
監査層は実行時テレメトリを使用して、極端なパフォーマンスを推定し、不確実性を定量化し、説明責任を各ドメインに割り当てる。
パッケージレベルのモンテカルロシミュレーションでは、入力制御と相関するバースト性の下での堅牢なテナント分離により、過負荷下でのp99.9のコンプライアンスが改善された。
関連論文リスト
- AI-Paging: Lease-Based Execution Anchoring for Network-Exposed AI-as-a-Service [0.13750624267664155]
6Gサービスプロバイダは、ユーザが意図のみを提出する環境でAIを公開する上で、重要な役割を果たすと想定されている。
既存の制御・ユーザプレーン機構を用いたAI-Pagingの試作を行った。
論文 参考訳(メタデータ) (2026-02-17T01:11:26Z) - Secure and Energy-Efficient Wireless Agentic AI Networks [12.588984049305866]
セキュアな無線エージェントAIネットワークは、1つのスーパーバイザーAIエージェントと、他の複数のAIエージェントで構成される。
エージェントは、協力的推論に参加するために、他のAIエージェントを動的に割り当てる。
選択されていないAIエージェントは、盗聴者の傍受性能を低下させるために友好的なジャマーとして機能する。
論文 参考訳(メタデータ) (2026-02-16T21:42:33Z) - Efficient Mixture-of-Agents Serving via Tree-Structured Routing, Adaptive Pruning, and Dependency-Aware Prefill-Decode Overlap [15.352230356342366]
混合エージェント(MoA)推論は、密度の高いエージェント間通信と低いハードウェア利用に悩まされる。
本稿では,アルゴリズム・システムの共同設計を通じて,これらのボトルネックをターゲットとしたサービス設計を提案する。
論文 参考訳(メタデータ) (2025-12-19T23:06:58Z) - QoS-Aware Hierarchical Reinforcement Learning for Joint Link Selection and Trajectory Optimization in SAGIN-Supported UAV Mobility Management [52.15690855486153]
宇宙空間統合ネットワーク (SAGIN) がユビキタスUAV接続を実現するための重要なアーキテクチャとして登場した。
本稿では,SAGINにおけるUAVモビリティ管理を制約付き多目的関節最適化問題として定式化する。
論文 参考訳(メタデータ) (2025-12-17T06:22:46Z) - Agentic DDQN-Based Scheduling for Licensed and Unlicensed Band Allocation in Sidelink Networks [37.89031907489481]
ニューラジオ(NR)サイドリンク(SL)ネットワークにおけるライセンス/ライセンスバンド割り当てのためのエージェントダブルディープQネットワーク(DDQN)スケジューラを提案する。
キャパシティを意識したQoS(Quality of Service)制約付き報酬は、静的なしきい値付けよりも目標指向のスケジューリングに適合する。
論文 参考訳(メタデータ) (2025-09-08T14:58:12Z) - The Larger the Merrier? Efficient Large AI Model Inference in Wireless Edge Networks [56.37880529653111]
大規模計算モデル(LAIM)サービスの需要は、従来のクラウドベースの推論から、低レイテンシでプライバシ保護のアプリケーションのためのエッジベースの推論へのパラダイムシフトを推進している。
本稿では,事前学習したLAIMをデバイス上のサブモデルとサーバ上のサブモデルに分割して配置するLAIM推論方式について検討する。
論文 参考訳(メタデータ) (2025-05-14T08:18:55Z) - DASA: Delay-Adaptive Multi-Agent Stochastic Approximation [64.32538247395627]
我々は,N$エージェントが並列に動作し,中央サーバと通信することで,一般的な近似問題を高速化することを目的とした設定を考える。
遅延とストラグラーの効果を軽減するために,マルチエージェント近似のための遅延適応アルゴリズムである textttDASA を提案する。
論文 参考訳(メタデータ) (2024-03-25T22:49:56Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z) - Multi-Armed Bandit Based Client Scheduling for Federated Learning [91.91224642616882]
統合学習(FL)は、通信オーバーヘッドの低減やデータのプライバシの保護など、ユビキタスな特性を特徴とする。
FLの各通信ラウンドでは、クライアントは自身のデータに基づいてローカルモデルを更新し、無線チャネル経由でローカル更新をアップロードする。
本研究は、無線チャネルの状態情報やクライアントの統計的特性を知ることなく、FLにおけるオンラインクライアントスケジューリング(CS)のためのマルチアームバンディットベースのフレームワークを提供する。
論文 参考訳(メタデータ) (2020-07-05T12:32:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。