論文の概要: Embodied Foundation Models at the Edge: A Survey of Deployment Constraints and Mitigation Strategies
- arxiv url: http://arxiv.org/abs/2603.16952v1
- Date: Mon, 16 Mar 2026 21:27:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.298935
- Title: Embodied Foundation Models at the Edge: A Survey of Deployment Constraints and Mitigation Strategies
- Title(参考訳): Embodied Foundation Models at the Edge:A Survey of Deployment Constraints and Mitigation Strategies
- Authors: Utkarsh Grover, Ravi Ranjan, Mingyang Mao, Trung Tien Dong, Satvik Praveen, Zhenqi Wu, J. Morris Chang, Tinoosh Mohsenin, Yi Sheng, Agoritsa Polyzou, Eiman Kanjo, Xiaomin Lin,
- Abstract要約: Deployment Gauntletは制約を8つの結合バリアにまとめる。
信頼性の高いデプロイメントは、メモリ、スケジューリング、通信、モデルアーキテクチャ間のシステムレベルの共同設計に依存します。
- 参考スコア(独自算出の注目度): 3.4385853021313593
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deploying foundation models in embodied edge systems is fundamentally a systems problem, not just a problem of model compression. Real-time control must operate within strict size, weight, and power constraints, where memory traffic, compute latency, timing variability, and safety margins interact directly. The Deployment Gauntlet organizes these constraints into eight coupled barriers that determine whether embodied foundation models can run reliably in practice. Across representative edge workloads, autoregressive Vision-Language-Action policies are constrained primarily by memory bandwidth, whereas diffusion-based controllers are limited more by compute latency and sustained execution cost. Reliable deployment therefore depends on system-level co-design across memory, scheduling, communication, and model architecture, including decompositions that separate fast control from slower semantic reasoning.
- Abstract(参考訳): 実装されたエッジシステムに基礎モデルを配置することは、基本的にはシステムの問題であり、単にモデル圧縮の問題ではない。
リアルタイム制御は、メモリトラフィック、計算レイテンシ、タイミング変数、安全性マージンが直接対話する、厳格なサイズ、重み、電力制限内で動作する必要がある。
Deployment Gauntletは,これらの制約を8つの結合バリアにまとめて,具体的基盤モデルが実際に確実に動作可能であるかどうかを判断する。
代表的エッジワークロード全体にわたって、自動回帰視覚ランゲージ・アクションポリシーは、主にメモリ帯域幅によって制約されるが、拡散ベースのコントローラは、計算レイテンシと持続実行コストによって制限される。
そのため、信頼性の高いデプロイメントは、メモリ、スケジューリング、通信、モデルアーキテクチャをまたいだシステムレベルの協調設計に依存します。
関連論文リスト
- BarrierSteer: LLM Safety via Learning Barrier Steering [83.12893815611052]
BarrierSteerは、学習した非線形安全性制約を直接モデルの潜在表現空間に埋め込むことで、安全性を形式化する新しいフレームワークである。
BarrierSteerは、敵の成功率を大幅に低下させ、安全でない世代を減少させ、既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2026-02-23T18:19:46Z) - Efficient Coordination with the System-Level Shared State: An Embodied-AI Native Modular Framework [5.833654928445309]
本稿では,デカップリングと明示的なシステムレベルのプリミティブを実現するモジュール型フレームワークANCHORを提案する。
ANCHORは、(i)標準化された共有状態の進化可能な契約であるCanonical Recordsを、(ii)多対多の普及とフィードバック指向の調整のための通信バスから分離する。
論文 参考訳(メタデータ) (2026-01-20T13:21:52Z) - R-ConstraintBench: Evaluating LLMs on NP-Complete Scheduling [0.0]
R-ConstraintBenchは、資源制約計画スケジューリング問題(RCPSP)のモデルを評価するフレームワークである。
データセンターのマイグレーション設定でベンチマークをインスタンス化し、実行可能性とエラー分析を用いて複数のLCMを評価する。
実証的には、強いモデルは優先順位のみのDAGでほぼシーリングされるが、ダウンタイム、時間的ウィンドウ、および解離的制約が相互作用すると、実現可能性のパフォーマンスは低下する。
論文 参考訳(メタデータ) (2025-08-21T03:35:58Z) - CSGO: Generalized Optimization for Cold Start in Wireless Collaborative Edge LLM Systems [62.24576366776727]
本稿では,全体の推論遅延を最小限に抑えるために,遅延を考慮したスケジューリングフレームワークを提案する。
提案手法は,ベースライン戦略と比較して,コールドスタート遅延を著しく低減することを示す。
論文 参考訳(メタデータ) (2025-08-15T07:49:22Z) - COMponent-Aware Pruning for Accelerated Control Tasks in Latent Space Models [1.6874375111244326]
資源制約のあるモバイルプラットフォームの急速な成長により、計算効率の良いニューラルネットワークコントローラ(NNC)の需要が高まっている。
ディープニューラルネットワーク(DNN)は、制御アプリケーションにおいて優れたパフォーマンスを示し、その相当な計算複雑性とメモリ要件は、エッジデバイスへの実践的なデプロイに重大な障壁をもたらす。
本稿では,各プルーニング群に対する最適プルーニングサイズを決定するために,コンポーネント認識型構造化プルーニングを利用した包括的モデル圧縮手法を提案する。
論文 参考訳(メタデータ) (2025-08-11T16:16:51Z) - UniConFlow: A Unified Constrained Generalization Framework for Certified Motion Planning with Flow Matching Models [16.275286046169594]
生成モデルはロボットモーション生成の強力なツールとなり、様々なタスクで柔軟で多モーダルな軌道生成を可能にしている。
本論文では,同一性制約と不等式制約の両方を体系的に組み込んだトラジェクトリ生成のための統一フローマッチングフレームワークUniConFlowを提案する。
我々は移動ナビゲーションと高次元操作タスクを行い、最先端の制約付き生成プランナと比較して安全性と実現可能性の向上を図っている。
論文 参考訳(メタデータ) (2025-06-03T14:48:04Z) - Enforcing Hard Linear Constraints in Deep Learning Models with Decision Rules [8.098452803458253]
本稿では、入力依存線形等式とニューラルネットワーク出力の不等式制約を強制するモデルに依存しないフレームワークを提案する。
このアーキテクチャは、予測精度のために訓練されたタスクネットワークと、実行時の決定ルールと堅牢な最適化を用いてトレーニングされた安全なネットワークを組み合わせることで、入力空間全体の実現可能性を保証する。
論文 参考訳(メタデータ) (2025-05-20T03:09:44Z) - Diffusion Predictive Control with Constraints [51.91057765703533]
拡散予測制御(Diffusion predictive control with constraints,DPCC)は、拡散に基づく制御のアルゴリズムである。
DPCCは,新しいテスト時間制約を満たすために,既存の手法よりも優れた性能を示すロボットマニピュレータのシミュレーションを通して示す。
論文 参考訳(メタデータ) (2024-12-12T15:10:22Z) - Temporal Feature Matters: A Framework for Diffusion Model Quantization [105.3033493564844]
拡散モデルはマルチラウンド・デノナイジングの時間ステップに依存している。
3つの戦略を含む新しい量子化フレームワークを導入する。
このフレームワークは時間情報のほとんどを保存し、高品質なエンドツーエンド生成を保証する。
論文 参考訳(メタデータ) (2024-07-28T17:46:15Z) - Adaptive Subcarrier, Parameter, and Power Allocation for Partitioned
Edge Learning Over Broadband Channels [69.18343801164741]
パーティショニングエッジ学習(PARTEL)は、無線ネットワークにおいてよく知られた分散学習手法であるパラメータサーバトレーニングを実装している。
本稿では、いくつかの補助変数を導入してParticleELを用いてトレーニングできるディープニューラルネットワーク(DNN)モデルについて考察する。
論文 参考訳(メタデータ) (2020-10-08T15:27:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。