論文の概要: Joint Partitioning and Placement of Foundation Models for Real-Time Edge AI
- arxiv url: http://arxiv.org/abs/2512.01039v1
- Date: Sun, 30 Nov 2025 19:16:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.553952
- Title: Joint Partitioning and Placement of Foundation Models for Real-Time Edge AI
- Title(参考訳): リアルタイムエッジAIのための基礎モデルの分割と配置
- Authors: Aladin Djuhera, Fernando Koch, Alecio Binotto,
- Abstract要約: 本稿では,基礎モデルの空間配置と内部セグメント化の両方を,実行時解決構造に高める枠組みを提案する。
我々は6Gマルチアクセスエッジコンピューティングにおける代表的なユースケースとともに、アーキテクチャとアルゴリズムのコンポーネントを紹介する。
- 参考スコア(独自算出の注目度): 43.38839324900098
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Inference over large-scale foundation models within heterogeneous edge environments necessitates a fundamentally reconfigurable orchestration substrate. Static partitioning of model layers presumes temporal stability across compute and network resources, which is misaligned with the volatility of real-world deployments. We introduce a framework in which both the spatial placement and internal segmentation of foundation models are elevated to runtime-resolved constructs. The orchestration problem is formalized as a constrained optimization over layer-wise assignments, subject to evolving latency, utilization, and privacy gradients. The framework implements reactive inference composition responsive to infrastructural fluctuations by integrating model-aware capacity profiling with dynamic graph re-partitioning and reallocation. We introduce architectural and algorithmic components, along with a representative use case in 6G multi-access edge computing.
- Abstract(参考訳): 不均一エッジ環境における大規模基盤モデルに対する推論は、根本的に再構成可能なオーケストレーション基板を必要とする。
モデルレイヤの静的パーティショニングは、計算とネットワークリソース間の時間的安定性を前提とします。
本稿では,基礎モデルの空間配置と内部セグメント化の両方を,実行時解決構造に高める枠組みを提案する。
オーケストレーション問題は、レイテンシの進化、利用、プライバシの勾配といった理由から、レイヤの割り当てに対する制約付き最適化として形式化されている。
このフレームワークは、動的グラフ分割と再配置とモデル認識キャパシティプロファイリングを統合することにより、インフラ変動に応答する反応性推論合成を実装している。
我々は6Gマルチアクセスエッジコンピューティングにおける代表的なユースケースとともに、アーキテクチャとアルゴリズムのコンポーネントを紹介する。
関連論文リスト
- Revisiting the Privacy Risks of Split Inference: A GAN-Based Data Reconstruction Attack via Progressive Feature Optimization [49.32786615205064]
Split Inference (SI)は、エッジデバイスとクラウドの間の計算を分割することで、レイテンシを低減し、ユーザのプライバシを保護する。
データ再構成攻撃(DRA)の最近の進歩は、SIで交換された中間的特徴を利用して機密入力データを復元できることを明らかにしている。
既存のDRAは一般的に浅いモデルにのみ有効であり、セマンティックな事前を十分に活用できない。
本稿では,プログレッシブ・フィーチャー・オプティマイゼーション(PFO)を用いた新しいGANベースのDRAフレームワークを提案する。
論文 参考訳(メタデータ) (2025-08-28T10:00:39Z) - Learning Time-Aware Causal Representation for Model Generalization in Evolving Domains [50.66049136093248]
動的因果要因と因果機構のドリフトを組み込んだ時間認識型構造因果モデル(SCM)を開発した。
本研究では,時間領域毎に最適な因果予測値が得られることを示す。
合成と実世界の両方のデータセットの結果から,SynCは時間的一般化性能に優れることが示された。
論文 参考訳(メタデータ) (2025-06-21T14:05:37Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - A domain decomposition-based autoregressive deep learning model for unsteady and nonlinear partial differential equations [2.7755345520127936]
非定常・非線形偏微分方程式(PDE)を正確にモデル化するためのドメイン分割型ディープラーニング(DL)フレームワークCoMLSimを提案する。
このフレームワークは、(a)畳み込みニューラルネットワーク(CNN)ベースのオートエンコーダアーキテクチャと(b)完全に接続された層で構成される自己回帰モデルという、2つの重要なコンポーネントで構成されている。
論文 参考訳(メタデータ) (2024-08-26T17:50:47Z) - Bayesian Semi-structured Subspace Inference [0.0]
半構造回帰モデルは、解釈可能な構造と複雑な非構造的特徴効果の合同モデリングを可能にする。
部分空間推論を用いた半構造化回帰モデルに対するベイズ近似を提案する。
提案手法は,シミュレーションおよび実世界のデータセット間での競合予測性能を示す。
論文 参考訳(メタデータ) (2024-01-23T18:15:58Z) - Adaptive Clustering-based Reduced-Order Modeling Framework: Fast and
accurate modeling of localized history-dependent phenomena [0.0]
本稿では,適応クラスタリングに基づくリダクション・オーダー・モデリング(ACROM)フレームワークを提案し,最近のクラスタリングに基づくリダクション・オーダー・モデル(CROM)のファミリーを大幅に改善し拡張する。
これにより、クラスタリングベースのドメイン分解は問題解全体を通して動的に進化し、関連するフィールドがより急勾配を示す領域における最適な洗練が保証される。
これは、高度に局所的な塑性と損傷現象を含む歴史に依存しない非線形問題の高速かつ正確な物質モデリングへの新たな経路を提供する。
論文 参考訳(メタデータ) (2021-09-24T11:36:58Z) - Edge-assisted Democratized Learning Towards Federated Analytics [67.44078999945722]
本稿では,エッジ支援型民主化学習機構であるEdge-DemLearnの階層的学習構造を示す。
また、Edge-DemLearnを柔軟なモデルトレーニングメカニズムとして検証し、リージョンに分散制御と集約の方法論を構築する。
論文 参考訳(メタデータ) (2020-12-01T11:46:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。