論文の概要: Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey
- arxiv url: http://arxiv.org/abs/2505.01821v3
- Date: Tue, 12 Aug 2025 16:02:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-13 18:56:18.57629
- Title: Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey
- Title(参考訳): 分散インテリジェンスとモデル最適化に関するエッジクラウドコラボレーションコンピューティング:サーベイ
- Authors: Jing Liu, Yao Du, Kun Yang, Jiaqi Wu, Yan Wang, Xiping Hu, Zehua Wang, Yang Liu, Peng Sun, Azzedine Boukerche, Victor C. M. Leung,
- Abstract要約: エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
- 参考スコア(独自算出の注目度): 58.50944604905037
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge-cloud collaborative computing (ECCC) has emerged as a pivotal paradigm for addressing the computational demands of modern intelligent applications, integrating cloud resources with edge devices to enable efficient, low-latency processing. Recent advancements in AI, particularly deep learning and large language models (LLMs), have dramatically enhanced the capabilities of these distributed systems, yet introduce significant challenges in model deployment and resource management. In this survey, we comprehensive examine the intersection of distributed intelligence and model optimization within edge-cloud environments, providing a structured tutorial on fundamental architectures, enabling technologies, and emerging applications. Additionally, we systematically analyze model optimization approaches, including compression, adaptation, and neural architecture search, alongside AI-driven resource management strategies that balance performance, energy efficiency, and latency requirements. We further explore critical aspects of privacy protection and security enhancement within ECCC systems and examines practical deployments through diverse applications, spanning autonomous driving, healthcare, and industrial automation. Performance analysis and benchmarking techniques are also thoroughly explored to establish evaluation standards for these complex systems. Furthermore, the review identifies critical research directions including LLMs deployment, 6G integration, neuromorphic computing, and quantum computing, offering a roadmap for addressing persistent challenges in heterogeneity management, real-time processing, and scalability. By bridging theoretical advancements and practical deployments, this survey offers researchers and practitioners a holistic perspective on leveraging AI to optimize distributed computing environments, fostering innovation in next-generation intelligent systems.
- Abstract(参考訳): エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代的なインテリジェントなアプリケーションの計算要求に対処し、クラウドリソースをエッジデバイスに統合して、効率的で低レイテンシな処理を実現するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきましたが、モデルデプロイメントとリソース管理において大きな課題をもたらしています。
本研究では,エッジクラウド環境における分散インテリジェンスとモデル最適化の交点を網羅的に検討し,基本的なアーキテクチャ,テクノロジの実現,新興アプリケーションに関する構造化チュートリアルを提供する。
さらに、圧縮、適応、ニューラルネットワーク探索を含むモデル最適化アプローチと、パフォーマンス、エネルギー効率、レイテンシ要求のバランスをとるAI駆動のリソース管理戦略を体系的に分析する。
さらに、ECCCシステムにおけるプライバシ保護とセキュリティ強化の重要な側面について検討し、自律運転、ヘルスケア、産業自動化にまたがる多様なアプリケーションを通じて実践的なデプロイメントを検討する。
これらの複雑なシステムの評価基準を確立するため、性能分析とベンチマーク技術も徹底的に検討されている。
さらに、LLMの展開、6G統合、ニューロモルフィックコンピューティング、量子コンピューティングを含む重要な研究方向を特定し、不均一性管理、リアルタイム処理、スケーラビリティにおける永続的な課題に対処するためのロードマップを提供する。
この調査は、理論的な進歩と実践的な展開をブリッジすることによって、AIを活用して分散コンピューティング環境を最適化し、次世代のインテリジェントシステムにおけるイノベーションを育むための総合的な視点を提供する。
関連論文リスト
- INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization [43.37351326629751]
インネットワークAI(In-network AI)は、ネットワークインフラストラクチャにおける人工知能(AI)のエスカレート要求に対処するための、変革的なアプローチである。
本稿では,AIのためのネットワーク内計算の最適化に関する包括的な分析を行う。
リソース制約のあるネットワークデバイスにAIモデルをマッピングするための方法論を調べ、メモリや計算能力の制限といった課題に対処する。
論文 参考訳(メタデータ) (2025-05-30T06:47:55Z) - Onboard Optimization and Learning: A Survey [10.511932152633253]
オンボード学習は、エッジAIにおける変革的なアプローチであり、リソース制約のあるデバイス上で、リアルタイムデータ処理、意思決定、適応モデルのトレーニングを可能にする。
しかし、オンボード学習は、限られた計算リソース、高い推論コスト、セキュリティ脆弱性といった課題に直面している。
本調査では,モデル効率の最適化,推論の高速化,分散デバイス間の協調学習を支援する技術について検討する。
論文 参考訳(メタデータ) (2025-05-07T07:47:14Z) - Intelligent Offloading in Vehicular Edge Computing: A Comprehensive Review of Deep Reinforcement Learning Approaches and Architectures [9.21746609806009]
インテリジェントトランスポーテーションシステム(ITS)の複雑さは、エッジサーバ、車両ノード、UAVなどの外部インフラストラクチャへの計算オフロードに大きな関心を惹き付けている。
深部強化学習(DRL)による車両エッジコンピューティング(VEC)用オフロードの最近の進歩
学習パラダイム(シングルエージェント、マルチエージェントなど)、システムアーキテクチャ(集中型、分散型、階層型)、最適化目標(レイテンシ、エネルギー、公正性など)に基づいて、既存の作業の分類と比較を行う。
論文 参考訳(メタデータ) (2025-02-10T19:02:20Z) - A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments [8.315191578007857]
そこで本研究では,Q-ラーニングに基づく新しいコンピュータシステムの性能最適化と適応型ワークロード管理スケジューリングアルゴリズムを提案する。
対照的に、強化学習アルゴリズムであるQラーニングは、システムの状態変化から継続的に学習し、動的スケジューリングとリソース最適化を可能にする。
この研究は、将来の大規模システムにおけるAI駆動適応スケジューリングの統合の基礎を提供し、システムのパフォーマンスを高め、運用コストを削減し、持続可能なエネルギー消費をサポートするスケーラブルでインテリジェントなソリューションを提供する。
論文 参考訳(メタデータ) (2024-11-08T05:58:09Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Scalable, Distributed AI Frameworks: Leveraging Cloud Computing for
Enhanced Deep Learning Performance and Efficiency [0.0]
近年、人工知能(AI)とクラウドコンピューティングの統合は、AIアプリケーションの計算要求の増加に対処するための有望な道として現れている。
本稿では,クラウドコンピューティングを活用したスケーラブルな分散AIフレームワークの総合的研究を行い,ディープラーニングの性能向上と効率化について述べる。
論文 参考訳(メタデータ) (2023-04-26T15:38:00Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。