論文の概要: Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey
- arxiv url: http://arxiv.org/abs/2505.01821v1
- Date: Sat, 03 May 2025 13:55:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-06 18:49:35.285135
- Title: Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey
- Title(参考訳): 分散インテリジェンスとモデル最適化に関するエッジクラウドコラボレーションコンピューティング:サーベイ
- Authors: Jing Liu, Yao Du, Kun Yang, Yan Wang, Xiping Hu, Zehua Wang, Yang Liu, Peng Sun, Azzedine Boukerche, Victor C. M. Leung,
- Abstract要約: エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
- 参考スコア(独自算出の注目度): 59.52058740470727
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge-cloud collaborative computing (ECCC) has emerged as a pivotal paradigm for addressing the computational demands of modern intelligent applications, integrating cloud resources with edge devices to enable efficient, low-latency processing. Recent advancements in AI, particularly deep learning and large language models (LLMs), have dramatically enhanced the capabilities of these distributed systems, yet introduce significant challenges in model deployment and resource management. In this survey, we comprehensive examine the intersection of distributed intelligence and model optimization within edge-cloud environments, providing a structured tutorial on fundamental architectures, enabling technologies, and emerging applications. Additionally, we systematically analyze model optimization approaches, including compression, adaptation, and neural architecture search, alongside AI-driven resource management strategies that balance performance, energy efficiency, and latency requirements. We further explore critical aspects of privacy protection and security enhancement within ECCC systems and examines practical deployments through diverse applications, spanning autonomous driving, healthcare, and industrial automation. Performance analysis and benchmarking techniques are also thoroughly explored to establish evaluation standards for these complex systems. Furthermore, the review identifies critical research directions including LLMs deployment, 6G integration, neuromorphic computing, and quantum computing, offering a roadmap for addressing persistent challenges in heterogeneity management, real-time processing, and scalability. By bridging theoretical advancements and practical deployments, this survey offers researchers and practitioners a holistic perspective on leveraging AI to optimize distributed computing environments, fostering innovation in next-generation intelligent systems.
- Abstract(参考訳): エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代的なインテリジェントなアプリケーションの計算要求に対処し、クラウドリソースをエッジデバイスに統合して、効率的で低レイテンシな処理を実現するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきましたが、モデルデプロイメントとリソース管理において大きな課題をもたらしています。
本研究では,エッジクラウド環境における分散インテリジェンスとモデル最適化の交点を網羅的に検討し,基本的なアーキテクチャ,テクノロジの実現,新興アプリケーションに関する構造化チュートリアルを提供する。
さらに、圧縮、適応、ニューラルネットワーク探索を含むモデル最適化アプローチと、パフォーマンス、エネルギー効率、レイテンシ要求のバランスをとるAI駆動のリソース管理戦略を体系的に分析する。
さらに、ECCCシステムにおけるプライバシ保護とセキュリティ強化の重要な側面について検討し、自律運転、ヘルスケア、産業自動化にまたがる多様なアプリケーションを通じて実践的なデプロイメントを検討する。
これらの複雑なシステムの評価基準を確立するため、性能分析とベンチマーク技術も徹底的に検討されている。
さらに、LLMの展開、6G統合、ニューロモルフィックコンピューティング、量子コンピューティングを含む重要な研究方向を特定し、不均一性管理、リアルタイム処理、スケーラビリティにおける永続的な課題に対処するためのロードマップを提供する。
この調査は、理論的な進歩と実践的な展開をブリッジすることによって、AIを活用して分散コンピューティング環境を最適化し、次世代のインテリジェントシステムにおけるイノベーションを育むための総合的な視点を提供する。
関連論文リスト
- A Survey on Inference Optimization Techniques for Mixture of Experts Models [50.40325411764262]
大規模Mixture of Experts(MoE)モデルは、条件計算によるモデル容量と計算効率の向上を提供する。
これらのモデル上で推論をデプロイし実行することは、計算資源、レイテンシ、エネルギー効率において大きな課題を示す。
本調査では,システムスタック全体にわたるMoEモデルの最適化手法について分析する。
論文 参考訳(メタデータ) (2024-12-18T14:11:15Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - Reinforcement Learning for Adaptive Resource Scheduling in Complex System Environments [8.315191578007857]
そこで本研究では,Q-ラーニングに基づく新しいコンピュータシステムの性能最適化と適応型ワークロード管理スケジューリングアルゴリズムを提案する。
対照的に、強化学習アルゴリズムであるQラーニングは、システムの状態変化から継続的に学習し、動的スケジューリングとリソース最適化を可能にする。
この研究は、将来の大規模システムにおけるAI駆動適応スケジューリングの統合の基礎を提供し、システムのパフォーマンスを高め、運用コストを削減し、持続可能なエネルギー消費をサポートするスケーラブルでインテリジェントなソリューションを提供する。
論文 参考訳(メタデータ) (2024-11-08T05:58:09Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - Scalable, Distributed AI Frameworks: Leveraging Cloud Computing for
Enhanced Deep Learning Performance and Efficiency [0.0]
近年、人工知能(AI)とクラウドコンピューティングの統合は、AIアプリケーションの計算要求の増加に対処するための有望な道として現れている。
本稿では,クラウドコンピューティングを活用したスケーラブルな分散AIフレームワークの総合的研究を行い,ディープラーニングの性能向上と効率化について述べる。
論文 参考訳(メタデータ) (2023-04-26T15:38:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。