論文の概要: ACE: Towards Application-Centric Edge-Cloud Collaborative Intelligence
- arxiv url: http://arxiv.org/abs/2203.13061v1
- Date: Thu, 24 Mar 2022 13:12:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 14:59:32.837974
- Title: ACE: Towards Application-Centric Edge-Cloud Collaborative Intelligence
- Title(参考訳): ACE: アプリケーション中心のエッジクラウドコラボレーションインテリジェンスを目指す
- Authors: Luhui Wang, Cong Zhao, Shusen Yang, Xinyu Yang, Julie McCann
- Abstract要約: 機械学習に基づくインテリジェントなアプリケーションは、私たちの生活の多くの部分に影響を与えています。
クラウドで実行されている現在の実装は、これらの制約をすべて満たすことができない。
エッジクラウドコラボレーションインテリジェンス(Edge-Cloud Collaborative Intelligence)パラダイムは、このような問題に対処するための一般的なアプローチとなっている。
- 参考スコア(独自算出の注目度): 14.379967483688834
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Intelligent applications based on machine learning are impacting many parts
of our lives. They are required to operate under rigorous practical constraints
in terms of service latency, network bandwidth overheads, and also privacy. Yet
current implementations running in the Cloud are unable to satisfy all these
constraints. The Edge-Cloud Collaborative Intelligence (ECCI) paradigm has
become a popular approach to address such issues, and rapidly increasing
applications are developed and deployed. However, these prototypical
implementations are developer-dependent and scenario-specific without
generality, which cannot be efficiently applied in large-scale or to general
ECC scenarios in practice, due to the lack of supports for infrastructure
management, edge-cloud collaborative service, complex intelligence workload,
and efficient performance optimization. In this article, we systematically
design and construct the first unified platform, ACE, that handles
ever-increasing edge and cloud resources, user-transparent services, and
proliferating intelligence workloads with increasing scale and complexity, to
facilitate cost-efficient and high-performing ECCI application development and
deployment. For verification, we explicitly present the construction process of
an ACE-based intelligent video query application, and demonstrate how to
achieve customizable performance optimization efficiently. Based on our initial
experience, we discuss both the limitations and vision of ACE to shed light on
promising issues to elaborate in the approaching ECCI ecosystem.
- Abstract(参考訳): 機械学習に基づくインテリジェントなアプリケーションは、私たちの生活の多くの部分に影響を与えています。
サービスレイテンシやネットワーク帯域のオーバーヘッド、プライバシといった面では、厳格な実践的な制約の下で運用することが求められます。
しかし、クラウドで実行されている現在の実装は、これらの制約をすべて満たすことができない。
エッジクラウドコラボレーションインテリジェンス(ECCI)パラダイムは、このような問題に対処するための一般的なアプローチとなり、急速に増加するアプリケーションが開発され、デプロイされる。
しかしながら,これらのプロトタイプ実装は,インフラストラクチャ管理やエッジクラウド協調サービス,複雑なインテリジェンスワークロード,効率的なパフォーマンス最適化といったサポートが欠如しているため,大規模あるいは一般のECCシナリオでは効率的に適用できない,一般性のない,開発者依存かつシナリオ固有である。
この記事では、コスト効率と高性能なECCIアプリケーション開発とデプロイメントを容易にするため、エッジとクラウドリソースの継続的な増加、ユーザ透過型サービス、およびスケールと複雑さの増大によるインテリジェンスワークロードの増大を扱う、最初の統合プラットフォームであるACEを体系的に設計し、構築する。
検証のために、ACEベースのインテリジェントなビデオクエリアプリケーションの構築プロセスを明示的に提示し、より効率的にカスタマイズ可能なパフォーマンス最適化を実現する方法を示す。
最初の経験に基づいて、近日中のECCIエコシステムにおいて、期待できる問題に光を当てるためのACEの限界とビジョンを議論する。
関連論文リスト
- Inference Optimization of Foundation Models on AI Accelerators [68.24450520773688]
トランスフォーマーアーキテクチャを備えた大規模言語モデル(LLM)を含む強力な基礎モデルは、ジェネレーティブAIの新たな時代を支えている。
モデルパラメータの数が数十億に達すると、実際のシナリオにおける推論コストと高いレイテンシーが排除される。
このチュートリアルでは、AIアクセラレータを用いた補完推論最適化テクニックに関する包括的な議論を行っている。
論文 参考訳(メタデータ) (2024-07-12T09:24:34Z) - LAECIPS: Large Vision Model Assisted Adaptive Edge-Cloud Collaboration for IoT-based Perception System [24.84622024011103]
大規模モデルの共同推論によるエッジクラウドのコラボレーションは、高い推論精度と低レイテンシを実現するための有望なアプローチを提供する。
既存のエッジクラウドコラボレーションメソッドはモデルアーキテクチャと密結合されており、異種IoT環境での動的データドリフトに適応できない。
LAECIPSでは、クラウド上の大きなビジョンモデルとエッジ上の軽量モデルの両方がプラグアンドプレイである。我々は、高い精度と低レイテンシの両方に最適化されたハードインプットマイニングに基づくエッジクラウドコラボレーション戦略を設計する。
論文 参考訳(メタデータ) (2024-04-16T12:12:06Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - VEDLIoT -- Next generation accelerated AIoT systems and applications [4.964750143168832]
VEDLIoTプロジェクトは、分散人工知能(AIoT)アプリケーションのためのエネルギー効率のよいディープラーニング方法論の開発を目指している。
我々は,AIoTシステムに固有の安全性とセキュリティ問題に対処しながら,アルゴリズムの最適化に重点を置いた総合的なアプローチを提案する。
論文 参考訳(メタデータ) (2023-05-09T12:35:00Z) - The Internet of Senses: Building on Semantic Communications and Edge
Intelligence [67.75406096878321]
インターネット・オブ・センセーズ(IoS)は、すべてのヒト受容体に対する欠陥のないテレプレゼンススタイルのコミュニケーションを約束する。
我々は,新たなセマンティックコミュニケーションと人工知能(AI)/機械学習(ML)パラダイムがIoSユースケースの要件を満たす方法について詳しく述べる。
論文 参考訳(メタデータ) (2022-12-21T03:37:38Z) - MCDS: AI Augmented Workflow Scheduling in Mobile Edge Cloud Computing
Systems [12.215537834860699]
近年,エッジコンピューティングプラットフォームの低応答時間を利用してアプリケーション品質・オブ・サービス(QoS)を最適化するスケジューリング手法が提案されている。
本稿では,Deep Surrogate Models を用いたモンテカルロ学習を用いて,モバイルエッジクラウドコンピューティングシステムにおけるワークフローアプリケーションを効率的にスケジューリングする手法を提案する。
論文 参考訳(メタデータ) (2021-12-14T10:00:01Z) - Auto-Split: A General Framework of Collaborative Edge-Cloud AI [49.750972428032355]
本稿では,Huawei Cloudのエッジクラウド共同プロトタイプであるAuto-Splitの技法と技術実践について述べる。
私たちの知る限りでは、Deep Neural Network(DNN)分割機能を提供する既存の産業製品はありません。
論文 参考訳(メタデータ) (2021-08-30T08:03:29Z) - Reproducible Performance Optimization of Complex Applications on the
Edge-to-Cloud Continuum [55.6313942302582]
エッジ・ツー・クラウド・コンティニュム上でのリアルタイムアプリケーションの最適化を支援する手法を提案する。
提案手法は, 制御されたテストベッド環境において, その動作を理解するための厳密な構成解析に頼っている。
当社の方法論はEdge-to-Cloud Continuumの他のアプリケーションに一般化することができる。
論文 参考訳(メタデータ) (2021-08-04T07:35:14Z) - A Review on Computational Intelligence Techniques in Cloud and Edge
Computing [14.610305602165415]
クラウドコンピューティング(CC)は、リソースを蓄積する集中型コンピューティングパラダイムであり、インターネットを通じてこれらのリソースをユーザに提供する。
中央分散コンピューティング(EC)は、リソースを分散的に提供し、ユーザの要求に迅速に対応できる。
CCとECの両方がリソースに敏感であるため、ジョブスケジューリングの実施方法、リソース割り当て、タスクオフロードなど、いくつかの大きな問題が発生する。
論文 参考訳(メタデータ) (2020-07-27T09:29:21Z) - A Privacy-Preserving Distributed Architecture for
Deep-Learning-as-a-Service [68.84245063902908]
本稿では,ディープラーニング・アズ・ア・サービスのための分散アーキテクチャを提案する。
クラウドベースのマシンとディープラーニングサービスを提供しながら、ユーザの機密データを保存できる。
論文 参考訳(メタデータ) (2020-03-30T15:12:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。