論文の概要: An Overview on Generative AI at Scale with Edge-Cloud Computing
- arxiv url: http://arxiv.org/abs/2306.17170v2
- Date: Sun, 9 Jul 2023 08:56:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-11 21:36:17.913152
- Title: An Overview on Generative AI at Scale with Edge-Cloud Computing
- Title(参考訳): エッジクラウドコンピューティングによる大規模AI生成の概観
- Authors: Yun-Cheng Wang, Jintang Xue, Chengwei Wei, C.-C. Jay Kuo
- Abstract要約: 生成人工知能(GenAI)は、人間が生成したものに似た新しいコンテンツを生成する。
GenAIシステムの急速な開発は、インターネット上で膨大な量の新しいデータを生み出している。
エッジクラウドコンピューティングのパラダイムを活用することで、GenAIシステムを大規模に構築することは魅力的なことです。
- 参考スコア(独自算出の注目度): 28.98486923400986
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As a specific category of artificial intelligence (AI), generative artificial
intelligence (GenAI) generates new content that resembles what is created by
humans. The rapid development of GenAI systems has created a huge amount of new
data on the Internet, posing new challenges to current computing and
communication frameworks. Currently, GenAI services rely on the traditional
cloud computing framework due to the need for large computation resources.
However, such services will encounter high latency because of data transmission
and a high volume of requests. On the other hand, edge-cloud computing can
provide adequate computation power and low latency at the same time through the
collaboration between edges and the cloud. Thus, it is attractive to build
GenAI systems at scale by leveraging the edge-cloud computing paradigm. In this
overview paper, we review recent developments in GenAI and edge-cloud
computing, respectively. Then, we use two exemplary GenAI applications to
discuss technical challenges in scaling up their solutions using edge-cloud
collaborative systems. Finally, we list design considerations for training and
deploying GenAI systems at scale and point out future research directions.
- Abstract(参考訳): 人工知能(AI)の特定のカテゴリとして、生成人工知能(GenAI)は、人間が生成したものに似た新しいコンテンツを生成する。
GenAIシステムの急速な開発は、インターネット上で大量の新しいデータを生み出し、現在のコンピューティングおよび通信フレームワークに新たな課題を提起している。
現在、GenAIサービスは大規模な計算リソースを必要とするため、従来のクラウドコンピューティングフレームワークに依存している。
しかし、データ転送と大量のリクエストのために、そのようなサービスは高いレイテンシに直面する。
一方、エッジクラウドコンピューティングは、エッジとクラウドのコラボレーションを通じて、適切な計算能力と低レイテンシを同時に提供することができる。
したがって、エッジクラウドコンピューティングのパラダイムを活用することで、GenAIシステムを大規模に構築することは魅力的である。
本稿では,GenAIとエッジクラウドコンピューティングの最近の展開について概説する。
そして、2つの例のGenAIアプリケーションを使って、エッジクラウドの協調システムを使ってソリューションをスケールアップする技術的な課題について議論します。
最後に、GenAIシステムを大規模に運用するための設計上の考慮事項をリストアップし、今後の研究方向性を指摘する。
関連論文リスト
- Strategic Demand-Planning in Wireless Networks: Can Generative-AI Save Spectrum and Energy? [17.59973153669422]
本稿では、需要ラベル付け、需要形成、需要再スケジューリングによる戦略的需要計画の概念を紹介する。
GenAIは、無線ネットワークにおける需要形成を容易にする強力なツールとして提案されている。
GenAIは、無線ネットワークのエネルギーとスペクトルを節約する機能を持つ。
論文 参考訳(メタデータ) (2024-07-02T14:27:06Z) - Explainable Generative AI (GenXAI): A Survey, Conceptualization, and Research Agenda [1.8592384822257952]
我々は、XAIがGenAIの台頭とともに重要になった理由とその説明可能性研究の課題について詳述する。
私たちはまた、検証可能性、対話性、セキュリティ、コストといった側面をカバーし、説明が満たすべき新しいデシラタも披露します。
論文 参考訳(メタデータ) (2024-04-15T08:18:16Z) - Computing in the Era of Large Generative Models: From Cloud-Native to
AI-Native [46.7766555589807]
クラウドネイティブ技術と高度な機械学習推論の両方のパワーを利用するAIネイティブコンピューティングパラダイムについて説明する。
これらの共同作業は、コスト・オブ・グッド・ソード(COGS)を最適化し、資源のアクセシビリティを向上させることを目的としている。
論文 参考訳(メタデータ) (2024-01-17T20:34:11Z) - Green Edge AI: A Contemporary Survey [49.47249665895926]
グリーンエッジAIに関する現代の調査を紹介する。
その可能性にもかかわらず、エッジAIは重大な課題に直面している。主な原因は、無線エッジネットワークのリソース制限と、ディープラーニング(DL)のリソース集約性との間の二分である。
我々は、エッジAIシステムにおける3つの重要なタスクに対して、トレーニングデータ取得、エッジトレーニング、エッジ推論を含むエネルギー効率の高い設計手法について検討する。
論文 参考訳(メタデータ) (2023-12-01T04:04:37Z) - AI-Generated Images as Data Source: The Dawn of Synthetic Era [61.879821573066216]
生成AIは、現実世界の写真によく似た合成画像を作成する可能性を解き放った。
本稿では、これらのAI生成画像を新しいデータソースとして活用するという革新的な概念を探求する。
実際のデータとは対照的に、AI生成データには、未整合のアブリダンスやスケーラビリティなど、大きなメリットがある。
論文 参考訳(メタデータ) (2023-10-03T06:55:19Z) - A Comprehensive Survey of AI-Generated Content (AIGC): A History of
Generative AI from GAN to ChatGPT [63.58711128819828]
ChatGPTおよびその他の生成AI(GAI)技術は、人工知能生成コンテンツ(AIGC)のカテゴリに属している。
AIGCの目標は、コンテンツ作成プロセスをより効率的かつアクセスしやすくし、高品質なコンテンツをより高速に生産できるようにすることである。
論文 参考訳(メタデータ) (2023-03-07T20:36:13Z) - Edge-Cloud Polarization and Collaboration: A Comprehensive Survey [61.05059817550049]
クラウドとエッジ両方のAIの体系的なレビューを行います。
私たちはクラウドとエッジモデリングの協調学習メカニズムを最初にセットアップしました。
我々は現在進行中の最先端AIトピックの可能性と実践経験について議論する。
論文 参考訳(メタデータ) (2021-11-11T05:58:23Z) - Auto-Split: A General Framework of Collaborative Edge-Cloud AI [49.750972428032355]
本稿では,Huawei Cloudのエッジクラウド共同プロトタイプであるAuto-Splitの技法と技術実践について述べる。
私たちの知る限りでは、Deep Neural Network(DNN)分割機能を提供する既存の産業製品はありません。
論文 参考訳(メタデータ) (2021-08-30T08:03:29Z) - KubeEdge.AI: AI Platform for Edge Devices [4.337396433660794]
KubeEdge.AIはKubeEdge上のエッジAIフレームワークである。
データ処理と処理エンジン、簡潔なAIランタイム、決定エンジン、分散データクエリインターフェースなど、主要なモジュールとインターフェースのセットを提供する。
論文 参考訳(メタデータ) (2020-07-07T23:36:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。