論文の概要: Seamless Optical Cloud Computing across Edge-Metro Network for Generative AI
- arxiv url: http://arxiv.org/abs/2412.12126v1
- Date: Wed, 04 Dec 2024 11:49:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-22 08:06:04.914666
- Title: Seamless Optical Cloud Computing across Edge-Metro Network for Generative AI
- Title(参考訳): エッジ-メトロネットワークを横断するシームレス光クラウドコンピューティングによるAI生成
- Authors: Sizhe Xing, Aolong Sun, Chengxi Wang, Yizhi Wang, Boyu Dong, Junhui Hu, Xuyu Deng, An Yan, Yingjun Liu, Fangchen Hu, Zhongya Li, Ouhan Huang, Junhao Zhao, Yingjun Zhou, Ziwei Li, Jianyang Shi, Xi Xiao, Richard Penty, Qixiang Cheng, Nan Chi, Junwen Zhang,
- Abstract要約: 本稿では,エッジ-メトロネットワーク上でシームレスにデプロイ可能な光クラウドコンピューティングシステムを提案する。
入力とモデルを光に変調することで、エッジ-メトロネットワークを介して、幅広いエッジノードが光コンピューティングセンターに直接アクセスすることができる。
実験による検証では、118.6 mW/TOP(テラ演算毎秒)のエネルギー効率を示し、従来の電子ベースのクラウドコンピューティングソリューションと比較して2桁のエネルギー消費を削減した。
- 参考スコア(独自算出の注目度): 11.50609298355243
- License:
- Abstract: The rapid advancement of generative artificial intelligence (AI) in recent years has profoundly reshaped modern lifestyles, necessitating a revolutionary architecture to support the growing demands for computational power. Cloud computing has become the driving force behind this transformation. However, it consumes significant power and faces computation security risks due to the reliance on extensive data centers and servers in the cloud. Reducing power consumption while enhancing computational scale remains persistent challenges in cloud computing. Here, we propose and experimentally demonstrate an optical cloud computing system that can be seamlessly deployed across edge-metro network. By modulating inputs and models into light, a wide range of edge nodes can directly access the optical computing center via the edge-metro network. The experimental validations show an energy efficiency of 118.6 mW/TOPs (tera operations per second), reducing energy consumption by two orders of magnitude compared to traditional electronic-based cloud computing solutions. Furthermore, it is experimentally validated that this architecture can perform various complex generative AI models through parallel computing to achieve image generation tasks.
- Abstract(参考訳): 近年の創造的人工知能(AI)の急速な進歩は、計算力の需要の増加を支えるために革命的アーキテクチャを必要とする現代の生活様式を大きく変えた。
この変革の原動力はクラウドコンピューティングだ。
しかし、大きな電力を消費し、クラウド内の広範なデータセンタやサーバに依存しているため、計算セキュリティのリスクに直面している。
計算規模を拡大しながら消費電力を減らすことは、クラウドコンピューティングにおける永続的な課題である。
本稿では,エッジ-メトロネットワーク上でシームレスにデプロイ可能な光クラウドコンピューティングシステムを提案する。
入力とモデルを光に変調することで、エッジ-メトロネットワークを介して、幅広いエッジノードが光コンピューティングセンターに直接アクセスすることができる。
実験による検証では、118.6 mW/TOP(テラ演算毎秒)のエネルギー効率を示し、従来の電子ベースのクラウドコンピューティングソリューションと比較して2桁のエネルギー消費を削減した。
さらに,このアーキテクチャが並列計算により複雑な生成AIモデルを実行し,画像生成タスクを実現できることを実験的に検証した。
関連論文リスト
- A Hardware-Efficient Photonic Tensor Core: Accelerating Deep Neural Networks with Structured Compression [15.665630650382226]
AIとディープニューラルネットワーク(DNN)は多くの分野に革命をもたらし、大規模なデータセットから複雑な特徴を抽出することで複雑なタスクを可能にした。
光コンピューティングは、並列性、高い計算速度、低消費電力という固有の利点のために、有望な代替手段を提供する。
構造圧縮型光ニューラルネットワーク(StrC-ONN)アーキテクチャのためのブロック循環型フォトニックテンソルコア(CirPTC)を提案する。
論文 参考訳(メタデータ) (2025-02-01T17:03:45Z) - Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Optical training of large-scale Transformers and deep neural networks with direct feedback alignment [48.90869997343841]
我々は,ハイブリッド電子フォトニックプラットフォーム上で,ダイレクトフィードバックアライメントと呼ばれる多目的でスケーラブルなトレーニングアルゴリズムを実験的に実装した。
光処理ユニットは、このアルゴリズムの中央動作である大規模ランダム行列乗算を最大1500テラOpsで行う。
我々は、ハイブリッド光アプローチの計算スケーリングについて検討し、超深度・広帯域ニューラルネットワークの潜在的な利点を実証する。
論文 参考訳(メタデータ) (2024-09-01T12:48:47Z) - Computing in the Era of Large Generative Models: From Cloud-Native to
AI-Native [46.7766555589807]
クラウドネイティブ技術と高度な機械学習推論の両方のパワーを利用するAIネイティブコンピューティングパラダイムについて説明する。
これらの共同作業は、コスト・オブ・グッド・ソード(COGS)を最適化し、資源のアクセシビリティを向上させることを目的としている。
論文 参考訳(メタデータ) (2024-01-17T20:34:11Z) - Spike-based Neuromorphic Computing for Next-Generation Computer Vision [1.2367795537503197]
ニューロモルフィック・コンピューティングは、従来のフォン・ノイマン・コンピューティング・パラダイムと比較してエネルギー効率の桁違いの改善を約束する。
目標は、適応的でフォールトトレラント、低フットプリント、高速、低エネルギーの知能システムを開発することであり、脳の機能を学び、エミュレートすることである。
論文 参考訳(メタデータ) (2023-10-15T01:05:35Z) - Molecular Dynamics Simulations on Cloud Computing and Machine Learning
Platforms [0.8093262393618671]
我々は、科学計算アプリケーションの計算構造、設計、要求のパラダイムシフトを見る。
データ駆動型と機械学習のアプローチは、科学計算アプリケーションをサポートし、スピードアップし、拡張するために使用されています。
クラウドコンピューティングプラットフォームは、科学コンピューティングにますますアピールしている。
論文 参考訳(メタデータ) (2021-11-11T21:20:26Z) - Edge-Cloud Polarization and Collaboration: A Comprehensive Survey [61.05059817550049]
クラウドとエッジ両方のAIの体系的なレビューを行います。
私たちはクラウドとエッジモデリングの協調学習メカニズムを最初にセットアップしました。
我々は現在進行中の最先端AIトピックの可能性と実践経験について議論する。
論文 参考訳(メタデータ) (2021-11-11T05:58:23Z) - Photonics for artificial intelligence and neuromorphic computing [52.77024349608834]
フォトニック集積回路は超高速な人工ニューラルネットワークを可能にした。
フォトニックニューロモルフィックシステムはナノ秒以下のレイテンシを提供する。
これらのシステムは、機械学習と人工知能の需要の増加に対応する可能性がある。
論文 参考訳(メタデータ) (2020-10-30T21:41:44Z) - One-step regression and classification with crosspoint resistive memory
arrays [62.997667081978825]
高速で低エネルギーのコンピュータは、エッジでリアルタイム人工知能を実現するために要求されている。
ワンステップ学習は、ボストンの住宅のコスト予測と、MNIST桁認識のための2層ニューラルネットワークのトレーニングによって支援される。
結果は、クロスポイントアレイ内の物理計算、並列計算、アナログ計算のおかげで、1つの計算ステップで得られる。
論文 参考訳(メタデータ) (2020-05-05T08:00:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。