論文の概要: KAITIAN: A Unified Communication Framework for Enabling Efficient Collaboration Across Heterogeneous Accelerators in Embodied AI Systems
- arxiv url: http://arxiv.org/abs/2505.10183v1
- Date: Thu, 15 May 2025 11:29:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-16 22:29:06.294364
- Title: KAITIAN: A Unified Communication Framework for Enabling Efficient Collaboration Across Heterogeneous Accelerators in Embodied AI Systems
- Title(参考訳): KAITIAN: 身体的AIシステムにおける異種加速器間の効率的なコラボレーションを実現するための統一コミュニケーションフレームワーク
- Authors: Jieke Lin, Wanyu Wang, Longxiang Yin, Yinhe Han,
- Abstract要約: KAITIANは、AIワークロードのための新しい分散通信フレームワークである。
ベンダー最適化されたグループ内効率のための通信ライブラリとグループ間相互運用性のための汎用通信プロトコルを統合する。
ベースラインの均質システムと比較してトレーニング時間を最大42%短縮することができる。
- 参考スコア(独自算出の注目度): 5.241889216655924
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Embodied Artificial Intelligence (AI) systems, such as autonomous robots and intelligent vehicles, are increasingly reliant on diverse heterogeneous accelerators (e.g., GPGPUs, NPUs, FPGAs) to meet stringent real-time processing and energy-efficiency demands. However, the proliferation of vendor-specific proprietary communication libraries creates significant interoperability barriers, hindering seamless collaboration between different accelerator types and leading to suboptimal resource utilization and performance bottlenecks in distributed AI workloads. This paper introduces KAITIAN, a novel distributed communication framework designed to bridge this gap. KAITIAN provides a unified abstraction layer that intelligently integrates vendor-optimized communication libraries for intra-group efficiency with general-purpose communication protocols for inter-group interoperability. Crucially, it incorporates a load-adaptive scheduling mechanism that dynamically balances computational tasks across heterogeneous devices based on their real-time performance characteristics. Implemented as an extension to PyTorch and rigorously evaluated on a testbed featuring NVIDIA GPUs and Cambricon MLUs, KAITIAN demonstrates significant improvements in resource utilization and scalability for distributed training tasks. Experimental results show that KAITIAN can accelerate training time by up to 42% compared to baseline homogeneous systems, while incurring minimal communication overhead (2.8--4.3%) and maintaining model accuracy. KAITIAN paves the way for more flexible and powerful heterogeneous computing in complex embodied AI applications.
- Abstract(参考訳): 自律ロボットやインテリジェントな車両などの身体人工知能(AI)システムは、厳しいリアルタイム処理とエネルギー効率の要求を満たすために、多種多様な異種加速器(GPGPU、NPU、FPGAなど)に依存している。
しかし、ベンダー固有のプロプライエタリな通信ライブラリの急増は、さまざまなアクセラレータータイプ間のシームレスなコラボレーションを妨げ、分散AIワークロードにおけるリソース使用量とパフォーマンスボトルネックを引き起こす、大きな相互運用性の障壁を生み出します。
本稿では,このギャップを埋めるための分散通信フレームワークKAITIANを紹介する。
KAITIANは、ベンダー最適化されたグループ間効率のための通信ライブラリとグループ間相互運用性のための汎用通信プロトコルをインテリジェントに統合する統合抽象化層を提供する。
重要なことに、リアルタイムのパフォーマンス特性に基づいて、不均一デバイス間で動的に計算タスクのバランスをとるロード適応スケジューリング機構が組み込まれている。
PyTorchの拡張として実装され、NVIDIA GPUとCambricon MLUを備えたテストベッドで厳格に評価されたKAITIANは、分散トレーニングタスクにおけるリソース利用とスケーラビリティの大幅な改善を示している。
実験の結果、カイティアンはベースラインの均質システムに比べて最大42%のトレーニング時間を短縮でき、通信オーバーヘッドは最小(2.8~4.3%)、モデルの精度は維持できることがわかった。
KAITIANは、複雑な具体化されたAIアプリケーションにおいて、より柔軟で強力なヘテロジニアスコンピューティングの道を開く。
関連論文リスト
- Bi-LSTM based Multi-Agent DRL with Computation-aware Pruning for Agent Twins Migration in Vehicular Embodied AI Networks [20.574619097682923]
インテリジェントトランスポートでは、大型言語モデルと組み込み人工知能(AI)の組み合わせにより、Vehicular Embodied AI Network(VEAN)が生成される。
VEANでは、自律走行車(AV)が典型的なエージェントであり、局所的な高度なAIアプリケーションは車載型AIエージェントとして定義される。
レイテンシとリソースの制約のため、車載型AIエージェント上で動作するローカルAIアプリケーションとサービスを移行する必要がある。
論文 参考訳(メタデータ) (2025-05-09T18:52:26Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。
大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。
本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45~9.39倍の高速化を実現可能であることを示す。
論文 参考訳(メタデータ) (2024-10-16T16:13:19Z) - OPTIMA: Optimized Policy for Intelligent Multi-Agent Systems Enables Coordination-Aware Autonomous Vehicles [9.41740133451895]
本研究は,協調自動運転タスクのための分散強化学習フレームワークOPTIMAを紹介する。
我々のゴールは、非常に複雑で混み合ったシナリオにおいて、CAVの汎用性と性能を改善することです。
論文 参考訳(メタデータ) (2024-10-09T03:28:45Z) - Multi-Agent Reinforcement Learning for Long-Term Network Resource
Allocation through Auction: a V2X Application [7.326507804995567]
我々は,自律エージェント間の分散意思決定として,移動エージェントの動的グループ(自動車など)からの計算タスクのオフロードを定式化する。
我々は、競争と協力のバランスをとることで、そのようなエージェントにプライベートとシステム目標の整合を動機付けるインタラクションメカニズムを設計する。
本稿では,部分的,遅延,ノイズの多い状態情報を用いて学習する,新しいマルチエージェントオンライン学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-07-29T10:29:06Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - FPGA-based AI Smart NICs for Scalable Distributed AI Training Systems [62.20308752994373]
我々は、フィールドプログラマブルゲートアレイ(FPGA)を用いた分散AI訓練システムのための新しいスマートネットワークインタフェースカード(NIC)を提案する。
提案するFPGAベースのAIスマートNICは,従来のNICを用いたベースラインシステムと比較して,6ノードで1.6倍,32ノードで2.5倍の性能向上が期待できる。
論文 参考訳(メタデータ) (2022-04-22T21:57:00Z) - Semi-asynchronous Hierarchical Federated Learning for Cooperative
Intelligent Transportation Systems [10.257042901204528]
コラボレーティブ・インテリジェント・トランスポート・システム(C-ITS)は、自動運転車や道路インフラの安全性、効率性、持続可能性、快適なサービスを提供する有望なネットワークである。
C-ITSのコンポーネントは通常大量のデータを生成するため、データサイエンスを探索することは困難である。
本稿では,C-ITSのためのSemi-a synchronous Federated Learning (SHFL) フレームワークを提案する。
論文 参考訳(メタデータ) (2021-10-18T07:44:34Z) - Reconfigurable Intelligent Surface Assisted Mobile Edge Computing with
Heterogeneous Learning Tasks [53.1636151439562]
モバイルエッジコンピューティング(MEC)は、AIアプリケーションに自然なプラットフォームを提供します。
再構成可能なインテリジェントサーフェス(RIS)の助けを借りて、MECで機械学習タスクを実行するインフラストラクチャを提示します。
具体的には,モバイルユーザの送信パワー,基地局のビームフォーミングベクトル,risの位相シフト行列を共同で最適化することにより,参加ユーザの学習誤差を最小化する。
論文 参考訳(メタデータ) (2020-12-25T07:08:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。