論文の概要: INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization
- arxiv url: http://arxiv.org/abs/2505.24269v1
- Date: Fri, 30 May 2025 06:47:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-02 19:47:52.811748
- Title: INSIGHT: A Survey of In-Network Systems for Intelligent, High-Efficiency AI and Topology Optimization
- Title(参考訳): INSIGHT: インテリジェントで高効率なAIとトポロジ最適化のためのインネットワークシステムに関する調査
- Authors: Aleksandr Algazinov, Joydeep Chandra, Matt Laing,
- Abstract要約: インネットワークAI(In-network AI)は、ネットワークインフラストラクチャにおける人工知能(AI)のエスカレート要求に対処するための、変革的なアプローチである。
本稿では,AIのためのネットワーク内計算の最適化に関する包括的な分析を行う。
リソース制約のあるネットワークデバイスにAIモデルをマッピングするための方法論を調べ、メモリや計算能力の制限といった課題に対処する。
- 参考スコア(独自算出の注目度): 43.37351326629751
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In-network computation represents a transformative approach to addressing the escalating demands of Artificial Intelligence (AI) workloads on network infrastructure. By leveraging the processing capabilities of network devices such as switches, routers, and Network Interface Cards (NICs), this paradigm enables AI computations to be performed directly within the network fabric, significantly reducing latency, enhancing throughput, and optimizing resource utilization. This paper provides a comprehensive analysis of optimizing in-network computation for AI, exploring the evolution of programmable network architectures, such as Software-Defined Networking (SDN) and Programmable Data Planes (PDPs), and their convergence with AI. It examines methodologies for mapping AI models onto resource-constrained network devices, addressing challenges like limited memory and computational capabilities through efficient algorithm design and model compression techniques. The paper also highlights advancements in distributed learning, particularly in-network aggregation, and the potential of federated learning to enhance privacy and scalability. Frameworks like Planter and Quark are discussed for simplifying development, alongside key applications such as intelligent network monitoring, intrusion detection, traffic management, and Edge AI. Future research directions, including runtime programmability, standardized benchmarks, and new applications paradigms, are proposed to advance this rapidly evolving field. This survey underscores the potential of in-network AI to create intelligent, efficient, and responsive networks capable of meeting the demands of next-generation AI applications.
- Abstract(参考訳): ネットワーク内計算は、ネットワークインフラストラクチャ上の人工知能(AI)ワークロードのエスカレート要求に対処するための、変革的なアプローチである。
スイッチ、ルータ、ネットワークインターフェースカード(NIC)などのネットワークデバイスの処理機能を活用することで、このパラダイムは、ネットワークファブリック内でAI計算を直接実行し、レイテンシを大幅に低減し、スループットを向上し、リソース利用を最適化する。
本稿では、AIのためのネットワーク内計算の最適化に関する包括的な分析を行い、SDN(Software-Defined Networking)やPDP(Programmable Data Planes)といったプログラマブルネットワークアーキテクチャの進化と、AIとの収束性について考察する。
リソース制約のあるネットワークデバイスにAIモデルをマッピングする手法を調べ、効率的なアルゴリズム設計とモデル圧縮技術を通じて、限られたメモリや計算能力などの課題に対処する。
また、分散学習、特にネットワーク内集約の進歩と、プライバシとスケーラビリティを高めるためのフェデレーション学習の可能性を強調した。
PlanterやQuarkといったフレームワークは、インテリジェントネットワーク監視、侵入検出、トラフィック管理、エッジAIといった主要なアプリケーションとともに、開発を単純化するために議論されている。
ランタイムプログラマビリティ、標準化されたベンチマーク、新しいアプリケーションパラダイムなどの今後の研究方向性は、この急速に発展する分野を前進させるために提案されている。
この調査は、次世代AIアプリケーションの要求を満たすことができるインテリジェントで効率的でレスポンシブなネットワークを構築するための、ネットワーク内AIの可能性を強調している。
関連論文リスト
- Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Toward Agentic AI: Generative Information Retrieval Inspired Intelligent Communications and Networking [87.82985288731489]
Agentic AIは、インテリジェントなコミュニケーションとネットワークのための重要なパラダイムとして登場した。
本稿では,通信システムにおけるエージェントAIにおける知識獲得,処理,検索の役割を強調する。
論文 参考訳(メタデータ) (2025-02-24T06:02:25Z) - Optimal In-Network Distribution of Learning Functions for a Secure-by-Design Programmable Data Plane of Next-Generation Networks [2.563180814294141]
本稿では、完全に分散した侵入検知システム(IDS)または侵入防止システム(IPS)を実装することを目的としたネットワーク内学習モデルの展開に焦点を当てた。
データプレーンデバイス間でのIDS/IPSワークロードの最適分配について,通常の操作を過度に負担することなく,完全なネットワークセキュリティを確保するためのモデルを提案する。
論文 参考訳(メタデータ) (2024-11-27T14:29:53Z) - Design Principles for Model Generalization and Scalable AI Integration
in Radio Access Networks [2.846642778157227]
本稿では、性能向上と無線通信におけるスケーラブルなAI統合の実現において、モデル一般化を実現する上での重要な役割を強調する。
我々は,3つの主要な領域において,モデル一般化のための設計原則を概説する。堅牢性のための環境,システム目的への適応性のための意図,AI駆動制御ループの削減のための制御タスクである。
本稿では、分散データ生成と組み合わせて、トレーニングとデータ管理機能の集中化を活用する学習アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-09T20:46:31Z) - Towards AIOps in Edge Computing Environments [60.27785717687999]
本稿では,異種分散環境に適用可能なaiopsプラットフォームのシステム設計について述べる。
高頻度でメトリクスを収集し、エッジデバイス上で特定の異常検出アルゴリズムを直接実行することが可能である。
論文 参考訳(メタデータ) (2021-02-12T09:33:00Z) - Deep Learning for Ultra-Reliable and Low-Latency Communications in 6G
Networks [84.2155885234293]
まず,データ駆動型教師付き深層学習と深部強化学習をURLLCに適用する方法を概説する。
このようなオープンな問題に対処するために、デバイスインテリジェンス、エッジインテリジェンス、およびURLLCのためのクラウドインテリジェンスを可能にするマルチレベルアーキテクチャを開発した。
論文 参考訳(メタデータ) (2020-02-22T14:38:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。