Fugu-MT 論文翻訳(概要): Taurus: A Data Plane Architecture for Per-Packet ML

論文の概要: Taurus: A Data Plane Architecture for Per-Packet ML

arxiv url: http://arxiv.org/abs/2002.08987v2
Date: Wed, 19 Jan 2022 20:20:04 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-01 20:45:47.741276
Title: Taurus: A Data Plane Architecture for Per-Packet ML
Title（参考訳）: Taurus: パケット単位のMLのためのデータプレーンアーキテクチャ
Authors: Tushar Swamy, Alexander Rucker, Muhammad Shahbaz, Ishan Gaur, and Kunle Olukotun
Abstract要約: 本稿では,線数推論のためのデータプレーンであるTaurusの設計と実装について述べる。 Taurus スイッチ ASIC の評価は,Taurus がサーバベースコントロールプレーンよりも桁違いに高速に動作することを示す。
参考スコア（独自算出の注目度）: 59.1343317736213
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Emerging applications -- cloud computing, the internet of things, and augmented/virtual reality -- demand responsive, secure, and scalable datacenter networks. These networks currently implement simple, per-packet, data-plane heuristics (e.g., ECMP and sketches) under a slow, millisecond-latency control plane that runs data-driven performance and security policies. However, to meet applications' service-level objectives (SLOs) in a modern data center, networks must bridge the gap between line-rate, per-packet execution and complex decision making. In this work, we present the design and implementation of Taurus, a data plane for line-rate inference. Taurus adds custom hardware based on a flexible, parallel-patterns (MapReduce) abstraction to programmable network devices, such as switches and NICs; this new hardware uses pipelined SIMD parallelism to enable per-packet MapReduce operations (e.g., inference). Our evaluation of a Taurus switch ASIC -- supporting several real-world models -- shows that Taurus operates orders of magnitude faster than a server-based control plane while increasing area by 3.8% and latency for line-rate ML models by up to 221 ns. Furthermore, our Taurus FPGA prototype achieves full model accuracy and detects two orders of magnitude more events than a state-of-the-art control-plane anomaly-detection system.
Abstract（参考訳）: 新しいアプリケーション -- クラウドコンピューティング、物のインターネット、拡張現実/仮想現実 -- は、応答性、セキュア、スケーラブルなデータセンターネットワークを要求する。これらのネットワークは現在、データ駆動性能とセキュリティポリシーを実行するミリ秒遅延制御プレーンの下で、単純な、パッケージごとのデータプレーンヒューリスティック(ECMPやスケッチなど)を実装している。しかし、現代のデータセンターにおけるアプリケーションのサービスレベル目標(SLO)を満たすためには、ネットワークはラインレート、パッケージごとの実行、複雑な意思決定のギャップを埋めなければならない。本稿では,ラインレート推定のためのデータプレーンであるtaurusの設計と実装について述べる。 Taurusは、スイッチやNICなどのプログラマブルネットワークデバイスに、フレキシブルで並列パターン(MapReduce)の抽象化に基づいたカスタムハードウェアを追加する。いくつかの実世界のモデルをサポートするTaurusスイッチASICの評価は、Taurusがサーバベースコントロールプレーンよりも桁違いに高速に動作し、面積が3.8%増加し、ラインレートMLモデルのレイテンシが最大221 ns向上したことを示している。さらに、我々のTaurus FPGAプロトタイプは完全なモデル精度を実現し、最先端の制御面異常検出システムよりも2桁のイベントを検出する。

関連論文リスト

LiQSS: Post-Transformer Linear Quantum-Inspired State-Space Tensor Networks for Real-Time 6G [85.58816960936069]
Sixth-Generation (6G) Open Radio Access Networks (O-RAN) における能動的およびエージェント的制御は、厳密なニアタイム(Near-RT)レイテンシと計算制約の下で制御グレードの予測を必要とする。本稿では,効率的な無線テレメトリ予測のための変圧器後パラダイムについて検討する。本稿では、自己アテンションを安定な状態空間動的カーネルに置き換える量子インスピレーション付き状態空間テンソルネットワークを提案する。
論文参考訳（メタデータ） (2026-01-18T12:08:38Z)
SCoTT: Strategic Chain-of-Thought Tasking for Wireless-Aware Robot Navigation in Digital Twins [78.53885607559958]
無線対応経路計画フレームワークであるSCoTTを提案する。 SCoTT は DP-WA* の2% 以内で経路ゲインを達成し, 連続的に短い軌道を生成できることを示す。また,ガゼボシミュレーションにおいて,SCoTTをROSノードとして配置することにより,本手法の実用性を示す。
論文参考訳（メタデータ） (2024-11-27T10:45:49Z)
FusionLLM: A Decentralized LLM Training System on Geo-distributed GPUs with Adaptive Compression [55.992528247880685]
分散トレーニングは、システム設計と効率に関する重要な課題に直面します。大規模深層ニューラルネットワーク(DNN)のトレーニング用に設計・実装された分散トレーニングシステムFusionLLMを提案する。本システムと手法は,収束性を確保しつつ,ベースライン法と比較して1.45～9.39倍の高速化を実現可能であることを示す。
論文参考訳（メタデータ） (2024-10-16T16:13:19Z)
Communication- and Computation-Efficient Distributed Submodular Optimization in Robot Mesh Networks [2.8936428431504164]
ロボットメッシュネットワークにおける分散サブモジュール最適化のための通信効率と計算効率の両立手法を提案する。我々の手法であるResource-Aware Distributed Greedy (RAG)は、新しい分散最適化パラダイムを導入する。 RAGの決定時間はネットワークサイズと線形にスケールするが、最先端の準モジュラ最適化アルゴリズムは3倍にスケールする。
論文参考訳（メタデータ） (2024-07-15T01:25:39Z)
Brain-on-Switch: Towards Advanced Intelligent Network Data Plane via NN-Driven Traffic Analysis at Line-Speed [33.455302442142994]
プログラム可能なネットワークは、ラインスピードで学習に基づくトラフィック分析を実現するIntelligent Network Data Plane (INDP) に大きな研究を巻き起こした。 INDPの以前の技術は、データプレーンにツリー/フォレストモデルをデプロイすることに焦点を当てていた。本稿では,ニューラルネットワーク(NN)によるトラフィック解析を回線速度で実現することにより,INDPの境界を押し上げるBoSを提案する。
論文参考訳（メタデータ） (2024-03-17T04:59:30Z)
Complex-Valued Neural Networks for Data-Driven Signal Processing and Signal Understanding [1.2691047660244337]
複雑な評価されたニューラルネットワークは、信号処理、センシング、通信領域にわたる多くのタスクにおいて優れたモデリング性能を誇っている。本稿では,PyTorch上に構築された複雑なニューラルネットワーク操作とアーキテクチャのための軽量インタフェースの実装を目的としたパッケージの概要を述べる。
論文参考訳（メタデータ） (2023-09-14T16:55:28Z)
EasyNet: An Easy Network for 3D Industrial Anomaly Detection [49.26348455493123]
3D異常検出は、産業生産において、新しくて重要なコンピュータビジョンタスクである。我々は,事前訓練されたモデルやメモリバンクを使わずに,容易に展開可能なネットワーク(EasyNet)を提案する。実験の結果、EasyNetはトレーニング済みのモデルやメモリバンクを使わずに92.6%の異常検出AUROCを実現していることがわかった。
論文参考訳（メタデータ） (2023-07-26T02:46:50Z)
RouteNet-Fermi: Network Modeling with Graph Neural Networks [7.227467283378366]
我々は、キューイング理論と同じ目標を共有するカスタムグラフニューラルネットワーク(GNN)モデルであるRouteNet-Fermiを紹介する。提案モデルでは,ネットワークの遅延,ジッタ,パケット損失を正確に予測する。実験の結果,RouteNet-Fermi はパケットレベルシミュレータと同様の精度でパケットレベルシミュレータを実現することがわかった。
論文参考訳（メタデータ） (2022-12-22T23:02:40Z)
Pathways: Asynchronous Distributed Dataflow for ML [24.940220376358457]
本稿では,加速器用大規模オーケストレーション層の設計について述べる。私たちのシステムであるPathwaysは、新しいシステムやML研究のアイデアを探索できるように明示的に設計されています。
論文参考訳（メタデータ） (2022-03-23T16:50:53Z)
Parallel Successive Learning for Dynamic Distributed Model Training over Heterogeneous Wireless Networks [50.68446003616802]
フェデレートラーニング(Federated Learning, FedL)は、一連の無線デバイスにモデルトレーニングを配布する一般的なテクニックとして登場した。我々は,FedLアーキテクチャを3次元に拡張した並列逐次学習(PSL)を開発した。我々の分析は、分散機械学習におけるコールド対ウォームアップモデルの概念とモデル慣性について光を当てている。
論文参考訳（メタデータ） (2022-02-07T05:11:01Z)
Robust Semi-supervised Federated Learning for Images Automatic Recognition in Internet of Drones [57.468730437381076]
プライバシー保護型UAV画像認識のための半教師付きフェデレートラーニング(SSFL)フレームワークを提案する。異なるカメラモジュールを使用したUAVによって収集されたローカルデータの数、特徴、分布には大きな違いがある。本稿では,クライアントがトレーニングに参加する頻度,すなわちFedFreqアグリゲーションルールに基づくアグリゲーションルールを提案する。
論文参考訳（メタデータ） (2022-01-03T16:49:33Z)
A Photonic-Circuits-Inspired Compact Network: Toward Real-Time Wireless Signal Classification at the Edge [3.841495731646297]
大規模な機械学習モデルでは、レイテンシに敏感な下流タスクのためにエッジデバイス上で実装することが難しくなる可能性がある。無線通信システムでは、ミリ秒以下のスケールでのMLデータ処理により、リアルタイムなネットワーク監視が可能となる。本稿では,フォトニック・ハードウエアにインスパイアされたリカレントニューラルネットワークモデルからなる,コンパクトなディープ・ネットワークを提案する。
論文参考訳（メタデータ） (2021-06-25T19:55:41Z)
One-step regression and classification with crosspoint resistive memory arrays [62.997667081978825]
高速で低エネルギーのコンピュータは、エッジでリアルタイム人工知能を実現するために要求されている。ワンステップ学習は、ボストンの住宅のコスト予測と、MNIST桁認識のための2層ニューラルネットワークのトレーニングによって支援される。結果は、クロスポイントアレイ内の物理計算、並列計算、アナログ計算のおかげで、1つの計算ステップで得られる。
論文参考訳（メタデータ） (2020-05-05T08:00:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。