論文の概要: A Computational Approach to Packet Classification
- arxiv url: http://arxiv.org/abs/2002.07584v2
- Date: Mon, 13 Jul 2020 06:18:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-02 09:47:18.291452
- Title: A Computational Approach to Packet Classification
- Title(参考訳): パケット分類への計算的アプローチ
- Authors: Alon Rashelbach, Ori Rottenstreich, Mark Silberstein
- Abstract要約: 既存の手法のメモリスケーリングを改善する新しい手法であるNuevoMatchを提案する。
新しいデータ構造であるRange Query Recursive Model Index (RQ-RMI)は、NuevoMatchがメインメモリへのアクセスの大半を置き換えることを可能にするキーコンポーネントである。
本稿では、RQ-RMIに基づく分類の正確性を保証する効率的なトレーニングアルゴリズムについて述べる。
- 参考スコア(独自算出の注目度): 11.661429717472918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-field packet classification is a crucial component in modern
software-defined data center networks. To achieve high throughput and low
latency, state-of-the-art algorithms strive to fit the rule lookup data
structures into on-die caches; however, they do not scale well with the number
of rules. We present a novel approach, NuevoMatch, which improves the memory
scaling of existing methods. A new data structure, Range Query Recursive Model
Index (RQ-RMI), is the key component that enables NuevoMatch to replace most of
the accesses to main memory with model inference computations. We describe an
efficient training algorithm that guarantees the correctness of the
RQ-RMI-based classification. The use of RQ-RMI allows the rules to be
compressed into model weights that fit into the hardware cache. Further, it
takes advantage of the growing support for fast neural network processing in
modern CPUs, such as wide vector instructions, achieving a rate of tens of
nanoseconds per lookup. Our evaluation using 500K multi-field rules from the
standard ClassBench benchmark shows a geometric mean compression factor of
4.9x, 8x, and 82x, and average performance improvement of 2.4x, 2.6x, and 1.6x
in throughput compared to CutSplit, NeuroCuts, and TupleMerge, all
state-of-the-art algorithms.
- Abstract(参考訳): マルチフィールドパケット分類は、現代のソフトウェア定義データセンターネットワークにおいて重要なコンポーネントである。
高いスループットと低レイテンシを実現するために、最先端のアルゴリズムはルールのルックアップデータ構造をオンディーキャッシュに適合させようとするが、ルールの数にはうまく対応しない。
既存のメソッドのメモリスケーリングを改善する新しいアプローチであるnuevomatchを提案する。
新しいデータ構造であるRange Query Recursive Model Index (RQ-RMI)は、NuevoMatchがメインメモリへのほとんどのアクセスをモデル推論計算で置き換えることを可能にするキーコンポーネントである。
本稿では、RQ-RMIに基づく分類の正確性を保証する効率的なトレーニングアルゴリズムについて述べる。
RQ-RMIを使用することで、ルールをハードウェアキャッシュに適合するモデルウェイトに圧縮することができる。
さらに、より広いベクトル命令のような現代のCPUにおける高速ニューラルネットワーク処理のサポートの増大を活用し、ルックアップ毎に数十ナノ秒の速度を達成する。
標準クラスベンチベンチマークによる500Kマルチフィールドルールを用いた評価では, 平均圧縮係数が4.9x, 8x, 82xであり, また, CutSplit, NeuroCuts, TupleMergeと比較すると, 2.4x, 2.6x, 1.6xのスループット向上が見られた。
関連論文リスト
- Unlocking Efficient Large Inference Models: One-Bit Unrolling Tips the Scales [13.846014191157405]
我々は1ビットのアルゴリズムを解き放つ新しいアプローチを導入し、物理世界からの情報をモデルアーキテクチャに効果的に統合する。
提案手法は,前処理で報告した1.58ビットよりもリンクレートが大幅に低くなる。
提案した1ビットアルゴリズムのアンローリング方式は,学習結果とテスト結果の両方を改善することができることを示す。
論文 参考訳(メタデータ) (2025-02-04T00:53:10Z) - MPruner: Optimizing Neural Network Size with CKA-Based Mutual Information Pruning [7.262751938473306]
プルーニング(Pruning)は、ニューラルネットワークのサイズを減らし、数学的に精度の保存を保証している、よく確立されたテクニックである。
我々は,ベクトル類似性により相互情報を活用する新しいプルーニングアルゴリズムMPrunerを開発した。
MPrunerはCNNとトランスフォーマーベースのモデルで最大50%のパラメータとメモリ使用量の削減を実現した。
論文 参考訳(メタデータ) (2024-08-24T05:54:47Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - SimQ-NAS: Simultaneous Quantization Policy and Neural Architecture
Search [6.121126813817338]
最近のワンショットニューラルネットワーク検索アルゴリズムは、特定のタスクに適したハードウェアに依存しないスーパーネットワークをトレーニングし、異なるハードウェアプラットフォームのための効率的なサブネットワークを抽出する。
我々は,光学習された予測器と組み合わせた多目的探索アルゴリズムを用いることで,サブネットワークアーキテクチャとそれに対応する量子化ポリシーの両方を効率的に探索できることを示す。
論文 参考訳(メタデータ) (2023-12-19T22:08:49Z) - ClaPIM: Scalable Sequence CLAssification using Processing-In-Memory [1.6124241068249217]
ClaPIMは、ハイブリッド・イン・クロスバーとニア・クロスバー・メムリシティブ・イン・メモリ(PIM)の概念に基づくスケーラブルなDNA配列分類アーキテクチャである。
Kraken2と比較すると、ClaPIMはより高度な分類品質(F1スコアの最大20倍)を提供し、1.8倍のスループット向上を示す。
論文 参考訳(メタデータ) (2023-02-16T13:30:36Z) - Neural Attentive Circuits [93.95502541529115]
我々は、NAC(Neural Attentive Circuits)と呼ばれる汎用的でモジュラーなニューラルアーキテクチャを導入する。
NACは、ドメイン知識を使わずに、ニューラルネットワークモジュールのパラメータ化と疎結合を学習する。
NACは推論時に8倍のスピードアップを達成するが、性能は3%以下である。
論文 参考訳(メタデータ) (2022-10-14T18:00:07Z) - Compact representations of convolutional neural networks via weight
pruning and quantization [63.417651529192014]
本稿では、音源符号化に基づく畳み込みニューラルネットワーク(CNN)の新しいストレージフォーマットを提案し、重み付けと量子化の両方を活用する。
我々は、全接続層で0.6%、ネットワーク全体で5.44%のスペース占有率を削減し、最低でもベースラインと同じくらいの競争力を発揮する。
論文 参考訳(メタデータ) (2021-08-28T20:39:54Z) - SreaMRAK a Streaming Multi-Resolution Adaptive Kernel Algorithm [60.61943386819384]
既存のKRRの実装では、すべてのデータがメインメモリに格納される必要がある。
KRRのストリーミング版であるStreaMRAKを提案する。
本稿では,2つの合成問題と2重振り子の軌道予測について紹介する。
論文 参考訳(メタデータ) (2021-08-23T21:03:09Z) - G-RCN: Optimizing the Gap between Classification and Localization Tasks
for Object Detection [3.620272428985414]
分類タスクと局所化タスクの高レベルな特徴の共有は準最適であることを示す。
我々はギャップ最適化領域ベース畳み込みネットワーク(G-RCN)というパラダイムを提案する。
新しい手法は、VGG16、ResNet50、ResNet101のバックボーンを持つFaster R-CNNに適用される。
論文 参考訳(メタデータ) (2020-11-14T04:14:01Z) - DC-NAS: Divide-and-Conquer Neural Architecture Search [108.57785531758076]
本稿では,ディープ・ニューラル・アーキテクチャーを効果的かつ効率的に探索するためのディバイド・アンド・コンカ(DC)手法を提案する。
ImageNetデータセットで75.1%の精度を達成しており、これは同じ検索空間を使った最先端の手法よりも高い。
論文 参考訳(メタデータ) (2020-05-29T09:02:16Z) - A Generic Network Compression Framework for Sequential Recommender
Systems [71.81962915192022]
シークエンシャルレコメンデーションシステム(SRS)は,ユーザの動的関心を捉え,高品質なレコメンデーションを生成する上で重要な技術となっている。
CpRecと呼ばれる圧縮されたシーケンシャルレコメンデーションフレームワークを提案する。
大規模なアブレーション研究により、提案したCpRecは実世界のSRSデータセットにおいて最大4$sim$8倍の圧縮速度を達成できることを示した。
論文 参考訳(メタデータ) (2020-04-21T08:40:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。