論文の概要: DT2CAM: A Decision Tree to Content Addressable Memory Framework
- arxiv url: http://arxiv.org/abs/2204.06114v1
- Date: Tue, 12 Apr 2022 23:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-14 14:08:14.453942
- Title: DT2CAM: A Decision Tree to Content Addressable Memory Framework
- Title(参考訳): dt2cam - content addressable memory framework への決定ツリー
- Authors: Mariam Rakka, Mohammed E. Fouda, Rouwaida Kanj, and Fadi Kurdahi
- Abstract要約: 本稿では,Decision Tree (DT)推論高速化のためのCAMコンパイラを提案する。
本稿では,コンパクトな実装を実現する新しい「適応精度」スキームを提案する。
我々の結果は、最先端のハードウェアアクセラレーターと比較して42.4%の省エネと17.8倍の省エネ効果が得られた。
- 参考スコア(独自算出の注目度): 0.46198289193451136
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Decision trees are considered one of the most powerful tools for data
classification. Accelerating the decision tree search is crucial for
on-the-edge applications that have limited power and latency budget. In this
paper, we propose a Content Addressable Memory (CAM) Compiler for Decision Tree
(DT) inference acceleration. We propose a novel "adaptive-precision" scheme
that results in a compact implementation and enables an efficient bijective
mapping to Ternary Content Addressable Memories while maintaining high
inference accuracies. In addition, a Resistive-CAM (ReCAM) functional
synthesizer is developed for mapping the decision tree to the ReCAM and
performing functional simulations for energy, latency, and accuracy
evaluations. We study the decision tree accuracy under hardware non-idealities
including device defects, manufacturing variability, and input encoding noise.
We test our framework on various DT datasets including \textit{Give Me Some
Credit}, \textit{Titanic}, and \textit{COVID-19}. Our results reveal up to
{42.4\%} energy savings and up to 17.8x better energy-delay-area product
compared to the state-of-art hardware accelerators, and up to 333 million
decisions per sec for the pipelined implementation.
- Abstract(参考訳): 決定木は、データ分類の最も強力なツールの1つである。
電力とレイテンシの予算が限られている最先端のアプリケーションでは、決定木探索の加速が不可欠です。
本稿では、決定木(dt)推論の高速化のためのコンテンツアドレス付きメモリ(cam)コンパイラを提案する。
本稿では,コンパクトな実装を実現し,高い推論精度を維持しつつ,三項コンテンツ対応メモリへの効率的なビジェクティブマッピングを実現する「適応精度」手法を提案する。
さらに、決定木をReCAMにマッピングし、エネルギー、レイテンシ、精度評価のための機能シミュレーションを行うためのResistive-CAM(ReCAM)機能合成器を開発した。
デバイス欠陥, 製造変動性, 入力符号化ノイズなど, ハードウェア非理想性に基づく決定木精度について検討した。
我々は、さまざまなDTデータセット上でフレームワークをテストし、例えば、 \textit{Give Me Some Credit}、 \textit{Titanic}、 \textit{-19} などです。
この結果から,<42.4\%>の省エネルギー化と,最先端ハードウェアアクセラレータと比較して最大17.8倍のエネルギー遅延面積の製品,パイプライン実装1秒あたりの最大3億3300万の意思決定が得られた。
関連論文リスト
- Dynamic Decision Tree Ensembles for Energy-Efficient Inference on IoT
Edge Nodes [12.99136544903102]
ランダムフォレスト (RFs) やグラディエント・ブースティング (GBTs) のような決定木アンサンブルは、その複雑さが比較的低いため、この作業に特に適している。
本稿では、遅延/エネルギー目標と処理された入力の複雑さの両方に基づいて実行された木数を調整する動的アンサンブルの使用を提案する。
我々は、Pythonアンサンブルを最適化されたCコードに変換するツールを設計し、これらのアルゴリズムをマルチコアの低消費電力IoTデバイスにデプロイすることに重点を置いている。
論文 参考訳(メタデータ) (2023-06-16T11:59:18Z) - Practical Conformer: Optimizing size, speed and flops of Conformer for
on-Device and cloud ASR [67.63332492134332]
我々は、デバイス上の制約を満たすのに十分小さく、TPUを高速に推論できる最適化されたコンバータを設計する。
提案するエンコーダは、デバイス上では強力なスタンドアロンエンコーダとして、また高性能なASRパイプラインの第1部として利用することができる。
論文 参考訳(メタデータ) (2023-03-31T23:30:48Z) - Improving Dual-Encoder Training through Dynamic Indexes for Negative
Mining [61.09807522366773]
本稿では,ソフトマックスを証明可能な境界で近似し,木を動的に維持するアルゴリズムを提案する。
我々は,2000万以上のターゲットを持つデータセットについて検討し,オラクル・ブルート力負の鉱業に関して,誤差を半分に削減した。
論文 参考訳(メタデータ) (2023-03-27T15:18:32Z) - R(Det)^2: Randomized Decision Routing for Object Detection [64.48369663018376]
本稿では,決定木とディープニューラルネットワークをエンドツーエンドの学習方法で組み合わせたオブジェクト検出手法を提案する。
効率的な学習を容易にするために,ノード選択型および連想型損失を伴うランダム化決定経路を提案する。
このアプローチをオブジェクト検出のためのランダム化決定ルーティングとして、R(Det)$2$と略す。
論文 参考訳(メタデータ) (2022-04-02T07:54:58Z) - A Flexible HLS Hoeffding Tree Implementation for Runtime Learning on
FPGA [0.0]
Hoeffding TreeはHoeffding境界を利用して、将来の再処理のためにデータサンプルを継続的に保存することなく、データのパターンを学習する。
これにより、組み込みデバイスへのデプロイに特に適している。
論文 参考訳(メタデータ) (2021-12-03T12:22:57Z) - Generalized and Scalable Optimal Sparse Decision Trees [56.35541305670828]
様々な目的に対して最適な決定木を生成する手法を提案する。
また,連続変数が存在する場合に最適な結果が得られるスケーラブルなアルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-06-15T19:00:11Z) - ENTMOOT: A Framework for Optimization over Ensemble Tree Models [57.98561336670884]
ENTMOOTは、ツリーモデルをより大きな最適化問題に統合するためのフレームワークである。
ENTMOOTは、ツリーモデルの意思決定とブラックボックス最適化への単純な統合を可能にしていることを示す。
論文 参考訳(メタデータ) (2020-03-10T14:34:07Z) - Decision Trees for Decision-Making under the Predict-then-Optimize
Framework [7.842152902652215]
本稿では,予測最適化フレームワークに基づく意思決定問題に対する決定木の利用について考察する。
このフレームワークの自然損失関数は、予測された入力パラメータによって誘導される決定の最適度を測定することである。
本研究では,SPOT(SPO Trees)と呼ばれる抽出可能な手法を提案する。
論文 参考訳(メタデータ) (2020-02-29T23:04:59Z) - PatDNN: Achieving Real-Time DNN Execution on Mobile Devices with
Pattern-based Weight Pruning [57.20262984116752]
粗粒構造の内部に新しい次元、きめ細かなプルーニングパターンを導入し、これまで知られていなかった設計空間の点を明らかにした。
きめ細かいプルーニングパターンによって高い精度が実現されているため、コンパイラを使ってハードウェア効率を向上し、保証することがユニークな洞察である。
論文 参考訳(メタデータ) (2020-01-01T04:52:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。