論文の概要: fpgaHART: A toolflow for throughput-oriented acceleration of 3D CNNs for
HAR onto FPGAs
- arxiv url: http://arxiv.org/abs/2305.19896v1
- Date: Wed, 31 May 2023 14:30:17 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-01 16:01:30.384276
- Title: fpgaHART: A toolflow for throughput-oriented acceleration of 3D CNNs for
HAR onto FPGAs
- Title(参考訳): fpgaHART: HAR用3D CNNのFPGAへのスループット指向のアクセラレーションのためのツールフロー
- Authors: Petros Toupas, Christos-Savvas Bouganis, Dimitrios Tzovaras
- Abstract要約: 本研究では,人間行動認識のための3次元CNNモデルのFPGAデバイスへのマッピングを最適化するツールフローを提案する。
提案システムでは、SDFグラフを用いて設計をモデル化し、設計空間の拡大と探索のための変換を導入する。
複数のFPGAデバイス上で提案したツールフローを用いて,様々な3D CNNモデルの評価を行い,その性能向上の可能性を示した。
- 参考スコア(独自算出の注目度): 10.385864925381384
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Surveillance systems, autonomous vehicles, human monitoring systems, and
video retrieval are just few of the many applications in which 3D Convolutional
Neural Networks are exploited. However, their extensive use is restricted by
their high computational and memory requirements, especially when integrated
into systems with limited resources. This study proposes a toolflow that
optimises the mapping of 3D CNN models for Human Action Recognition onto FPGA
devices, taking into account FPGA resources and off-chip memory
characteristics. The proposed system employs Synchronous Dataflow (SDF) graphs
to model the designs and introduces transformations to expand and explore the
design space, resulting in high-throughput designs. A variety of 3D CNN models
were evaluated using the proposed toolflow on multiple FPGA devices,
demonstrating its potential to deliver competitive performance compared to
earlier hand-tuned and model-specific designs.
- Abstract(参考訳): サーベイランスシステム、自動運転車、人間の監視システム、ビデオ検索は、3D畳み込みニューラルネットワークを利用する多くのアプリケーションの中でごくわずかである。
しかし、その広範な使用は、特にリソースの少ないシステムに統合された場合、高い計算能力とメモリ要件によって制限される。
本研究では,fpgaのリソースとオフチップメモリ特性を考慮した3次元cnnモデルのfpgaデバイスへのマッピングを最適化するツールフローを提案する。
提案システムでは,SDFグラフを用いて設計をモデル化し,設計空間の拡張と探索を行う変換を導入し,高スループット設計を実現する。
複数のfpgaデバイスで提案したツールフローを用いて様々な3d cnnモデルを評価し、従来のハンドチューニングやモデル固有の設計と比較して競合性能を提供する可能性を示した。
関連論文リスト
- SATAY: A Streaming Architecture Toolflow for Accelerating YOLO Models on
FPGA Devices [48.47320494918925]
この作業は、超低レイテンシアプリケーションのために、最先端のオブジェクト検出モデルをFPGAデバイスにデプロイする際の課題に対処する。
YOLOアクセラレータにはストリーミングアーキテクチャ設計を採用しており、チップ上で完全なモデルを深くパイプライン化して実装しています。
データフロー方式でYOLOモデルの動作をサポートする新しいハードウェアコンポーネントを導入し、オンチップメモリリソースの制限に対処するために、オフチップメモリバッファリングを導入する。
論文 参考訳(メタデータ) (2023-09-04T13:15:01Z) - FMM-X3D: FPGA-based modeling and mapping of X3D for Human Action
Recognition [10.385864925381384]
本稿では,人間行動認識の最先端モデルであるX3DをFPGAデバイスにマッピングする問題に対処する。
提案するツールフローは,FPGAデバイスの利用可能なリソースとオフチップメモリ特性を考慮した最適化ストリームベースハードウェアシステムを生成する。
論文 参考訳(メタデータ) (2023-05-29T11:17:51Z) - HARFLOW3D: A Latency-Oriented 3D-CNN Accelerator Toolflow for HAR on
FPGA Devices [71.45672882756001]
本研究では,3次元畳み込みニューラルネットワークをFPGAにマッピングするための,新しいストリーミングアーキテクチャベースのツールフローを提案する。
HARFLOW3Dツールフローは、ONNXフォーマットで3D CNNを入力し、FPGAの特性を記述する。
ツールフローが幅広いモデルやデバイスをサポートする能力は、様々な3D CNNとFPGAシステムペアに関する数多くの実験を通して示される。
論文 参考訳(メタデータ) (2023-03-30T08:25:27Z) - NeRF-GAN Distillation for Efficient 3D-Aware Generation with
Convolutions [97.27105725738016]
GAN(Generative Adversarial Networks)のようなニューラルラジアンスフィールド(NeRF)と生成モデルの統合は、単一ビュー画像から3D認識生成を変換した。
提案手法は,ポーズ条件付き畳み込みネットワークにおいて,事前学習したNeRF-GANの有界遅延空間を再利用し,基礎となる3次元表現に対応する3D一貫性画像を直接生成する手法である。
論文 参考訳(メタデータ) (2023-03-22T18:59:48Z) - Fluid Batching: Exit-Aware Preemptive Serving of Early-Exit Neural
Networks on Edge NPUs [74.83613252825754]
スマートエコシステム(smart ecosystems)"は、スタンドアロンではなく、センセーションが同時に行われるように形成されています。
これはデバイス上の推論パラダイムを、エッジにニューラル処理ユニット(NPU)をデプロイする方向にシフトしている。
そこで本研究では,実行時のプリエンプションが到着・終了プロセスによってもたらされる動的性を考慮に入れた,新しい早期終了スケジューリングを提案する。
論文 参考訳(メタデータ) (2022-09-27T15:04:01Z) - Optimization of FPGA-based CNN Accelerators Using Metaheuristics [1.854931308524932]
畳み込みニューラルネットワーク(CNN)は、多くの分野における問題解決能力を実証している。
FPGAはCNN推論を加速する関心が高まっている。
FPGAベースのCNNアクセラレータの現在のトレンドは、複数の畳み込み層プロセッサ(CLP)を実装することである。
論文 参考訳(メタデータ) (2022-09-22T18:57:49Z) - FPGA-optimized Hardware acceleration for Spiking Neural Networks [69.49429223251178]
本研究は,画像認識タスクに適用したオフライントレーニングによるSNN用ハードウェアアクセラレータの開発について述べる。
この設計はXilinx Artix-7 FPGAをターゲットにしており、利用可能なハードウェアリソースの40%を合計で使用している。
分類時間を3桁に短縮し、ソフトウェアと比較すると精度にわずか4.5%の影響を与えている。
論文 参考訳(メタデータ) (2022-01-18T13:59:22Z) - HALF: Holistic Auto Machine Learning for FPGAs [1.9146960682777232]
ディープニューラルネットワーク(DNN)は、画像や自然言語処理などの組み込みシステムに関連する領域において、複雑な問題を解決することができる。
特定のFPGAプラットフォームにDNNを効率よく実装するためには、例えばエネルギー効率など、膨大な設計パラメータを考慮する必要がある。
FPGA上でのDNN実装の質は, 自動的, 全体的設計手法により大幅に向上する。
論文 参考訳(メタデータ) (2021-06-28T14:45:47Z) - unzipFPGA: Enhancing FPGA-based CNN Engines with On-the-Fly Weights
Generation [17.142094527372993]
singlevolution engineはfpgaベースの畳み込みニューラルネットワーク(cnns)の一般的な設計選択となっている。
本研究では,実行時の重みを減圧するプレコンステージを導入するモデル群に対して,cnnエンジンの設計が与える影響について検討する。
メモリバウンド層に対する帯域幅の制限による負の影響を最小限に抑えるため,重みのオンザフライ生成を可能にするハードウェアコンポーネントを提案する。
論文 参考訳(メタデータ) (2021-03-09T18:19:41Z) - ASFD: Automatic and Scalable Face Detector [129.82350993748258]
ASFD(Automatic and Scalable Face Detector)を提案する。
ASFDはニューラルアーキテクチャ検索技術の組み合わせと新たな損失設計に基づいている。
ASFD-D0は120FPS以上で動作し、MobilenetはVGA解像度の画像を撮影しています。
論文 参考訳(メタデータ) (2020-03-25T06:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。