論文の概要: An Energy-Efficient Quad-Camera Visual System for Autonomous Machines on
FPGA Platform
- arxiv url: http://arxiv.org/abs/2104.00192v1
- Date: Thu, 1 Apr 2021 01:42:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 13:20:51.356076
- Title: An Energy-Efficient Quad-Camera Visual System for Autonomous Machines on
FPGA Platform
- Title(参考訳): fpgaプラットフォーム上での自律機械のための省エネルギークアッドカメラ視覚システム
- Authors: Zishen Wan, Yuyang Zhang, Arijit Raychowdhury, Bo Yu, Yanjun Zhang,
Shaoshan Liu
- Abstract要約: FPGA上でのORBに基づくローカライゼーションシステムのためのエネルギー効率の高いハードウェアアーキテクチャの設計と実装について述べる。
Nvidia TX1 と Intel i7 と比較して,FPGA ベースの実装 5.6x と 3.4x の高速化に加えて,それぞれ 3.0x と 34.6x の消費電力削減を実現しています。
- 参考スコア(独自算出の注目度): 5.5973461032148295
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In our past few years' of commercial deployment experiences, we identify
localization as a critical task in autonomous machine applications, and a great
acceleration target. In this paper, based on the observation that the visual
frontend is a major performance and energy consumption bottleneck, we present
our design and implementation of an energy-efficient hardware architecture for
ORB (Oriented-Fast and Rotated- BRIEF) based localization system on FPGAs. To
support our multi-sensor autonomous machine localization system, we present
hardware synchronization, frame-multiplexing, and parallelization techniques,
which are integrated in our design. Compared to Nvidia TX1 and Intel i7, our
FPGA-based implementation achieves 5.6x and 3.4x speedup, as well as 3.0x and
34.6x power reduction, respectively.
- Abstract(参考訳): 過去数年間の商用展開経験では、ローカライゼーションは自律型マシンアプリケーションにおいて重要なタスクであり、大きな加速目標であると見なしています。
本稿では,orb(oriented-fast and rotationd- brief)ベースのfpgaローカライズシステムのためのエネルギー効率の高いハードウェアアーキテクチャの設計と実装について述べる。
マルチセンサ自律型マシンローカライズシステムをサポートするために,ハードウェア同期,フレーム多重化,並列化技術を提案する。
Nvidia TX1とIntel i7と比較して、FPGAベースの実装では、それぞれ5.6xと3.4xのスピードアップ、3.0xと34.6xの消費電力削減を実現しています。
関連論文リスト
- Efficient Edge AI: Deploying Convolutional Neural Networks on FPGA with the Gemmini Accelerator [0.5714074111744111]
我々は、Gemminiアクセラレーターを用いて、FPGA(Field Programmable Gate Arrays)上にCNNを配置するためのエンドツーエンドワークフローを提示する。
Xilinx ZCU102 FPGA 上で YOLOv7 モデルを36.5 GOP/s/W のエネルギー効率で実装することにより,リアルタイムな性能を実現することができた。
論文 参考訳(メタデータ) (2024-08-14T09:24:00Z) - Quasar-ViT: Hardware-Oriented Quantization-Aware Architecture Search for Vision Transformers [56.37495946212932]
視覚変換器(ViT)は、畳み込みニューラルネットワーク(CNN)と比較して、コンピュータビジョンタスクにおいて優れた精度を示す。
ハードウェア指向の量子化対応アーキテクチャ検索フレームワークであるQuasar-ViTを提案する。
論文 参考訳(メタデータ) (2024-07-25T16:35:46Z) - CHOSEN: Compilation to Hardware Optimization Stack for Efficient Vision Transformer Inference [4.523939613157408]
ビジョントランスフォーマー(ViT)は、コンピュータビジョンへの機械学習アプローチにおける画期的なシフトである。
本稿では,これらの課題に対処するソフトウェアハードウェアの共同設計フレームワークであるCHOSENを紹介し,FPGA上にViTをデプロイするための自動フレームワークを提供する。
ChoSENはDeiT-SとDeiT-Bモデルのスループットを1.5倍と1.42倍改善した。
論文 参考訳(メタデータ) (2024-07-17T16:56:06Z) - SATAY: A Streaming Architecture Toolflow for Accelerating YOLO Models on
FPGA Devices [48.47320494918925]
この作業は、超低レイテンシアプリケーションのために、最先端のオブジェクト検出モデルをFPGAデバイスにデプロイする際の課題に対処する。
YOLOアクセラレータにはストリーミングアーキテクチャ設計を採用しており、チップ上で完全なモデルを深くパイプライン化して実装しています。
データフロー方式でYOLOモデルの動作をサポートする新しいハードウェアコンポーネントを導入し、オンチップメモリリソースの制限に対処するために、オフチップメモリバッファリングを導入する。
論文 参考訳(メタデータ) (2023-09-04T13:15:01Z) - HARFLOW3D: A Latency-Oriented 3D-CNN Accelerator Toolflow for HAR on
FPGA Devices [71.45672882756001]
本研究では,3次元畳み込みニューラルネットワークをFPGAにマッピングするための,新しいストリーミングアーキテクチャベースのツールフローを提案する。
HARFLOW3Dツールフローは、ONNXフォーマットで3D CNNを入力し、FPGAの特性を記述する。
ツールフローが幅広いモデルやデバイスをサポートする能力は、様々な3D CNNとFPGAシステムペアに関する数多くの実験を通して示される。
論文 参考訳(メタデータ) (2023-03-30T08:25:27Z) - Auto-ViT-Acc: An FPGA-Aware Automatic Acceleration Framework for Vision
Transformer with Mixed-Scheme Quantization [78.18328503396057]
コンピュータビジョンタスクにおいて、視覚変換器(ViT)は大幅に精度が向上している。
本研究は,提案した混合スキーム量子化に基づくFPGA対応自動ViT加速フレームワークを提案する。
論文 参考訳(メタデータ) (2022-08-10T05:54:46Z) - Eventor: An Efficient Event-Based Monocular Multi-View Stereo
Accelerator on FPGA Platform [11.962626341154609]
イベントカメラはバイオインスパイアされた視覚センサーで、イベントストリームとしてピクセルレベルの明るさ変化を非同期に表現する。
EMVSは、イベントストリームを利用して、既知の軌道を持つ半密度の3D構造を推定するテクニックである。
本稿では、最も重要かつ時間を要するステージを実現することにより、高速かつ効率的なEMVSアクセラレータとしてEventorを提案する。
論文 参考訳(メタデータ) (2022-03-29T11:13:36Z) - VAQF: Fully Automatic Software-hardware Co-design Framework for Low-bit
Vision Transformer [121.85581713299918]
量子化ビジョントランス(ViT)のためのFPGAプラットフォーム上で推論アクセラレータを構築するフレームワークVAQFを提案する。
モデル構造と所望のフレームレートから、VAQFはアクティベーションに必要な量子化精度を自動的に出力する。
FPGA上でのViTアクセラレーションに量子化が組み込まれたのはこれが初めてである。
論文 参考訳(メタデータ) (2022-01-17T20:27:52Z) - JUWELS Booster -- A Supercomputer for Large-Scale AI Research [79.02246047353273]
本稿では、最近J'ulich Supercomputing Centerに委託された高性能コンピューティングシステムであるJUWELS Boosterを紹介する。
システムアーキテクチャ、並列性、分散モデルトレーニング、その優れたパフォーマンスを示すベンチマークについて詳述する。
論文 参考訳(メタデータ) (2021-06-30T21:37:02Z) - iELAS: An ELAS-Based Energy-Efficient Accelerator for Real-Time Stereo
Matching on FPGA Platform [21.435663827158564]
FPGAプラットフォーム上でのリアルタイムELASステレオマッチングのためのエネルギー効率の高いアーキテクチャを提案する。
当社のFPGA実現は、38.4xと3.32xのフレームレート改善、27.1xと1.13xのエネルギー効率改善を実現します。
論文 参考訳(メタデータ) (2021-04-11T21:22:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。