論文の概要: A Column Streaming-Based Convolution Engine and Mapping Algorithm for
CNN-based Edge AI accelerators
- arxiv url: http://arxiv.org/abs/2109.07601v1
- Date: Wed, 15 Sep 2021 22:22:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-17 14:05:00.653549
- Title: A Column Streaming-Based Convolution Engine and Mapping Algorithm for
CNN-based Edge AI accelerators
- Title(参考訳): CNNベースのエッジAIアクセラレータのためのカラムストリーミングベースの畳み込みエンジンとマッピングアルゴリズム
- Authors: Weison Lin and Tughrul Arslan
- Abstract要約: エッジAIアクセラレーターは、無人航空機(UAV)、画像認識センサー、ウェアラブルデバイス、ロボティクス、リモートセンシング衛星などの分野における顧客の近距離応用のソリューションとして浮上している。
これらのアプリケーションは、性能目標を満たすだけでなく、移動性や限られた電力源のために、厳密なエリアと電力制約を満たす必要がある。
エッジAIアクセラレータにおける異なるCNNアルゴリズムの適用性の観点から、フレキシブルな処理要素の列セットを含む列ストリーミングベースの畳み込みエンジンが提案されている。
- 参考スコア(独自算出の注目度): 0.8702432681310399
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Edge AI accelerators have been emerging as a solution for near customers'
applications in areas such as unmanned aerial vehicles (UAVs), image
recognition sensors, wearable devices, robotics, and remote sensing satellites.
These applications not only require meeting performance targets but also
meeting strict area and power constraints due to their portable mobility
feature and limited power sources. As a result, a column streaming-based
convolution engine has been proposed in this paper that includes column sets of
processing elements design for flexibility in terms of the applicability for
different CNN algorithms in edge AI accelerators. Comparing to a commercialized
CNN accelerator, the key results reveal that the column streaming-based
convolution engine requires similar execution cycles for processing a 227 x 227
feature map with avoiding zero-padding penalties.
- Abstract(参考訳): エッジAIアクセラレーターは、無人航空機(UAV)、画像認識センサー、ウェアラブルデバイス、ロボティクス、リモートセンシング衛星などの分野における顧客の近距離応用のソリューションとして浮上している。
これらのアプリケーションは、性能目標を満たすだけでなく、移動性や限られた電力源のために、厳しいエリアと電力制約を満たす必要がある。
その結果、エッジaiアクセラレータにおける様々なcnnアルゴリズムの適用可能性の観点から、柔軟性のために設計された処理要素の列セットを含むカラムストリーミングベースの畳み込みエンジンが提案されている。
商用化されたcnnアクセラレータと比較すると、このカラムストリーミングベースの畳み込みエンジンは、227 x 227の機能マップをゼロパディングペナルティを避けるために同様の実行サイクルを必要とすることが明らかになった。
関連論文リスト
- Real-Time Pedestrian Detection on IoT Edge Devices: A Lightweight Deep Learning Approach [1.4732811715354455]
本研究では,AIoT(Artificial Intelligence of Things)エッジデバイス上での軽量ディープラーニングモデルの実装について検討する。
You Only Look Once (YOLO)ベースのDLモデルは、リアルタイムな歩行者検出のためにデプロイされる。
シミュレーションの結果、最適化されたYOLOモデルは、高速な推論速度147ミリ秒、フレームレート2.3フレーム/秒、精度78%でリアルタイムな歩行者検出を実現できることが示された。
論文 参考訳(メタデータ) (2024-09-24T04:48:41Z) - SATAY: A Streaming Architecture Toolflow for Accelerating YOLO Models on
FPGA Devices [48.47320494918925]
この作業は、超低レイテンシアプリケーションのために、最先端のオブジェクト検出モデルをFPGAデバイスにデプロイする際の課題に対処する。
YOLOアクセラレータにはストリーミングアーキテクチャ設計を採用しており、チップ上で完全なモデルを深くパイプライン化して実装しています。
データフロー方式でYOLOモデルの動作をサポートする新しいハードウェアコンポーネントを導入し、オンチップメモリリソースの制限に対処するために、オフチップメモリバッファリングを導入する。
論文 参考訳(メタデータ) (2023-09-04T13:15:01Z) - UnLoc: A Universal Localization Method for Autonomous Vehicles using
LiDAR, Radar and/or Camera Input [51.150605800173366]
UnLocは、全ての気象条件におけるマルチセンサー入力によるローカライズのための、新しい統一型ニューラルネットワークアプローチである。
本手法は,Oxford Radar RobotCar,Apollo SouthBay,Perth-WAの各データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-07-03T04:10:55Z) - Task-Oriented Over-the-Air Computation for Multi-Device Edge AI [57.50247872182593]
エッジAIをサポートするための6Gネットワークは、AIタスクの効率的かつ効率的な実行に焦点を当てたタスク指向のテクニックを備えている。
本稿では,マルチデバイススプリット推論システムにおけるタスク指向オーバー・ザ・エア計算(AirComp)方式を提案する。
論文 参考訳(メタデータ) (2022-11-02T16:35:14Z) - Efficient Perception, Planning, and Control Algorithm for Vision-Based Automated Vehicles [0.0]
本研究は、視覚に基づく自動車両の運転のための効率的な枠組みを提案する。
このフレームワークは単眼カメラとレーダーのみを必要とする。
実験により、提案された自律運転システムは、現在の自動運転車に適用可能であることが示された。
論文 参考訳(メタデータ) (2022-09-15T04:51:17Z) - A Near Sensor Edge Computing System for Point Cloud Semantic
Segmentation [12.997562735505364]
範囲ビューに基づく軽量な点クラウドセマンティックセマンティックセマンティックネットワークを提案する。
我々のネットワークは,計算効率42.5 GOP/Wで,Xilinx DPU上で10フレーム/秒(fps)を達成した。
論文 参考訳(メタデータ) (2022-07-12T23:32:11Z) - Task-Oriented Sensing, Computation, and Communication Integration for
Multi-Device Edge AI [108.08079323459822]
本稿では,AIモデルの分割推論と統合センシング通信(ISAC)を併用した,新しいマルチインテリジェントエッジ人工レイテンシ(AI)システムについて検討する。
推定精度は近似的だが抽出可能な計量、すなわち判別利得を用いて測定する。
論文 参考訳(メタデータ) (2022-07-03T06:57:07Z) - ARTSeg: Employing Attention for Thermal images Semantic Segmentation [6.060020806741279]
サーマルセマンティックセグメンテーションのためのARTSegという,アテンションベースのRecurrent Convolution Network (RCNN)エンコーダ・デコーダアーキテクチャを設計した。
提案手法の有効性を公開データセット上で評価し, 平均和合(IoU)における他の最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2021-11-30T10:17:28Z) - EffCNet: An Efficient CondenseNet for Image Classification on NXP
BlueBox [0.0]
エッジデバイスは、安価なハードウェアと限られた冷却と計算資源のために、限られた処理能力を提供する。
我々はエッジデバイスのためのEffCNetと呼ばれる新しいディープ畳み込みニューラルネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2021-11-28T21:32:31Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - Energy-Efficient Model Compression and Splitting for Collaborative
Inference Over Time-Varying Channels [52.60092598312894]
本稿では,エッジノードとリモートノード間のモデル圧縮と時間変化モデル分割を利用して,エッジデバイスにおける総エネルギーコストを削減する手法を提案する。
提案手法は, 検討されたベースラインと比較して, エネルギー消費が最小限であり, 排出コストが$CO$となる。
論文 参考訳(メタデータ) (2021-06-02T07:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。