論文の概要: Deployment of Deep Neural Networks for Object Detection on Edge AI
Devices with Runtime Optimization
- arxiv url: http://arxiv.org/abs/2108.08166v1
- Date: Wed, 18 Aug 2021 14:21:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-19 14:29:16.281356
- Title: Deployment of Deep Neural Networks for Object Detection on Edge AI
Devices with Runtime Optimization
- Title(参考訳): 実行時最適化によるエッジAIデバイスにおける物体検出のためのディープニューラルネットワークの展開
- Authors: Lukas St\"acker, Juncong Fei, Philipp Heidenreich, Frank Bonarens,
Jason Rambach, Didier Stricker, and Christoph Stiller
- Abstract要約: エッジAIプラットフォームに2つの代表的なオブジェクト検出ネットワークを配置することを検討する。
特に、画像ベースの2Dオブジェクト検出のためのRetinaNetと、LiDARベースの3Dオブジェクト検出のためのPointPillarsについて検討する。
我々はRTとTorchScriptの2つの異なるライブラリを用いて,デプロイアルゴリズムのランタイムを評価する。
- 参考スコア(独自算出の注目度): 11.408144862469172
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep neural networks have proven increasingly important for automotive scene
understanding with new algorithms offering constant improvements of the
detection performance. However, there is little emphasis on experiences and
needs for deployment in embedded environments. We therefore perform a case
study of the deployment of two representative object detection networks on an
edge AI platform. In particular, we consider RetinaNet for image-based 2D
object detection and PointPillars for LiDAR-based 3D object detection. We
describe the modifications necessary to convert the algorithms from a PyTorch
training environment to the deployment environment taking into account the
available tools. We evaluate the runtime of the deployed DNN using two
different libraries, TensorRT and TorchScript. In our experiments, we observe
slight advantages of TensorRT for convolutional layers and TorchScript for
fully connected layers. We also study the trade-off between runtime and
performance, when selecting an optimized setup for deployment, and observe that
quantization significantly reduces the runtime while having only little impact
on the detection performance.
- Abstract(参考訳): 深層ニューラルネットワークは、検出性能を常に改善する新しいアルゴリズムによって、自動車のシーン理解においてますます重要になっている。
しかし、組み込み環境での経験やデプロイの必要性にはほとんど重点を置いていない。
そこで我々は,エッジaiプラットフォーム上に2つの代表的オブジェクト検出ネットワークを配置する事例研究を行う。
特に、画像ベースの2Dオブジェクト検出のためのRetinaNetと、LiDARベースの3Dオブジェクト検出のためのPointPillarsを考える。
利用可能なツールを考慮したPyTorchトレーニング環境からデプロイメント環境へのアルゴリズム変換に必要な変更について述べる。
我々は、TensorRTとTorchScriptの2つの異なるライブラリを用いて、デプロイされたDNNのランタイムを評価する。
実験では,畳み込み層に対するtensorrtと完全連結層に対するtorchscriptのわずかな利点を観察した。
また、デプロイ用に最適化されたセットアップを選択する際に、ランタイムとパフォーマンスのトレードオフを調査し、量子化が検出性能にほとんど影響を与えずにランタイムを著しく減少させるのを観察します。
関連論文リスト
- EfficientCD: A New Strategy For Change Detection Based With Bi-temporal Layers Exchanged [3.3885253104046993]
本稿では,リモートセンシング画像変化検出のためのEfficientCDという新しいディープラーニングフレームワークを提案する。
このフレームワークは機能抽出のバックボーンネットワークとしてEfficientNetを使用している。
EfficientCDは4つのリモートセンシングデータセットで実験的に検証されている。
論文 参考訳(メタデータ) (2024-07-22T19:11:50Z) - A Point-Based Approach to Efficient LiDAR Multi-Task Perception [49.91741677556553]
PAttFormerは、ポイントクラウドにおける共同セマンティックセグメンテーションとオブジェクト検出のための効率的なマルチタスクアーキテクチャである。
他のLiDARベースのマルチタスクアーキテクチャとは異なり、提案したPAttFormerはタスク固有のポイントクラウド表現のために別の機能エンコーダを必要としない。
マルチタスク学習では,mIouでは+1.7%,mAPでは3Dオブジェクト検出では+1.7%,LiDARセマンティックセマンティックセグメンテーションは+1.7%向上した。
論文 参考訳(メタデータ) (2024-04-19T11:24:34Z) - ELGC-Net: Efficient Local-Global Context Aggregation for Remote Sensing Change Detection [65.59969454655996]
本稿では,変化領域を正確に推定するために,リッチな文脈情報を利用する効率的な変化検出フレームワークELGC-Netを提案する。
提案するELGC-Netは、リモートセンシング変更検出ベンチマークにおいて、最先端の性能を新たに設定する。
また,ELGC-Net-LWも導入した。
論文 参考訳(メタデータ) (2024-03-26T17:46:25Z) - AOP-Net: All-in-One Perception Network for Joint LiDAR-based 3D Object
Detection and Panoptic Segmentation [9.513467995188634]
AOP-NetはLiDARベースのマルチタスクフレームワークで、3Dオブジェクトの検出とパノプティクスのセグメンテーションを組み合わせたものである。
AOP-Netは、nuScenesベンチマークにおける3Dオブジェクト検出とパノプティクスセグメンテーションの両タスクについて、最先端のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2023-02-02T05:31:53Z) - Anytime-Lidar: Deadline-aware 3D Object Detection [5.491655566898372]
スケジューリングアルゴリズムを提案する。このアルゴリズムは,コンポーネントのサブセットをインテリジェントに選択し,有効時間と高精度のトレードオフをオンザフライで行う。
我々は,最先端の3Dオブジェクト検出ネットワークであるPointPillarsにアプローチを適用し,Jetson Xavier AGXデータセットの性能評価を行った。
論文 参考訳(メタデータ) (2022-08-25T16:07:10Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - A Single-Target License Plate Detection with Attention [56.83051142257412]
ニューラルネットワークは一般にライセンスプレート検出(LPD)タスクに採用されており、パフォーマンスと精度が向上している。
LPDのような単一のオブジェクト検出タスクでは、修正された汎用オブジェクト検出は時間がかかり、複雑なシナリオや組み込みデバイスへのデプロイが困難すぎる面倒な重み付けファイルに対処できない。
論文 参考訳(メタデータ) (2021-12-12T03:00:03Z) - Edge-Detect: Edge-centric Network Intrusion Detection using Deep Neural
Network [0.0]
エッジノードは、Internet-of-Thingsエンドポイント上の複数のサイバー攻撃を検出するために不可欠である。
DLM技術を用いてエッジノードに対するDoS攻撃を検知する,軽量で高速かつ高精度なEdge-Detectモデルを開発した。
論文 参考訳(メタデータ) (2021-02-03T04:24:34Z) - PV-RCNN++: Point-Voxel Feature Set Abstraction With Local Vector
Representation for 3D Object Detection [100.60209139039472]
点雲からの正確な3次元検出を行うために,PointVoxel Region based Convolution Neural Networks (PVRCNNs)を提案する。
提案するPV-RCNNは,Openデータセットと高競争性KITTIベンチマークの両方において,従来の最先端3D検出方法よりも大幅に優れていた。
論文 参考訳(メタデータ) (2021-01-31T14:51:49Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Optimisation of the PointPillars network for 3D object detection in
point clouds [1.1470070927586016]
本稿では,3次元物体検出のための深層ニューラルネットワークの最適化について述べる。
我々は、検出精度と計算複雑性との間に合理的な妥協をもたらすPointPillarsネットワークの実験を行った。
これにより、低消費電力でリアルタイムのLiDARデータ処理が可能になる。
論文 参考訳(メタデータ) (2020-07-01T13:50:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。