論文の概要: DynamicDet: A Unified Dynamic Architecture for Object Detection
- arxiv url: http://arxiv.org/abs/2304.05552v1
- Date: Wed, 12 Apr 2023 01:16:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-13 16:25:52.143296
- Title: DynamicDet: A Unified Dynamic Architecture for Object Detection
- Title(参考訳): dynamicdet: オブジェクト検出のための統一的な動的アーキテクチャ
- Authors: Zhihao Lin, Yongtao Wang, Jinhe Zhang, Xiaojie Chu
- Abstract要約: オブジェクト検出のための動的フレームワークであるDynamicDetを提案する。
動的検出器の検出損失に基づく出口基準を用いた新しい最適化手法を提案する。
COCOベンチマークで行った実験は、提案したDynamicDetが新しい最先端の精度-速度トレードオフを実現することを示した。
- 参考スコア(独自算出の注目度): 9.719671347009827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic neural network is an emerging research topic in deep learning. With
adaptive inference, dynamic models can achieve remarkable accuracy and
computational efficiency. However, it is challenging to design a powerful
dynamic detector, because of no suitable dynamic architecture and exiting
criterion for object detection. To tackle these difficulties, we propose a
dynamic framework for object detection, named DynamicDet. Firstly, we carefully
design a dynamic architecture based on the nature of the object detection task.
Then, we propose an adaptive router to analyze the multi-scale information and
to decide the inference route automatically. We also present a novel
optimization strategy with an exiting criterion based on the detection losses
for our dynamic detectors. Last, we present a variable-speed inference
strategy, which helps to realize a wide range of accuracy-speed trade-offs with
only one dynamic detector. Extensive experiments conducted on the COCO
benchmark demonstrate that the proposed DynamicDet achieves new
state-of-the-art accuracy-speed trade-offs. For instance, with comparable
accuracy, the inference speed of our dynamic detector Dy-YOLOv7-W6 surpasses
YOLOv7-E6 by 12%, YOLOv7-D6 by 17%, and YOLOv7-E6E by 39%. The code is
available at https://github.com/VDIGPKU/DynamicDet.
- Abstract(参考訳): 動的ニューラルネットワークは、ディープラーニングにおける新たな研究トピックである。
適応推論により、動的モデルは驚くべき精度と計算効率を達成することができる。
しかし、適切な動的アーキテクチャや物体検出の基準を外すことができないため、強力な動的検出器を設計することは困難である。
このような問題に対処するため,DynamicDetというオブジェクト検出のための動的フレームワークを提案する。
まず,オブジェクト検出タスクの性質に基づいて動的アーキテクチャを慎重に設計する。
そこで我々は,マルチスケール情報を分析し,推論経路を自動的に決定する適応ルータを提案する。
また, 動的検出器の検出損失に基づいて, 出口基準を用いた新しい最適化手法を提案する。
最後に,1つの動的検出器だけで広範囲の精度・速度トレードオフを実現するための可変速推論戦略を提案する。
COCOベンチマークで実施された大規模な実験により、提案したDynamicDetは、最先端の精度-速度トレードオフを新たに達成することを示した。
例えば、我々の動的検出器Dy-YOLOv7-W6の推論速度は、YOLOv7-E6を12%上回り、YOLOv7-D6を17%上回り、YOLOv7-E6Eを39%上回る。
コードはhttps://github.com/VDIGPKU/DynamicDet.comで入手できる。
関連論文リスト
- Deep Generic Dynamic Object Detection Based on Dynamic Grid Maps [39.58317527488534]
本稿では,自動走行のためのジェネリック・ダイナミック・オブジェクトを検出する手法について述べる。
動的オブジェクトの存在を推測するために、LiDARベースの動的グリッドがオンラインで生成される。
ディープラーニングに基づく検出器は、任意のタイプの動的オブジェクトの存在を推測するために、動的グリッド上で訓練される。
論文 参考訳(メタデータ) (2024-10-18T18:15:32Z) - Learn to Memorize and to Forget: A Continual Learning Perspective of Dynamic SLAM [17.661231232206028]
暗黙的な神経表現を伴う同時局所化とマッピング(SLAM)が注目されている。
動的環境のための新しいSLAMフレームワークを提案する。
論文 参考訳(メタデータ) (2024-07-18T09:35:48Z) - Neuromorphic Vision-based Motion Segmentation with Graph Transformer Neural Network [4.386534439007928]
本稿では,GTNNと呼ばれるグラフトランスフォーマーニューラルネットワークを用いたイベントベース動作分割アルゴリズムを提案する。
提案アルゴリズムは, イベント間の局所的および大域的相関を明らかにするために, 一連の非線形変換により, イベントストリームを3次元グラフとして処理する。
GTNNは、動的背景変動、動きパターン、および様々な大きさと速度を持つ複数の動的物体の存在下で、最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-04-16T22:44:29Z) - Dynamics-aware Adversarial Attack of Adaptive Neural Networks [75.50214601278455]
適応型ニューラルネットワークの動的対向攻撃問題について検討する。
本稿では,LGM(Leaded Gradient Method)を提案する。
我々のLGMは、動的無意識攻撃法と比較して、優れた敵攻撃性能を達成している。
論文 参考訳(メタデータ) (2022-10-15T01:32:08Z) - Using Detection, Tracking and Prediction in Visual SLAM to Achieve
Real-time Semantic Mapping of Dynamic Scenarios [70.70421502784598]
RDS-SLAMは、一般的に使用されているIntel Core i7 CPUのみを使用して、動的シナリオのためのオブジェクトレベルでのセマンティックマップをリアルタイムで構築することができる。
我々は, TUM RGB-DデータセットにおけるRDS-SLAMを評価し, 動的シナリオにおいて, RDS-SLAMはフレームあたり30.3msで動作可能であることを示した。
論文 参考訳(メタデータ) (2022-10-10T11:03:32Z) - Gradient-Based Trajectory Optimization With Learned Dynamics [80.41791191022139]
データからシステムの微分可能なダイナミクスモデルを学習するために、機械学習技術を使用します。
ニューラルネットワークは、大規模な時間的地平線に対して、非常に非線形な振る舞いを正確にモデル化できることが示される。
ハードウェア実験において、学習したモデルがSpotとRadio- controlled (RC)の両方の複雑な力学を表現できることを実証した。
論文 参考訳(メタデータ) (2022-04-09T22:07:34Z) - Learning to Generate Content-Aware Dynamic Detectors [62.74209921174237]
サンプル適応型モデルアーキテクチャを自動的に生成する効率的な検出器の設計を新たに導入する。
動的ルーティングの学習を導くために、オブジェクト検出に適したコースツーファインの成層図を紹介します。
MS-COCOデータセットの実験により、CADDetはバニラルーティングに比べて10%少ないFLOPで1.8以上のmAPを達成することが示された。
論文 参考訳(メタデータ) (2020-12-08T08:05:20Z) - DOT: Dynamic Object Tracking for Visual SLAM [83.69544718120167]
DOTはインスタンスセグメンテーションとマルチビュー幾何を組み合わせて、動的オブジェクトのマスクを生成する。
実際にどのオブジェクトが動いているかを判断するために、DOTは、潜在的にダイナミックなオブジェクトの最初のインスタンスを抽出し、次に推定されたカメラモーションで、測光再投射誤差を最小限にして、そのようなオブジェクトを追跡する。
提案手法はORB-SLAM 2の精度とロバスト性を大幅に向上することを示す。
論文 参考訳(メタデータ) (2020-09-30T18:36:28Z) - A Progressive Sub-Network Searching Framework for Dynamic Inference [33.93841415140311]
本稿では、トレーニング可能なノイズランキング、チャネルグループ、微調整しきい値設定、サブネット再選択など、いくつかの効果的な手法を組み込んだプログレッシブサブネット探索フレームワークを提案する。
提案手法は,従来普及していたUniversally-Slimmable-Networkの4.4%と平均2.3%と,モデルサイズが同じであるImageNetデータセットと比較して,より優れた動的推論精度を実現する。
論文 参考訳(メタデータ) (2020-09-11T22:56:02Z) - Dynamic R-CNN: Towards High Quality Object Detection via Dynamic
Training [70.2914594796002]
ラベル割り当て基準と回帰損失関数の形状を調整するための動的R-CNNを提案する。
我々はResNet-50-FPNベースラインを1.9%のAPと5.5%のAP$_90$で改善し、余分なオーバーヘッドを伴わない。
論文 参考訳(メタデータ) (2020-04-13T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。