Fugu-MT 論文翻訳(概要): Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

論文の概要: Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles

arxiv url: http://arxiv.org/abs/2206.02424v1
Date: Mon, 6 Jun 2022 08:34:52 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-07 16:12:45.332029
Title: Slim-neck by GSConv: A better design paradigm of detector architectures for autonomous vehicles
Title（参考訳）: Slim-neck by GSConv: 自動運転車用検出器アーキテクチャのより良い設計パラダイム
Authors: Hulin Li, Jun Li, Hanbing Wei, Zheng Liu, Zhenfei Zhan and Qiliang Ren
Abstract要約: 本稿では,モデルの軽量化と精度向上のための新しい手法GSConvを提案する。我々は、検出器の計算コスト効率を高めるために、スリムネックという設計パラダイムを提供する。
参考スコア（独自算出の注目度）: 6.30864225692394
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Object detection is a difficult downstream task in computer vision. For the on-board edge computing platforms, a giant model is difficult to achieve the real-time detection requirement. And, a lightweight model built from a large number of the depth-wise separable convolutional layers cannot achieve the sufficient accuracy. We introduce a new method, GSConv, to lighten the model but maintain the accuracy. The GSConv balances the model's accuracy and speed better. And, we provide a design paradigm, slim-neck, to achieve a higher computational cost-effectiveness of the detectors. In experiments, our method obtains state-of-the-art results (e.g. 70.9% mAP0.5 for the SO-DA10M at a speed of ~100FPS on a Tesla T4) compared with the original networks. Code will be open source.
Abstract（参考訳）: 物体検出はコンピュータビジョンにおいて難しい下流課題である。オンボードエッジコンピューティングプラットフォームでは、リアルタイム検出要求を達成するのが巨大なモデルである。また,多数の奥行き分離可能な畳み込み層から構築した軽量モデルでは,十分な精度が得られない。本稿では,モデルの軽量化と精度向上のための新しい手法GSConvを提案する。 GSConvはモデルの精度と速度のバランスが良くなる。また,より高い計算コスト効率を達成するための設計パラダイムであるslim-neckを提供する。実験では, 従来のネットワークと比較して, 現状の結果(例えば, SO-DA10Mの70.9% mAP0.5, テスラT4の約100FPS)を得た。コードはオープンソースになる。

関連論文リスト

HGO-YOLO: Advancing Anomaly Behavior Detection with Hierarchical Features and Lightweight Optimized Detection [0.0]
本研究では,HGNetv2アーキテクチャをYOLOv8に統合したHGO-YOLOを提案する。評価の結果,提案アルゴリズムはmAP@0.5の87.4%,リコールレート81.1%,モデルサイズは4.6MB,フレームレート56FPSであることがわかった。
論文参考訳（メタデータ） (2025-03-10T14:29:12Z)
Global Context Aggregation Network for Lightweight Saliency Detection of Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。 3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文参考訳（メタデータ） (2023-09-22T06:19:11Z)
ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。 ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文参考訳（メタデータ） (2023-08-18T02:06:49Z)
EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文参考訳（メタデータ） (2023-02-15T06:05:14Z)
Rethinking Voxelization and Classification for 3D Object Detection [68.8204255655161]
LiDARポイントクラウドからの3Dオブジェクト検出の主な課題は、ネットワークの信頼性に影響を与えることなく、リアルタイムのパフォーマンスを実現することである。本稿では,高速な動的ボキセラライザを実装することにより,ネットワークの推論速度と精度を同時に向上するソリューションを提案する。さらに,予測対象を分類し,偽検出対象をフィルタリングする軽量検出サブヘッドモデルを提案する。
論文参考訳（メタデータ） (2023-01-10T16:22:04Z)
Optimizing Anchor-based Detectors for Autonomous Driving Scenes [22.946814647030667]
本稿では、自律走行シーンにおける一般的なアンカーベース検出器のモデル改善と推定時間最適化について要約する。高性能RCNN-RSおよびRetinaNet-RS検出フレームワークに基づいて,群衆シーンの小さな物体をよりよく検出するために,検出器に適応するための一連のフレームワークの改善について検討した。
論文参考訳（メタデータ） (2022-08-11T22:44:59Z)
EResFD: Rediscovery of the Effectiveness of Standard Convolution for Lightweight Face Detection [13.357235715178584]
顔検出のための軽量バックボーンアーキテクチャとして,標準的な畳み込みブロックの有効性を再検討する。チャネル切断された標準畳み込み層は精度と推論速度を向上できることを示す。提案する検出器EResFDは,CPU上でのVGA画像推測に37.7msしか要しないWIDER FACE Hardサブセット上で80.4%のmAPを得た。
論文参考訳（メタデータ） (2022-04-04T02:30:43Z)
Rethinking Deconvolution for 2D Human Pose Estimation Light yet Accurate Model for Real-time Edge Computing [0.0]
このシステムは精度が高く、SOTA HRNet 256x192の94.5%の精度を達成した。我々のモデルはエンコーダ・デコーダアーキテクチャを採用し、その効率を改善するために注意深く縮小されている。
論文参考訳（メタデータ） (2021-11-08T01:44:46Z)
COLD: Concurrent Loads Disaggregator for Non-Intrusive Load Monitoring [0.0]
本稿では,最大10個の同時負荷で集約された消費をシミュレートする正規化署名(SNS)アルゴリズムを提案する。我々は,比較的シンプルで理解しやすいコンカレント負荷分散器(COLD)というニューラルアーキテクチャを開発した。我々のモデルでは、平均F1スコア78.95%と同時に動作する1から10個のアプライアンスを識別できる。
論文参考訳（メタデータ） (2021-06-04T09:04:33Z)
ANNETTE: Accurate Neural Network Execution Time Estimation with Stacked Models [56.21470608621633]
本稿では,アーキテクチャ検索を対象ハードウェアから切り離すための時間推定フレームワークを提案する。提案手法は,マイクロカーネルと多層ベンチマークからモデルの集合を抽出し,マッピングとネットワーク実行時間推定のためのスタックモデルを生成する。生成した混合モデルの推定精度と忠実度, 統計モデルとルーフラインモデル, 評価のための洗練されたルーフラインモデルを比較した。
論文参考訳（メタデータ） (2021-05-07T11:39:05Z)
FRDet: Balanced and Lightweight Object Detector based on Fire-Residual Modules for Embedded Processor of Autonomous Driving [0.0]
本稿では, 精度, モデルサイズ, リアルタイム処理の制約をすべて満たすために, バランスのとれた軽量一段物体検出器を提案する。我々のネットワークは、YOLOv3の精度を達成または超えながら、モデルの圧縮を最大化することを目的としている。
論文参考訳（メタデータ） (2020-11-16T16:15:43Z)
Highly Efficient Salient Object Detection with 100K Parameters [137.74898755102387]
そこで我々は,段階内および複数ステージのマルチスケール機能を効率的に活用するために,フレキシブルな畳み込みモジュールであるOctoConv(gOctConv)を提案する。我々は、非常に軽量なモデル、すなわちCSNetを構築し、一般的なオブジェクト検出ベンチマークで、約0.2%(100k)の大規模モデルで同等のパフォーマンスを達成する。
論文参考訳（メタデータ） (2020-03-12T07:00:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。