論文の概要: Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance
- arxiv url: http://arxiv.org/abs/2104.03888v1
- Date: Thu, 8 Apr 2021 16:58:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-09 15:34:18.489068
- Title: Enhancing Object Detection for Autonomous Driving by Optimizing Anchor
Generation and Addressing Class Imbalance
- Title(参考訳): アンカー生成とクラス不均衡の最適化による自律走行のための物体検出の強化
- Authors: Manuel Carranza-Garc\'ia, Pedro Lara-Ben\'itez, Jorge
Garc\'ia-Guti\'errez, Jos\'e C. Riquelme
- Abstract要約: 本研究では,より高速なR-CNNに基づく拡張型2次元物体検出器を提案する。
より高速なr-cnnに対する修正は計算コストを増加させず、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Object detection has been one of the most active topics in computer vision
for the past years. Recent works have mainly focused on pushing the
state-of-the-art in the general-purpose COCO benchmark. However, the use of
such detection frameworks in specific applications such as autonomous driving
is yet an area to be addressed. This study presents an enhanced 2D object
detector based on Faster R-CNN that is better suited for the context of
autonomous vehicles. Two main aspects are improved: the anchor generation
procedure and the performance drop in minority classes. The default uniform
anchor configuration is not suitable in this scenario due to the perspective
projection of the vehicle cameras. Therefore, we propose a perspective-aware
methodology that divides the image into key regions via clustering and uses
evolutionary algorithms to optimize the base anchors for each of them.
Furthermore, we add a module that enhances the precision of the second-stage
header network by including the spatial information of the candidate regions
proposed in the first stage. We also explore different re-weighting strategies
to address the foreground-foreground class imbalance, showing that the use of a
reduced version of focal loss can significantly improve the detection of
difficult and underrepresented objects in two-stage detectors. Finally, we
design an ensemble model to combine the strengths of the different learning
strategies. Our proposal is evaluated with the Waymo Open Dataset, which is the
most extensive and diverse up to date. The results demonstrate an average
accuracy improvement of 6.13% mAP when using the best single model, and of
9.69% mAP with the ensemble. The proposed modifications over the Faster R-CNN
do not increase computational cost and can easily be extended to optimize other
anchor-based detection frameworks.
- Abstract(参考訳): オブジェクト検出は、過去数年間、コンピュータビジョンにおける最も活発なトピックの1つです。
最近の研究は主に、汎用COCOベンチマークの最先端の推進に焦点を当てている。
しかし、自動運転のような特定の用途におけるそのような検出フレームワークの使用は、まだ解決すべき領域である。
本研究では、より高速なr-cnnに基づく拡張された2次元物体検出器を提案する。
アンカー生成手順と少数クラスのパフォーマンス低下という2つの主な側面が改善されている。
デフォルトの均一アンカー構成は、車両カメラの視点投影のため、このシナリオでは適していない。
そこで我々は,画像をクラスタリングによって重要領域に分割し,進化的アルゴリズムを用いて各領域のベースアンカーを最適化する視点認識手法を提案する。
さらに,第1段階で提案される候補領域の空間情報を含めることで,第2段ヘッダネットワークの精度を高めるモジュールを追加する。
また,2段検出装置において,焦点損失の低減版を用いることで,対象物検出の難易度と低表現度を著しく向上できることを示すため,前景のクラスバランスに対処するための異なる再重み付け戦略についても検討した。
最後に,異なる学習戦略の強みを組み合わせたアンサンブルモデルを設計する。
この提案は,これまでで最も広範囲で多様なデータセットであるwaymo open datasetを用いて評価されている。
その結果,最良単一モデルを用いた場合の平均精度は6.13%,アンサンブルを用いた9.69%であった。
Faster R-CNNに対する修正は計算コストを増大させるものではなく、他のアンカーベースの検出フレームワークを最適化するために容易に拡張できる。
関連論文リスト
- Scale Optimization Using Evolutionary Reinforcement Learning for Object
Detection on Drone Imagery [17.26524675722299]
本稿では, 粗い物体検出フレームワークに組み込まれた進化的強化学習エージェントを提案し, 画像中の物体のより効率的な検出のために, スケールを最適化する。
スケール最適化の指針として, 局所化精度, 予測ラベルの精度, 近傍のパッチ間のスケール一貫性のセットを設計する。
論文 参考訳(メタデータ) (2023-12-23T10:49:55Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Adaptive Sparse Convolutional Networks with Global Context Enhancement
for Faster Object Detection on Drone Images [26.51970603200391]
本稿では,スパース畳み込みに基づく検出ヘッドの最適化について検討する。
これは、小さなオブジェクトのコンテキスト情報の不十分な統合に悩まされる。
本稿では,グローバルな文脈拡張型適応スパース畳み込みネットワークを提案する。
論文 参考訳(メタデータ) (2023-03-25T14:42:50Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - CFC-Net: A Critical Feature Capturing Network for Arbitrary-Oriented
Object Detection in Remote Sensing Images [0.9462808515258465]
本稿では,物体検出における識別的特徴の役割について論じる。
次に,検出精度を向上させるために,cfc-net (critical feature capture network) を提案する。
本手法は多くの最先端手法と比較して優れた検出性能が得られることを示す。
論文 参考訳(メタデータ) (2021-01-18T02:31:09Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - AP-Loss for Accurate One-Stage Object Detection [49.13608882885456]
一段階の物体検出器は、分類損失と局所化損失を同時に最適化することによって訓練される。
前者は、多数のアンカーのため、非常に前景と後方のアンカーの不均衡に悩まされる。
本稿では,一段検知器の分類タスクをランキングタスクに置き換える新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-08-17T13:22:01Z) - Scope Head for Accurate Localization in Object Detection [135.9979405835606]
本研究では,各位置のアンカーを相互依存関係としてモデル化したScopeNetと呼ばれる新しい検出器を提案する。
我々の簡潔で効果的な設計により、提案したScopeNetはCOCOの最先端の成果を達成する。
論文 参考訳(メタデータ) (2020-05-11T04:00:09Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。