論文の概要: ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation
- arxiv url: http://arxiv.org/abs/2308.09242v1
- Date: Fri, 18 Aug 2023 02:06:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 15:08:21.865125
- Title: ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation
- Title(参考訳): ASAG:Adaptive Sparse Anchor Generationによる強力な1デコーダ層スパース検出器の構築
- Authors: Shenghao Fu, Junkai Yan, Yipeng Gao, Xiaohua Xie, Wei-Shi Zheng
- Abstract要約: 適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
- 参考スコア(独自算出の注目度): 50.01244854344167
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent sparse detectors with multiple, e.g. six, decoder layers achieve
promising performance but much inference time due to complex heads. Previous
works have explored using dense priors as initialization and built
one-decoder-layer detectors. Although they gain remarkable acceleration, their
performance still lags behind their six-decoder-layer counterparts by a large
margin. In this work, we aim to bridge this performance gap while retaining
fast speed. We find that the architecture discrepancy between dense and sparse
detectors leads to feature conflict, hampering the performance of
one-decoder-layer detectors. Thus we propose Adaptive Sparse Anchor Generator
(ASAG) which predicts dynamic anchors on patches rather than grids in a sparse
way so that it alleviates the feature conflict problem. For each image, ASAG
dynamically selects which feature maps and which locations to predict, forming
a fully adaptive way to generate image-specific anchors. Further, a simple and
effective Query Weighting method eases the training instability from
adaptiveness. Extensive experiments show that our method outperforms
dense-initialized ones and achieves a better speed-accuracy trade-off. The code
is available at \url{https://github.com/iSEE-Laboratory/ASAG}.
- Abstract(参考訳): 最近のスパース検出器では、例えば6層のようなデコーダ層が複雑なヘッドのため、期待できる性能を実現する。
従来、高密度の前駆体を初期化として使用し、1デコーダ層検出器を構築してきた。
著しく加速するが、性能はいまだに6層デコーダ層よりも大きなマージンで遅れている。
本研究は,この性能ギャップを高速に保ちながら橋渡しすることを目的とする。
密度検出器とスパース検出器のアーキテクチャの相違が特徴的矛盾を招き、1デコーダ層検出器の性能を損なうことが判明した。
そこで本稿では,アダプティブスパースアンカージェネレータ (ASAG) を提案する。
各画像に対して、ASAGはどの特徴マップとどの位置を予測するかを動的に選択し、画像固有のアンカーを生成するための完全に適応的な方法を形成する。
さらに、簡便で効果的なクエリ重み付け手法により、適応性からトレーニング不安定性が緩和される。
広範な実験により,本手法は高密度初期化手法よりも優れ,より優れた速度精度のトレードオフを実現することが示された。
コードは \url{https://github.com/iSEE-Laboratory/ASAG} で公開されている。
関連論文リスト
- A new baseline for edge detection: Make Encoder-Decoder great again [3.3171122239461193]
提案されたNew Baseline for Edge Detection (NBED)は、複数のエッジ検出ベンチマークで一貫してパフォーマンスを向上する。
BSDS500におけるNBEDのODSは0.838であり、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-09-23T12:54:38Z) - Global Context Aggregation Network for Lightweight Saliency Detection of
Surface Defects [70.48554424894728]
我々は,エンコーダ・デコーダ構造上の表面欠陥を簡易に検出するためのGCANet(Global Context Aggregation Network)を開発した。
まず、軽量バックボーンの上部層に新しいトランスフォーマーエンコーダを導入し、DSA(Depth-wise Self-Attention)モジュールを通じてグローバルなコンテキスト情報をキャプチャする。
3つの公開欠陥データセットの実験結果から,提案したネットワークは,他の17の最先端手法と比較して,精度と実行効率のトレードオフを良好に達成できることが示された。
論文 参考訳(メタデータ) (2023-09-22T06:19:11Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Learning Spatio-Temporal Transformer for Visual Tracking [108.11680070733598]
本稿では,エンコーダ・デコーダ変換器をキーコンポーネントとする新しいトラッキングアーキテクチャを提案する。
メソッド全体がエンドツーエンドであり、コサインウィンドウやバウンディングボックススムーシングのような後処理ステップは不要である。
提案されたトラッカーは、Siam R-CNNよりも6倍速いリアルタイム速度を実行しながら、5つのチャレンジングな短期および長期ベンチマークで最先端のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-03-31T15:19:19Z) - Anchor-Free Person Search [127.88668724345195]
パーソンサーチ(person search)は、クエリーの人物を同時にローカライズし、特定することを目的としている。
既存の作品の多くはfaster-rcnnのような2段検出器を採用しており、精度は高いが計算オーバーヘッドは高い。
この課題に効率的に取り組む最初のアンカーフリーフレームワークであるFeature-Aligned Person Search Network(AlignPS)を紹介します。
論文 参考訳(メタデータ) (2021-03-22T07:04:29Z) - Unsupervised Domain Adaptation from Synthetic to Real Images for
Anchorless Object Detection [0.0]
本稿では,アンカーレス物体検出器に非監視領域適応法を実装した。
私たちの仕事では、合成画像を含むドメイン適応問題のために、最新のアンカーレスアーキテクチャの1つである CenterNet を使用します。
論文 参考訳(メタデータ) (2020-12-15T10:51:43Z) - Align Deep Features for Oriented Object Detection [40.28244152216309]
本稿では、FAM(Feature Alignment Module)とODM(Oriented Detection Module)の2つのモジュールからなる単発アライメントネットワーク(S$2$A-Net)を提案する。
FAMは、アンカー・リファインメント・ネットワークで高品質なアンカーを生成し、アンカーボックスに応じた畳み込み特徴と、新しいアライメント・コンボリューション・コンボリューションとを適応的に調整することができる。
ODMは、まず、向き情報を符号化するためにアクティブな回転フィルタを採用し、次に、分類スコアとローカライゼーション精度の不整合を軽減するために、向きに敏感で方向不変な特徴を生成する。
論文 参考訳(メタデータ) (2020-08-21T09:55:13Z) - FCOS: A simple and strong anchor-free object detector [111.87691210818194]
物体検出を画素ごとの予測方式で解くために, 完全畳み込み型一段物検出器 (FCOS) を提案する。
RetinaNet、SSD、YOLOv3、Faster R-CNNといった最先端のオブジェクト検出器のほとんどは、事前に定義されたアンカーボックスに依存している。
対照的に、提案した検出器FCOSはアンカーボックスフリーであり、提案はフリーである。
論文 参考訳(メタデータ) (2020-06-14T01:03:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。