論文の概要: Should I Look at the Head or the Tail? Dual-awareness Attention for
Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2102.12152v1
- Date: Wed, 24 Feb 2021 09:17:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:30:15.449965
- Title: Should I Look at the Head or the Tail? Dual-awareness Attention for
Few-Shot Object Detection
- Title(参考訳): 頭や尾を見るべきですか?
少ない物体検出のためのデュアルアウェアネスアテンション
- Authors: Tung-I Chen, Yueh-Cheng Liu, Hung-Ting Su, Yu-Cheng Chang, Yu-Hsiang
Lin, Jia-Fong Yeh, Winston H. Hsu
- Abstract要約: 両方向の空間的関係が支持とクエリーのイメージを横断して捉える,Dual-Awareness-Attention (DAnA) を提案する。
我々のDAnAコンポーネントは、既存の様々なオブジェクト検出ネットワークに適用可能であり、特定のセマンティクスに注意を払ってFSOD性能を向上させる。
実験結果は、DAnAがCOCOベンチマークで(48%および125%比較的)オブジェクト検出性能を大幅に向上させることを示しています。
- 参考スコア(独自算出の注目度): 20.439719842851744
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: While recent progress has significantly boosted few-shot classification (FSC)
performance, few-shot object detection (FSOD) remains challenging for modern
learning systems. Existing FSOD systems follow FSC approaches, neglect the
problem of spatial misalignment and the risk of information entanglement, and
result in low performance. Observing this, we propose a novel
Dual-Awareness-Attention (DAnA), which captures the pairwise spatial
relationship cross the support and query images. The generated
query-position-aware support features are robust to spatial misalignment and
used to guide the detection network precisely. Our DAnA component is adaptable
to various existing object detection networks and boosts FSOD performance by
paying attention to specific semantics conditioned on the query. Experimental
results demonstrate that DAnA significantly boosts (48% and 125% relatively)
object detection performance on the COCO benchmark. By equipping DAnA,
conventional object detection models, Faster-RCNN and RetinaNet, which are not
designed explicitly for few-shot learning, reach state-of-the-art performance.
- Abstract(参考訳): 最近の進歩は、数ショット分類(FSC)のパフォーマンスを大幅に向上させたが、現代の学習システムでは、数ショットオブジェクト検出(FSOD)は依然として困難である。
既存のFSODシステムはFSCのアプローチに従い、空間的不整合の問題と情報絡みのリスクを無視し、パフォーマンスを低下させる。
そこで本研究では,サポート画像とクエリ画像間の空間的相互関係を両立する,新しいDual-Awareness-Attention (DAnA)を提案する。
生成されたクエリ位置認識サポート機能は、空間的不整合に堅牢であり、検出ネットワークを正確に導くために使用されます。
我々のDAnAコンポーネントは、既存のさまざまなオブジェクト検出ネットワークに適用可能であり、クエリで条件付けられた特定のセマンティクスに注意を払ってFSOD性能を向上させる。
実験結果は、DAnAがCOCOベンチマークで(48%および125%比較的)オブジェクト検出性能を大幅に向上させることを示しています。
danaを導入することで、従来のオブジェクト検出モデルであるfaster-rcnnとretinanetが最先端のパフォーマンスに到達した。
関連論文リスト
- D-YOLO a robust framework for object detection in adverse weather conditions [0.0]
ヘイズ、雪、雨などの逆の気象条件は、画像品質の低下を招き、深層学習に基づく検知ネットワークの性能低下を招きかねない。
画像復元とオブジェクト検出のタスクをよりうまく統合するために,注目機能融合モジュールを備えた二重経路ネットワークを設計した。
我々はまた,検出ネットワークにヘイズフリーな機能を提供するサブネットワークを提案し,特に,明瞭な特徴抽出サブネットワークと検出ネットワーク間の距離を最小化することにより,検出ネットワークの性能を向上させる。
論文 参考訳(メタデータ) (2024-03-14T09:57:15Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Efficient Person Search: An Anchor-Free Approach [86.45858994806471]
パーソンサーチは、クエリーの人物を、リアルで切り刻まれていない画像から、同時にローカライズし、識別することを目的としている。
この目標を達成するために、最先端モデルは通常、Faster R-CNNのような2段階検出器にre-idブランチを追加する。
本研究では,この課題に対処するためのアンカーフリーな手法を提案する。
論文 参考訳(メタデータ) (2021-09-01T07:01:33Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - DS-Net: Dynamic Spatiotemporal Network for Video Salient Object
Detection [78.04869214450963]
時間情報と空間情報のより効果的な融合のための新しい動的時空間ネットワーク(DSNet)を提案する。
提案手法は最先端アルゴリズムよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2020-12-09T06:42:30Z) - AFD-Net: Adaptive Fully-Dual Network for Few-Shot Object Detection [8.39479809973967]
Few-shot Object Detection (FSOD) は、未確認の物体に迅速に適応できる検出器の学習を目的としている。
既存の方法では、共有コンポーネントを用いて分類と局所化のサブタスクを実行することで、この問題を解決している。
本稿では,2つのサブタスクの明示的な分解を考慮し,両者の情報を活用して特徴表現の強化を図ることを提案する。
論文 参考訳(メタデータ) (2020-11-30T10:21:32Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。