論文の概要: SpotNet: Self-Attention Multi-Task Network for Object Detection
- arxiv url: http://arxiv.org/abs/2002.05540v2
- Date: Thu, 11 Jun 2020 14:22:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-01 13:32:13.154242
- Title: SpotNet: Self-Attention Multi-Task Network for Object Detection
- Title(参考訳): spotnet:オブジェクト検出のためのセルフアテンションマルチタスクネットワーク
- Authors: Hughes Perreault and Guillaume-Alexandre Bilodeau and Nicolas Saunier
and Maguelonne H\'eritier
- Abstract要約: 我々は,背景サブトラクションや光フローを用いて,半教師付き方式で前景/後景セグメンテーションラベルを作成する。
ネットワーク内のセグメンテーションマップを自己認識機構として使用して,境界ボックスの生成に使用する特徴マップを重み付けする。
この手法を用いることで,2つの交通監視データセットにおいて,重要なmAP改善が得られることを示す。
- 参考スコア(独自算出の注目度): 11.444576186559487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans are very good at directing their visual attention toward relevant
areas when they search for different types of objects. For instance, when we
search for cars, we will look at the streets, not at the top of buildings. The
motivation of this paper is to train a network to do the same via a multi-task
learning approach. To train visual attention, we produce foreground/background
segmentation labels in a semi-supervised way, using background subtraction or
optical flow. Using these labels, we train an object detection model to produce
foreground/background segmentation maps as well as bounding boxes while sharing
most model parameters. We use those segmentation maps inside the network as a
self-attention mechanism to weight the feature map used to produce the bounding
boxes, decreasing the signal of non-relevant areas. We show that by using this
method, we obtain a significant mAP improvement on two traffic surveillance
datasets, with state-of-the-art results on both UA-DETRAC and UAVDT.
- Abstract(参考訳): 人間は、異なる種類の物体を探索する際に、関連する領域に視覚的注意を向けるのが得意です。
例えば、車を検索するときは、建物の上部ではなく、通りを見ることになる。
本論文の動機は,マルチタスク学習アプローチを用いてネットワークを訓練することにある。
視覚注意をトレーニングするために,背景サブトラクションや光学フローを用いて,半教師あり方式で前景/後景セグメンテーションラベルを作成する。
これらのラベルを用いてオブジェクト検出モデルを訓練し,前景/後景セグメンテーションマップと境界ボックスを作成し,モデルパラメータの共有を行う。
ネットワーク内のセグメンテーションマップを自己接続機構として使用し,境界ボックス生成に使用する特徴マップの重み付けを行い,非関連領域の信号を低減する。
本手法を用いて,UA-DETRAC と UAVDT の2つのトラヒック監視データセットにおいて,mAP の大幅な改善が得られた。
関連論文リスト
- LAC-Net: Linear-Fusion Attention-Guided Convolutional Network for Accurate Robotic Grasping Under the Occlusion [79.22197702626542]
本稿では, 乱れ場面におけるロボットグルーピングのためのアモーダルセグメンテーションを探求する枠組みを提案する。
線形融合注意誘導畳み込みネットワーク(LAC-Net)を提案する。
その結果,本手法が最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2024-08-06T14:50:48Z) - DisPlacing Objects: Improving Dynamic Vehicle Detection via Visual Place
Recognition under Adverse Conditions [29.828201168816243]
本研究では,3次元マップを必要とせずに,シーン内の動的物体の検出を支援するために,先行マップを活用できるかどうかを検討する。
提案手法は,対象物検出の初期セットを洗練し,事前マップを用いて高精度な検出のサブセットを生成するアルゴリズムである。
論文 参考訳(メタデータ) (2023-06-30T10:46:51Z) - Improving Fine-Grained Visual Recognition in Low Data Regimes via
Self-Boosting Attention Mechanism [27.628260249895973]
SAM(Self-boosting attention mechanism)は、ネットワークを正規化して、サンプルやクラス間で共有されるキー領域に集中するための新しい手法である。
我々はSAMを用いて、二線形プール方式で畳み込みマップをプールするために複数の注意マップを作成する変種を開発する。
論文 参考訳(メタデータ) (2022-08-01T05:36:27Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Contrastive learning of Class-agnostic Activation Map for Weakly
Supervised Object Localization and Semantic Segmentation [32.76127086403596]
ラベルなし画像データを用いたクラス非依存型活性化マップ(C$2$AM)生成のためのコントラスト学習を提案する。
我々は上記の関係に基づいて正対と負の対を形成し、ネットワークを前景と背景を乱すように強制する。
ネットワークは画像前景を識別するために誘導されるため,本手法で学習したクラス非依存のアクティベーションマップは,より完全なオブジェクト領域を生成する。
論文 参考訳(メタデータ) (2022-03-25T08:46:24Z) - Correlation-Aware Deep Tracking [83.51092789908677]
本稿では,自己/横断的意図に着想を得た,新たなターゲット依存型特徴ネットワークを提案する。
我々のネットワークは機能ネットワークの複数の層にクロスイメージの特徴相関を深く埋め込んでいる。
我々のモデルは、豊富な未ペア画像に対して柔軟に事前訓練が可能であり、既存の手法よりも顕著に高速な収束をもたらす。
論文 参考訳(メタデータ) (2022-03-03T11:53:54Z) - Graph Attention Tracking [76.19829750144564]
汎用オブジェクト追跡のための簡易な目標認識型シームズグラフアテンションネットワークを提案する。
GOT-10k、UAV123、TB-100、LaSOTといった挑戦的なベンチマークの実験は、提案されたSiamGATが最先端のトラッカーよりも優れていることを示した。
論文 参考訳(メタデータ) (2020-11-23T04:26:45Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Utilising Visual Attention Cues for Vehicle Detection and Tracking [13.2351348789193]
物体の検出と追跡に視覚的注意(透明性)を用いる可能性を探究する。
本稿では,物体を同時に検出し,対象性と主観性マップを生成し,計算力を節約するニューラルネットワークを提案する。
実験はKITTIとDETRACのデータセットを用いて行われた。
論文 参考訳(メタデータ) (2020-07-31T23:00:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。