論文の概要: Cascade Attentive Dropout for Weakly Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2011.10258v1
- Date: Fri, 20 Nov 2020 08:08:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-23 05:50:29.670353
- Title: Cascade Attentive Dropout for Weakly Supervised Object Detection
- Title(参考訳): 弱教師付き物体検出のためのカスケード注意ドロップアウト
- Authors: Wenlong Gao and Ying Chen and Yong Peng
- Abstract要約: 弱教師付きオブジェクト検出(WSOD)は、画像レベルの監視のみでオブジェクトを分類し、特定することを目的としている。
多くのWSODアプローチでは、初期モデルとして複数のインスタンス学習を採用しており、最も識別可能なオブジェクト領域に収束しがちである。
本研究では,グローバルなコンテキストモジュールの改良とともに,部分支配問題を緩和するための新しいカスケード注意型ドロップアウト戦略を提案する。
- 参考スコア(独自算出の注目度): 7.697578661762592
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly supervised object detection (WSOD) aims to classify and locate objects
with only image-level supervision. Many WSOD approaches adopt multiple instance
learning as the initial model, which is prone to converge to the most
discriminative object regions while ignoring the whole object, and therefore
reduce the model detection performance. In this paper, a novel cascade
attentive dropout strategy is proposed to alleviate the part domination
problem, together with an improved global context module. We purposely discard
attentive elements in both channel and space dimensions, and capture the
inter-pixel and inter-channel dependencies to induce the model to better
understand the global context. Extensive experiments have been conducted on the
challenging PASCAL VOC 2007 benchmarks, which achieve 49.8% mAP and 66.0%
CorLoc, outperforming state-of-the-arts.
- Abstract(参考訳): weakly supervised object detection (wsod)は、画像レベルの監視だけでオブジェクトを分類し、特定することを目的としている。
多くのWSODアプローチでは、初期モデルとして複数のインスタンス学習を採用しており、オブジェクト全体を無視しながら最も識別性の高いオブジェクト領域に収束しがちである。
本稿では,グローバルなコンテキストモジュールの改善とともに,部分支配問題を緩和するための新しいカスケード注意ドロップアウト戦略を提案する。
我々は、意図的にチャネル次元と空間次元の両方の注意要素を破棄し、ピクセル間およびチャネル間依存性をキャプチャし、モデルにグローバルコンテキストをよりよく理解させる。
PASCAL VOC 2007ベンチマークでは、49.8% mAP と 66.0% CorLoc を達成し、最先端技術よりも優れていた。
関連論文リスト
- Point Cloud Understanding via Attention-Driven Contrastive Learning [64.65145700121442]
トランスフォーマーベースのモデルは、自己認識機構を活用することにより、先進的なポイントクラウド理解を持つ。
PointACLは、これらの制限に対処するために設計された、注意駆動のコントラスト学習フレームワークである。
本手法では, 注意駆動型動的マスキング手法を用いて, モデルが非集中領域に集中するように誘導する。
論文 参考訳(メタデータ) (2024-11-22T05:41:00Z) - Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection [12.417754433715903]
Sparse Semi-DETRは、トランスフォーマーをベースとした、エンドツーエンドの半教師付きオブジェクト検出ソリューションである。
Sparse Semi-DETR には Query Refinement Module が組み込まれており、オブジェクトクエリの品質を高め、小型で部分的に隠されたオブジェクトの検出能力を著しく改善している。
MS-COCOおよびPascal VOCオブジェクト検出ベンチマークでは、Sparse Semi-DETRは現在の最先端手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-02T10:22:23Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and
Segment Anything Model [14.080744645704751]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
本稿では,この2つの境界の学習をデコーダ層に分割する,シンプルで効果的な学習戦略であるDecoupled Objectness Learning(DOL)を提案する。
また、擬似ラベルとソフトウェイト戦略を用いてノイズの負の影響を緩和する補助的スーパービジョンフレームワーク(ASF)も導入する。
論文 参考訳(メタデータ) (2023-06-04T06:42:09Z) - CLIP the Gap: A Single Domain Generalization Approach for Object
Detection [60.20931827772482]
単一ドメインの一般化(Single Domain Generalization)は、単一のソースドメイン上でモデルをトレーニングすることで、目に見えないターゲットドメインに一般化する問題に取り組む。
本稿では、事前学習された視覚言語モデルを用いて、テキストプロンプトを介して意味領域の概念を導入することを提案する。
本手法は,検出器のバックボーンから抽出した特徴に作用する意味的拡張戦略と,テキストに基づく分類損失によって実現される。
論文 参考訳(メタデータ) (2023-01-13T12:01:18Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。