論文の概要: Comprehensive Attention Self-Distillation for Weakly-Supervised Object
Detection
- arxiv url: http://arxiv.org/abs/2010.12023v1
- Date: Thu, 22 Oct 2020 20:13:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-04 05:47:05.762416
- Title: Comprehensive Attention Self-Distillation for Weakly-Supervised Object
Detection
- Title(参考訳): 弱教師付き物体検出のための包括的注意自己蒸留
- Authors: Zeyi Huang, Yang Zou, Vijayakumar Bhagavatula, Dong Huang
- Abstract要約: Weakly Supervised Object Detection (WSOD) のための包括的注意自己蒸留訓練手法を提案する。
すべてのオブジェクトインスタンスで機能学習のバランスをとるために、CASDは複数の変換と同じ画像の特徴層から集約された包括的な注意を計算します。
オブジェクトに対する一貫した空間的監視を実施するため、CASDはWSODネットワーク上で自己蒸留を行い、同じ画像の複数の変換と特徴層によって、包括的注意を同時に近似する。
- 参考スコア(独自算出の注目度): 17.642446611026386
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Weakly Supervised Object Detection (WSOD) has emerged as an effective tool to
train object detectors using only the image-level category labels. However,
without object-level labels, WSOD detectors are prone to detect bounding boxes
on salient objects, clustered objects and discriminative object parts.
Moreover, the image-level category labels do not enforce consistent object
detection across different transformations of the same images. To address the
above issues, we propose a Comprehensive Attention Self-Distillation (CASD)
training approach for WSOD. To balance feature learning among all object
instances, CASD computes the comprehensive attention aggregated from multiple
transformations and feature layers of the same images. To enforce consistent
spatial supervision on objects, CASD conducts self-distillation on the WSOD
networks, such that the comprehensive attention is approximated simultaneously
by multiple transformations and feature layers of the same images. CASD
produces new state-of-the-art WSOD results on standard benchmarks such as
PASCAL VOC 2007/2012 and MS-COCO.
- Abstract(参考訳): Weakly Supervised Object Detection (WSOD) は画像レベルのカテゴリラベルのみを用いてオブジェクト検出を訓練するための効果的なツールとして登場した。
しかし、オブジェクトレベルのラベルがなければ、WSOD検出器は、正常なオブジェクト、クラスタ化されたオブジェクト、識別可能なオブジェクト部品のバウンディングボックスを検出する傾向にある。
さらに、画像レベルのカテゴリラベルは、同一画像の異なる変換に対して一貫したオブジェクト検出を強制しない。
以上の課題に対処するため,WSODのための包括的注意自己蒸留(CASD)訓練手法を提案する。
すべてのオブジェクトインスタンスで機能学習のバランスをとるために、CASDは複数の変換と同じ画像の特徴層から集約された包括的な注意を計算します。
オブジェクトに対する一貫した空間的監視を実施するため、CASDはWSODネットワーク上で自己蒸留を行い、同じ画像の複数の変換と特徴層によって、包括的注意を同時に近似する。
CASDはPASCAL VOC 2007/2012やMS-COCOなどの標準ベンチマークで最新のWSOD結果を生成する。
関連論文リスト
- Multi-clue Consistency Learning to Bridge Gaps Between General and Oriented Object in Semi-supervised Detection [26.486535389258965]
半教師あり学習における汎用物体検出とオブジェクト指向物体検出の3つのギャップを実験的に発見する。
本稿では,これらのギャップを埋めるために,MCL(Multi-clue Consistency Learning)フレームワークを提案する。
提案したMCLは,半教師付きオブジェクト指向物体検出タスクにおいて最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2024-07-08T13:14:25Z) - SOOD++: Leveraging Unlabeled Data to Boost Oriented Object Detection [59.868772767818975]
本稿では,SOOD++ と呼ばれる簡易かつ効果的な半教師付きオブジェクト指向検出手法を提案する。
具体的には、空中画像からの物体は、通常任意の向き、小さなスケール、集約である。
様々なラベル付き環境下での多目的オブジェクトデータセットに対する大規模な実験により,本手法の有効性が示された。
論文 参考訳(メタデータ) (2024-07-01T07:03:51Z) - HEAP: Unsupervised Object Discovery and Localization with Contrastive
Grouping [29.678756772610797]
教師なしオブジェクトの発見と位置決めは、監督なしで画像内のオブジェクトを検出し、セグメント化することを目的としている。
近年の取り組みは、自己監督型トランスフォーマー機能を利用して、有能な前景物体を識別する顕著な可能性を実証している。
これらの問題に対処するために、Herarchical mErging framework via contrAstive grouPing (HEAP) を紹介する。
論文 参考訳(メタデータ) (2023-12-29T06:46:37Z) - ObjectLab: Automated Diagnosis of Mislabeled Images in Object Detection
Data [8.284459836361012]
ObjectLabは、オブジェクト検出ラベルのさまざまなエラーを検出するアルゴリズムである。
各画像のラベル品質をスコアし、ラベルレビュー/補正のためにラベル付き画像を自動的に優先順位付けできるようにする。
他のラベルの品質スコアよりもずっと正確な精度/リコールで、一貫してアノテーションエラーを検出する。
論文 参考訳(メタデータ) (2023-09-02T05:40:05Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Learning Remote Sensing Object Detection with Single Point Supervision [17.12725535531483]
Pointly Supervised Object Detection (PSOD) は、ボックスレベルの監視対象検出と比較してラベリングコストが低いため、かなりの関心を集めている。
本研究では,RS画像に適したPSOD法を提案する。
提案手法は,最先端の画像レベルとポイントレベルの教師付き検出法と比較して性能が大幅に向上し,PSODとボックスレベルの教師付きオブジェクト検出の差を低減できる。
論文 参考訳(メタデータ) (2023-05-23T15:06:04Z) - SOOD: Towards Semi-Supervised Oriented Object Detection [57.05141794402972]
本稿では, 主流の擬似ラベリングフレームワーク上に構築された, SOOD と呼ばれる, 半教師付きオブジェクト指向物体検出モデルを提案する。
提案した2つの損失をトレーニングした場合,SOODはDOTA-v1.5ベンチマークの様々な設定下で,最先端のSSOD法を超越することを示した。
論文 参考訳(メタデータ) (2023-04-10T11:10:42Z) - Transformation-Invariant Network for Few-Shot Object Detection in Remote
Sensing Images [15.251042369061024]
FSOD(Few-shot Object Detection)は、トレーニングのために大量のラベル付きデータを頼りにしている。
リモートセンシング画像におけるオブジェクトのスケールと向きのバリエーションは、既存のFSOD法に重大な課題をもたらす。
特徴ピラミッドネットワークの統合と,クエリ機能向上のためのプロトタイプ機能の利用を提案する。
論文 参考訳(メタデータ) (2023-03-13T02:21:38Z) - SIOD: Single Instance Annotated Per Category Per Image for Object
Detection [67.64774488115299]
画像内の既存のカテゴリ毎に1つのインスタンスアノテーションのみを必要とする単一インスタンスアノテーションオブジェクト検出(SIOD)を提案する。
WSOD(Inter-task)やSSOD(Inter-image)の相違点からイメージ内の相違点に分解されたSIODは、ラベルなしインスタンスの残りをマイニングする上で、より信頼性が高く豊富な事前知識を提供する。
SIOD設定下では、類似性に基づく擬似ラベル生成モジュール(SPLG)と、Pixelレベルのグループコントラスト学習モジュール(PGCL)からなる、シンプルで効果的なフレームワークであるDual-Mining(DMiner)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:49:51Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。