論文の概要: Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2204.06899v1
- Date: Thu, 14 Apr 2022 11:56:19 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-15 20:58:26.827080
- Title: Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection
- Title(参考訳): 弱監視対象検出のための自己知識蒸留による空間的投票
- Authors: Ze Chen, Zhihang Fu, Jianqiang Huang, Mingyuan Tao, Rongxin Jiang,
Xiang Tian, Yaowu Chen and Xian-sheng Hua
- Abstract要約: 自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
- 参考スコア(独自算出の注目度): 54.24966006457756
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly supervised object detection (WSOD), which is an effective way to train
an object detection model using only image-level annotations, has attracted
considerable attention from researchers. However, most of the existing methods,
which are based on multiple instance learning (MIL), tend to localize instances
to the discriminative parts of salient objects instead of the entire content of
all objects. In this paper, we propose a WSOD framework called the Spatial
Likelihood Voting with Self-knowledge Distillation Network (SLV-SD Net). In
this framework, we introduce a spatial likelihood voting (SLV) module to
converge region proposal localization without bounding box annotations.
Specifically, in every iteration during training, all the region proposals in a
given image act as voters voting for the likelihood of each category in the
spatial dimensions. After dilating the alignment on the area with large
likelihood values, the voting results are regularized as bounding boxes, which
are then used for the final classification and localization. Based on SLV, we
further propose a self-knowledge distillation (SD) module to refine the feature
representations of the given image. The likelihood maps generated by the SLV
module are used to supervise the feature learning of the backbone network,
encouraging the network to attend to wider and more diverse areas of the image.
Extensive experiments on the PASCAL VOC 2007/2012 and MS-COCO datasets
demonstrate the excellent performance of SLV-SD Net. In addition, SLV-SD Net
produces new state-of-the-art results on these benchmarks.
- Abstract(参考訳): 画像レベルのアノテーションのみを使用してオブジェクト検出モデルをトレーニングする効果的な方法であるweakly supervised object detection (wsod)は、研究者から注目を集めている。
しかし、既存のほとんどのメソッドは、MIL(Multiple instance learning)に基づいており、全てのオブジェクトのコンテンツ全体ではなく、聖なるオブジェクトの識別部分にインスタンスをローカライズする傾向がある。
本稿では,自己知識蒸留ネットワーク(slv-sd net)を用いた空間的確率投票と呼ばれるwsodフレームワークを提案する。
本稿では,空間的確率投票(slv)モジュールを導入し,境界付きボックスアノテーションを使わずに地域提案ローカライゼーションを収束させる。
具体的には、訓練中の全てのイテレーションにおいて、与えられた画像内のすべての領域の提案は、空間次元における各カテゴリの可能性が投票される投票として機能する。
エリアのアライメントを大きな確率値で拡張した後、投票結果はバウンディングボックスとして正規化され、最終的な分類とローカライゼーションに使用される。
また,slvに基づいて,与えられた画像の特徴表現を洗練するための自己認識蒸留(sd)モジュールを提案する。
SLVモジュールによって生成された可能性マップは、バックボーンネットワークの機能学習を監督するために使用され、ネットワークが画像のより広い、より多様な領域に参加するように促される。
PASCAL VOC 2007/2012およびMS-COCOデータセットの大規模な実験は、SLV-SD Netの優れた性能を示している。
さらに、SLV-SD Netはこれらのベンチマークで新しい最先端の結果を生成する。
関連論文リスト
- Background Activation Suppression for Weakly Supervised Object
Localization and Semantic Segmentation [84.62067728093358]
弱教師付きオブジェクトローカライゼーションとセマンティックセグメンテーションは、画像レベルのラベルのみを使用してオブジェクトをローカライズすることを目的としている。
画素レベルのローカライゼーションを実現するために,フォアグラウンド予測マップを生成することで,新たなパラダイムが誕生した。
本稿では,物体の局在化学習過程に関する2つの驚くべき実験結果を示す。
論文 参考訳(メタデータ) (2023-09-22T15:44:10Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - MOST: Multiple Object localization with Self-supervised Transformers for
object discovery [97.47075050779085]
自己教師型トランスフォーマー(MOST)を用いた複数オブジェクトのローカライゼーションを提案する。
MOSTは、自己教師付き学習を用いて訓練されたトランスフォーマーの機能を使用して、実世界の画像に複数のオブジェクトをローカライズする。
対象検出器の自己教師付き事前学習にはMOSTが有効であり, 半教師付きオブジェクト検出と非教師付き領域提案生成において一貫した改善が得られた。
論文 参考訳(メタデータ) (2023-04-11T17:57:27Z) - De-coupling and De-positioning Dense Self-supervised Learning [65.56679416475943]
Dense Self-Supervised Learning (SSL)メソッドは、複数のオブジェクトでイメージを処理する際に、画像レベルの特徴表現を使用する際の制限に対処する。
本研究は, 層深度やゼロパディングに伴う受容野の増大によって生じる, 結合と位置バイアスに悩まされていることを示す。
我々はCOCOにおける本手法の利点と、オブジェクト分類、セマンティックセグメンテーション、オブジェクト検出のための新しい挑戦的ベンチマークであるOpenImage-MINIについて示す。
論文 参考訳(メタデータ) (2023-03-29T18:07:25Z) - Constrained Sampling for Class-Agnostic Weakly Supervised Object
Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T19:58:38Z) - Discriminative Sampling of Proposals in Self-Supervised Transformers for
Weakly Supervised Object Localization [10.542859578763068]
自己監督型視覚変換器は、画像内のオブジェクトの正確なローカライゼーションマップを生成することができる。
本稿では,異なるトランスフォーマーヘッドが生成する複数のマップを利用して,弱い教師付きオブジェクトローカライゼーションモデルをトレーニングする擬似ラベルを取得することを提案する。
論文 参考訳(メタデータ) (2022-09-09T18:33:23Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - SLV: Spatial Likelihood Voting for Weakly Supervised Object Detection [31.421794727209935]
提案手法を収束させるため,空間的確率投票(SLV)モジュールを提案する。
与えられた画像内のすべての領域の提案は、訓練中の毎回有権者の役割を担い、空間次元における各カテゴリの可能性が投票される。
大きな可能性値の領域にアライメントを拡大した後、投票結果は境界ボックスとして正規化され、最終分類とローカライゼーションに使用される。
論文 参考訳(メタデータ) (2020-06-23T10:24:13Z) - Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning [0.5156484100374058]
少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
論文 参考訳(メタデータ) (2020-03-02T14:07:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。