論文の概要: SLV: Spatial Likelihood Voting for Weakly Supervised Object Detection
- arxiv url: http://arxiv.org/abs/2006.12884v1
- Date: Tue, 23 Jun 2020 10:24:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 23:20:05.231659
- Title: SLV: Spatial Likelihood Voting for Weakly Supervised Object Detection
- Title(参考訳): SLV: 弱い監視対象検出のための空間的投票
- Authors: Ze Chen, Zhihang Fu, Rongxin Jiang, Yaowu Chen, Xian-sheng Hua
- Abstract要約: 提案手法を収束させるため,空間的確率投票(SLV)モジュールを提案する。
与えられた画像内のすべての領域の提案は、訓練中の毎回有権者の役割を担い、空間次元における各カテゴリの可能性が投票される。
大きな可能性値の領域にアライメントを拡大した後、投票結果は境界ボックスとして正規化され、最終分類とローカライゼーションに使用される。
- 参考スコア(独自算出の注目度): 31.421794727209935
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Based on the framework of multiple instance learning (MIL), tremendous works
have promoted the advances of weakly supervised object detection (WSOD).
However, most MIL-based methods tend to localize instances to their
discriminative parts instead of the whole content. In this paper, we propose a
spatial likelihood voting (SLV) module to converge the proposal localizing
process without any bounding box annotations. Specifically, all region
proposals in a given image play the role of voters every iteration during
training, voting for the likelihood of each category in spatial dimensions.
After dilating alignment on the area with large likelihood values, the voting
results are regularized as bounding boxes, being used for the final
classification and localization. Based on SLV, we further propose an end-to-end
training framework for multi-task learning. The classification and localization
tasks promote each other, which further improves the detection performance.
Extensive experiments on the PASCAL VOC 2007 and 2012 datasets demonstrate the
superior performance of SLV.
- Abstract(参考訳): マルチ・インスタンス・ラーニング (MIL) の枠組みに基づいて, 弱い教師付きオブジェクト検出 (WSOD) の進歩が促進された。
しかし、ほとんどのMILベースの方法は、コンテンツ全体ではなく、インスタンスを識別する部分にローカライズする傾向がある。
本稿では,提案の局所化プロセスをバウンディングボックスアノテーションを使わずに収束させる空間的確率投票(slv)モジュールを提案する。
具体的には、ある画像内のすべての領域の提案は、訓練中のイテレーション毎に有権者の役割を担い、空間的次元における各カテゴリの可能性を投票する。
大きな可能性値の領域にアライメントを拡大した後、投票結果は境界ボックスとして正規化され、最終分類とローカライゼーションに使用される。
SLVに基づいて,マルチタスク学習のためのエンドツーエンドトレーニングフレームワークを提案する。
分類および局所化タスクは相互に促進され、検出性能がさらに向上する。
PASCAL VOC 2007と2012のデータセットに対する大規模な実験は、SLVの優れた性能を示している。
関連論文リスト
- Collaborative Feature-Logits Contrastive Learning for Open-Set Semi-Supervised Object Detection [75.02249869573994]
オープンセットのシナリオでは、ラベルなしデータセットには、イン・ディストリビューション(ID)クラスとアウト・オブ・ディストリビューション(OOD)クラスの両方が含まれている。
このような設定で半教師付き検出器を適用すると、OODクラスをIDクラスとして誤分類する可能性がある。
我々は、CFL-Detector(Collaborative Feature-Logits Detector)と呼ばれるシンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2024-11-20T02:57:35Z) - MuRAL: Multi-Scale Region-based Active Learning for Object Detection [20.478741635006116]
オブジェクト検出のためのマルチスケール領域ベースアクティブラーニング(MuRAL)と呼ばれる新しい手法を提案する。
MuRALは、様々なスケールの情報領域を特定して、よく学習されたオブジェクトのアノテーションコストを削減する。
提案手法は,Cityscapes および MS COCO データセットの粗粒度および細粒度ベースラインを網羅する。
論文 参考訳(メタデータ) (2023-03-29T12:52:27Z) - Learning Common Rationale to Improve Self-Supervised Representation for
Fine-Grained Visual Recognition Problems [61.11799513362704]
我々は、インスタンスやクラスでよく見られる差別的手がかりを識別するための、追加のスクリーニングメカニズムの学習を提案する。
SSL目標から誘導されるGradCAMを単純に利用することで、共通な有理性検出器が学習可能であることを示す。
論文 参考訳(メタデータ) (2023-03-03T02:07:40Z) - Learning to Discover and Detect Objects [43.52208526783969]
新たなクラス発見・検出・ローカライゼーション(NCDL)の課題に取り組む。
この設定では、よく観察されるクラスのオブジェクトのラベル付きソースデータセットを仮定する。
検出ネットワークをエンドツーエンドでトレーニングすることにより、さまざまなクラスに対してすべてのリージョン提案を分類することが可能になる。
論文 参考訳(メタデータ) (2022-10-19T17:59:55Z) - ProposalContrast: Unsupervised Pre-training for LiDAR-based 3D Object
Detection [114.54835359657707]
ProposalContrastは、教師なしのポイントクラウド事前トレーニングフレームワークである。
地域提案と対比することで、堅牢な3D表現を学習する。
ProposalContrastは様々な3D検出器で検証される。
論文 参考訳(メタデータ) (2022-07-26T04:45:49Z) - Spatial Likelihood Voting with Self-Knowledge Distillation for Weakly
Supervised Object Detection [54.24966006457756]
自己知識蒸留ネットワーク(SLV-SDネット)を用いたWSODフレームワークを提案する。
SLV-SD Netは、境界ボックスアノテーションなしで領域提案のローカライゼーションを収束させる。
PASCAL VOC 2007/2012およびMS-COCOデータセットの実験は、SLV-SD Netの優れた性能を示している。
論文 参考訳(メタデータ) (2022-04-14T11:56:19Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Weakly-supervised Object Localization for Few-shot Learning and
Fine-grained Few-shot Learning [0.5156484100374058]
少数のサンプルから新しい視覚カテゴリーを学習することを目的としている。
本稿では,自己認識型補完モジュール(SACモジュール)を提案する。
また,数発の分類のために,識別的深層記述子を選択するためのアクティブマスクも生成する。
論文 参考訳(メタデータ) (2020-03-02T14:07:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。