論文の概要: Learning a Weight Map for Weakly-Supervised Localization
- arxiv url: http://arxiv.org/abs/2111.14131v1
- Date: Sun, 28 Nov 2021 12:45:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 09:48:15.799528
- Title: Learning a Weight Map for Weakly-Supervised Localization
- Title(参考訳): 重み付き局所化のためのウェイトマップの学習
- Authors: Tal Shaharabany and Lior Wolf
- Abstract要約: 我々は、入力画像から出力する生成ネットワーク$g$、画像内の物体の位置を示すピクセル単位の重みマップをトレーニングする。
提案手法は, 既存の局所化手法よりも, 難解な粒度分類データセットに対して, かなりのマージンで優れていることを示す。
- 参考スコア(独自算出の注目度): 93.91375268580806
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the weakly supervised localization setting, supervision is given as an
image-level label. We propose to employ an image classifier $f$ and to train a
generative network $g$ that outputs, given the input image, a per-pixel weight
map that indicates the location of the object within the image. Network $g$ is
trained by minimizing the discrepancy between the output of the classifier $f$
on the original image and its output given the same image weighted by the
output of $g$. The scheme requires a regularization term that ensures that $g$
does not provide a uniform weight, and an early stopping criterion in order to
prevent $g$ from over-segmenting the image. Our results indicate that the
method outperforms existing localization methods by a sizable margin on the
challenging fine-grained classification datasets, as well as a generic image
recognition dataset. Additionally, the obtained weight map is also
state-of-the-art in weakly supervised segmentation in fine-grained
categorization datasets.
- Abstract(参考訳): 弱教師付きローカライズ設定では、画像レベルラベルとして監督が与えられる。
本稿では,画像分類器を$f$とし,入力画像から出力する生成ネットワーク$g$,画像内の物体の位置を示す画素単位の重みマップを提案する。
ネットワーク$g$は、元の画像上の分類器$f$の出力と、$g$の出力で重み付けられた同じ画像の出力との差を最小限にすることで訓練される。
このスキームは、$g$が一様ウェイトを提供しないことを保証する正規化項と、$g$が画像のオーバーセグメンテーションを防ぐための早期停止基準を必要とする。
提案手法は,既存の局所化手法よりも,難易度の高い分類データセットや汎用画像認識データセットよりも優れていることを示す。
さらに、得られた重みマップは、細粒度分類データセットにおける弱教師付きセグメンテーションにおいても最先端である。
関連論文リスト
- Rethinking Generalization in Few-Shot Classification [28.809141478504532]
単一のイメージレベルのアノテーションは、しばしば画像の内容の小さなサブセットを正しく記述するだけである。
本稿では、textitfew-shot Learning$の文脈における意味を詳しく調べる。
我々は、きめ細かいラベルの欠如を克服するため、マスク付き画像モデリングによるネットワークの教師なしトレーニングの最近の進歩の上に構築する。
論文 参考訳(メタデータ) (2022-06-15T03:05:21Z) - LEAD: Self-Supervised Landmark Estimation by Aligning Distributions of
Feature Similarity [49.84167231111667]
自己監督型ランドマーク検出における既存の研究は、画像から高密度(ピクセルレベルの)特徴表現を学習することに基づいている。
自己教師付き方式で高密度同変表現の学習を強化するアプローチを提案する。
機能抽出器にそのような先行性があることは,アノテーションの数が大幅に制限されている場合でも,ランドマーク検出に役立ちます。
論文 参考訳(メタデータ) (2022-04-06T17:48:18Z) - Local contrastive loss with pseudo-label based self-training for
semi-supervised medical image segmentation [13.996217500923413]
セミ/セルフ教師付き学習ベースのアプローチは、注釈付きデータとともにラベル付きデータを悪用する。
近年の自己教師付き学習法では, コントラッシブ・ロスを用いて, ラベルのない画像から優れたグローバルレベル表現を学習している。
セグメンテーションに有用な画素レベルの特徴を,セマンティックラベル情報を利用して学習するために,局所的なコントラスト損失を提案する。
論文 参考訳(メタデータ) (2021-12-17T17:38:56Z) - Global and Local Alignment Networks for Unpaired Image-to-Image
Translation [170.08142745705575]
未ペア画像から画像への変換の目的は、対象領域のスタイルを反映した出力画像を作成することである。
既存の手法では内容変化に注意が払われていないため、ソース画像からの意味情報は翻訳中の劣化に悩まされる。
我々はGLA-Net(Global and Local Alignment Networks)という新しいアプローチを導入する。
本手法は既存の手法よりもシャープでリアルな画像を効果的に生成する。
論文 参考訳(メタデータ) (2021-11-19T18:01:54Z) - Region-level Active Learning for Cluttered Scenes [60.93811392293329]
本稿では,従来の画像レベルのアプローチとオブジェクトレベルのアプローチを一般化した領域レベルのアプローチに仮定する新たな戦略を提案する。
その結果,本手法はラベル付けの労力を大幅に削減し,クラス不均衡や散らかったシーンを生かしたリアルなデータに対する希少なオブジェクト検索を改善することが示唆された。
論文 参考訳(メタデータ) (2021-08-20T14:02:38Z) - Semi-weakly Supervised Contrastive Representation Learning for Retinal
Fundus Images [0.2538209532048867]
本稿では,半弱化アノテーションを用いた表現学習のための,半弱化教師付きコントラスト学習フレームワークを提案する。
SWCLの移動学習性能を7つの公立網膜眼底データセットで実証的に検証した。
論文 参考訳(メタデータ) (2021-08-04T15:50:09Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。