論文の概要: Learning to Detect Semantic Boundaries with Image-level Class Labels
- arxiv url: http://arxiv.org/abs/2212.07579v1
- Date: Thu, 15 Dec 2022 01:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 15:56:39.514959
- Title: Learning to Detect Semantic Boundaries with Image-level Class Labels
- Title(参考訳): 画像レベルのクラスラベルを用いた意味境界の検出
- Authors: Namyup Kim, Sehyun Hwang, Suha Kwak
- Abstract要約: 本稿では,画像レベルのクラスラベルを教師として用いたセマンティック境界検出の学習の試みについて述べる。
対象クラスの粗い領域を画像分類網の注意点から推定することから始める。
我々は、不確実な監視の下でも、セマンティックバウンダリを確実に見積もることができる新しいニューラルネットワークアーキテクチャを設計する。
- 参考スコア(独自算出の注目度): 14.932318540666548
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: This paper presents the first attempt to learn semantic boundary detection
using image-level class labels as supervision. Our method starts by estimating
coarse areas of object classes through attentions drawn by an image
classification network. Since boundaries will locate somewhere between such
areas of different classes, our task is formulated as a multiple instance
learning (MIL) problem, where pixels on a line segment connecting areas of two
different classes are regarded as a bag of boundary candidates. Moreover, we
design a new neural network architecture that can learn to estimate semantic
boundaries reliably even with uncertain supervision given by the MIL strategy.
Our network is used to generate pseudo semantic boundary labels of training
images, which are in turn used to train fully supervised models. The final
model trained with our pseudo labels achieves an outstanding performance on the
SBD dataset, where it is as competitive as some of previous arts trained with
stronger supervision.
- Abstract(参考訳): 本稿では,画像レベルのクラスラベルを監督として用い,意味的境界検出を初めて試みる。
本手法は,画像分類ネットワークによる注意を通して,対象クラスの粗い領域を推定することから始まる。
境界は異なるクラスの領域の間に位置するので、我々のタスクは多重インスタンス学習(MIL)問題として定式化され、2つの異なるクラスの領域を接続する線分上のピクセルは境界候補の袋と見なされる。
さらに、MIL戦略による不確実な監視を伴っても、意味境界を確実に推定できる新しいニューラルネットワークアーキテクチャを設計する。
我々のネットワークは、訓練画像の擬似意味境界ラベルを生成するために使用され、完全に教師付きモデルのトレーニングに使用される。
擬似ラベルでトレーニングされた最終モデルは、SBDデータセット上で卓越したパフォーマンスを達成する。
関連論文リスト
- Co-Segmentation without any Pixel-level Supervision with Application to Large-Scale Sketch Classification [3.3104978705632777]
画像の集合における共通物体の画素レベルの局所化という,オブジェクトの分離のための新しい手法を提案する。
この方法は、同じレベルの監督で訓練された方法のうち、最先端のパフォーマンスを達成する。
大規模スケッチ認識の課題において,提案手法の利点をさらに示す。
論文 参考訳(メタデータ) (2024-10-17T14:16:45Z) - Few-shot Class-Incremental Semantic Segmentation via Pseudo-Labeling and
Knowledge Distillation [3.4436201325139737]
セマンティックセグメンテーションモデルのための新しいクラスをいくつかの例から学習する問題に対処する。
限られたデータから学習するために、数発のトレーニングアノテーションを増強する擬似ラベル方式を提案する。
上記のステップを、統一的な学習目標を持つ単一の畳み込みニューラルネットワークに統合する。
論文 参考訳(メタデータ) (2023-08-05T05:05:37Z) - ReFit: A Framework for Refinement of Weakly Supervised Semantic
Segmentation using Object Border Fitting for Medical Images [4.945138408504987]
Weakly Supervised Semantic (WSSS)は、画像レベルの監視のみに依存しているため、ネットワークの必要性に対処する上で有望なアプローチである。
本稿では,最新クラスのアクティベーションマップとポストプロセッシング手法を組み合わせたReFitフレームワークを提案する。
本手法をWSSS予測に適用することにより,医用画像の最先端WSSS法に対して最大10%の改善を実現した。
論文 参考訳(メタデータ) (2023-03-14T12:46:52Z) - Simpler Does It: Generating Semantic Labels with Objectness Guidance [32.81128493853064]
本稿では、画像のトレーニングのための擬似ラベルを生成する新しいフレームワークについて述べる。
擬似ラベルを生成するには、(i)オブジェクトライクな領域を認識することを学習するクラス非依存のオブジェクトネスネットワーク、(ii)イメージレベルまたはバウンディングボックスアノテーションのいずれからの情報を組み合わせる。
本研究では,対象性ネットワークを自然に活用して,未知のカテゴリに対して対象のような領域を生成する方法を示すことによって,アプローチの有効性を示す。
論文 参考訳(メタデータ) (2021-10-20T01:52:05Z) - Visual Boundary Knowledge Translation for Foreground Segmentation [57.32522585756404]
視覚境界知識を明示的に考慮したモデルの構築を試みており、未確認カテゴリのセグメンテーションにおけるトレーニングの労力を減らそうとしている。
数十のラベル付きサンプルをガイダンスとして使うだけで、Trans-Netは完全な教師付きメソッドと同等のクローズな結果が得られる。
論文 参考訳(メタデータ) (2021-08-01T07:10:25Z) - KRADA: Known-region-aware Domain Alignment for Open World Semantic
Segmentation [64.03817806316903]
セマンティックセグメンテーションでは、画像中のすべてのピクセルにカテゴリラベルを割り当てるために、ピクセルレベルの分類器を訓練することを目指している。
オープンな世界では、ラベル付けされていないテスト画像はおそらく未知のカテゴリを含み、ラベル付けされた画像とは異なる分布を持つ。
本稿では,未知のクラスを識別し,ラベル付きおよびラベルなしのオープンワールド画像中の既知のクラスの分布を整列する,エンドツーエンドの学習フレームワークKRADAを提案する。
論文 参考訳(メタデータ) (2021-06-11T08:43:59Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - Instance Localization for Self-supervised Detection Pretraining [68.24102560821623]
インスタンスローカリゼーションと呼ばれる,新たな自己監視型プリテキストタスクを提案する。
境界ボックスを事前学習に組み込むことで、より優れたタスクアライメントとアーキテクチャアライメントが促進されることを示す。
実験結果から, オブジェクト検出のための最先端の転送学習結果が得られた。
論文 参考訳(メタデータ) (2021-02-16T17:58:57Z) - Contrastive Rendering for Ultrasound Image Segmentation [59.23915581079123]
米国の画像にシャープな境界がないことは、セグメンテーションに固有の課題である。
我々は,US画像における境界推定を改善するための,新しい,効果的なフレームワークを提案する。
提案手法は最先端の手法より優れており,臨床応用の可能性も高い。
論文 参考訳(メタデータ) (2020-10-10T07:14:03Z) - Mining Cross-Image Semantics for Weakly Supervised Semantic Segmentation [128.03739769844736]
2つのニューラルコアテンションを分類器に組み込んで、画像間のセマンティックな類似点と相違点をキャプチャする。
オブジェクトパターン学習の強化に加えて、コアテンションは他の関連する画像からのコンテキストを活用して、ローカライズマップの推論を改善することができる。
提案アルゴリズムは,これらすべての設定に対して新たな最先端性を設定し,その有効性と一般化性を示す。
論文 参考訳(メタデータ) (2020-07-03T21:53:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。