論文の概要: Semantic Segmentation from Image Labels by Reconstruction from Structured Decomposition
- arxiv url: http://arxiv.org/abs/2409.01472v1
- Date: Mon, 2 Sep 2024 21:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-06 03:48:38.490718
- Title: Semantic Segmentation from Image Labels by Reconstruction from Structured Decomposition
- Title(参考訳): 構造的分解からの再構成による画像ラベルからのセマンティックセグメンテーション
- Authors: Xuanrui Zeng,
- Abstract要約: 画像タグからの弱教師付きイメージセグメンテーション(WSSS)は、制約の少ない性質のため、依然として困難である。
主流とは対照的に,マスクを用いた画像の分解から復元する問題として,WSSSの枠組みを提案する。
提案手法は,初期実験において有望な結果を示し,背景曖昧性問題に対する堅牢性を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Weakly supervised image segmentation (WSSS) from image tags remains challenging due to its under-constraint nature. Most mainstream work focus on the extraction of class activation map (CAM) and imposing various additional regularization. Contrary to the mainstream, we propose to frame WSSS as a problem of reconstruction from decomposition of the image using its mask, under which most regularization are embedded implicitly within the framework of the new problem. Our approach has demonstrated promising results on initial experiments, and shown robustness against the problem of background ambiguity. Our code is available at \url{https://github.com/xuanrui-work/WSSSByRec}.
- Abstract(参考訳): 画像タグからの弱教師付きイメージセグメンテーション(WSSS)は、制約の少ない性質のため、依然として困難である。
ほとんどの研究は、クラスアクティベーションマップ(CAM)の抽出と、様々な追加の正規化に重点を置いている。
主流とは対照的に、マスクを用いて画像の分解から再構築する問題としてWSSSの枠組みを提案し、ほとんどの正規化が新たな問題の枠組みに暗黙的に埋め込まれている。
提案手法は,初期実験において有望な結果を示し,背景曖昧性問題に対する堅牢性を示した。
我々のコードは \url{https://github.com/xuanrui-work/WSSSByRec} で利用可能です。
関連論文リスト
- Separate and Conquer: Decoupling Co-occurrence via Decomposition and Representation for Weakly Supervised Semantic Segmentation [14.419786126791369]
画像レベルのラベルを持つ弱教師付きセマンティックセマンティックセマンティックセマンティクス(WSSS)は、高密度アノテーションなしでセマンティクスタスクを実現することを目的としている。
共起問題は広く存在し、WSSSにおけるオブジェクトの誤活性化につながる。
画像空間と特徴空間の次元からこの問題に対処する'分離・コンカ'スキームSeCoを考案する。
論文 参考訳(メタデータ) (2024-02-28T16:43:27Z) - Discovering Structure From Corruption for Unsupervised Image
Reconstruction [11.240702020573208]
画像の先行や基礎的な例にアクセスできることなく、不適切な画像の問題を解くことを検討する。
本研究では,任意の画像の構造を符号化する先行問題を用いて逆問題を解決する代わりに,画像の集合構造に事前制約を組み込んだ逆問題集合を共同で解くことを提案する。
論文 参考訳(メタデータ) (2023-04-12T03:35:23Z) - Hierarchical Similarity Learning for Aliasing Suppression Image
Super-Resolution [64.15915577164894]
エイリアスの影響を抑制するために階層画像超解像ネットワーク(HSRNet)を提案する。
HSRNetは、他の作品よりも定量的かつ視覚的なパフォーマンスを向上し、エイリアスをより効果的に再送信する。
論文 参考訳(メタデータ) (2022-06-07T14:55:32Z) - Domain-Smoothing Network for Zero-Shot Sketch-Based Image Retrieval [66.37346493506737]
Zero-Shot Sketch-Based Image Retrieval (ZS-SBIR) は、新しいクロスモーダル検索タスクである。
ZS-SBIRのための新しいドメイン・スムーシング・ネットワーク(DSN)を提案する。
我々のアプローチは、SketchyとTU-Berlinの両方のデータセットで最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2021-06-22T14:58:08Z) - Learning local regularization for variational image restoration [3.5557219875516655]
本稿では,一般的な画像復元問題を解決するための局所正規化モデルを学習するためのフレームワークを提案する。
この正規化器は完全な畳み込みニューラルネットワークで定義され、小さな画像パッチに対応する受容野を通して画像を見る。
正規化器は、ワッサーシュタイン生成逆数ネットワークに基づくエネルギーを用いて、クリーンパッチと劣化パッチの未ペア分布を批判するものとして学習される。
論文 参考訳(メタデータ) (2021-02-11T17:55:08Z) - Causal Intervention for Weakly-Supervised Semantic Segmentation [122.1846968696862]
画像レベルのラベルのみを用いて、より優れたピクセルレベルの擬似マスクを生成することを目指している。
画像,コンテキスト,およびクラスラベル間の因果関係を分析するための構造因果モデルを提案する。
そこで本研究では,画像レベルの分類において,矛盾するバイアスを取り除くためのコンテキスト調整(CONTA)手法を提案する。
論文 参考訳(メタデータ) (2020-09-26T09:26:29Z) - The Power of Triply Complementary Priors for Image Compressive Sensing [89.14144796591685]
本稿では,一対の相補的な旅先を含むLRD画像モデルを提案する。
次に、画像CSのためのRDモデルに基づく新しいハイブリッド・プラグイン・アンド・プレイ・フレームワークを提案する。
そこで,提案したH-based image CS問題の解法として,単純で効果的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-05-16T08:17:44Z) - In-Domain GAN Inversion for Real Image Editing [56.924323432048304]
トレーニング済みのGANジェネレータに実際のイメージを送出する一般的な方法は、遅延コードに戻すことである。
既存の反転法は、通常、画素値によってターゲット画像の再構成にフォーカスするが、反転したコードは元の潜伏空間のセマンティックドメインに着陸しない。
本稿では、入力画像を忠実に再構成し、変換されたコードが編集に意味のある意味を持つようにするためのドメイン内GAN逆変換手法を提案する。
論文 参考訳(メタデータ) (2020-03-31T18:20:18Z) - Guidance and Evaluation: Semantic-Aware Image Inpainting for Mixed
Scenes [54.836331922449666]
本稿では,SGE-Net(Semantic Guidance and Evaluation Network)を提案する。
セマンティックセグメンテーションマップをインペイントの各尺度のガイダンスとして利用し、そこで位置依存推論を再評価する。
混合シーンの現実画像に対する実験により,提案手法が最先端手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2020-03-15T17:49:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。