論文の概要: SSA: Semantic Structure Aware Inference for Weakly Pixel-Wise Dense
Predictions without Cost
- arxiv url: http://arxiv.org/abs/2111.03392v1
- Date: Fri, 5 Nov 2021 11:07:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-08 15:07:22.051639
- Title: SSA: Semantic Structure Aware Inference for Weakly Pixel-Wise Dense
Predictions without Cost
- Title(参考訳): SSA: コストを伴わない弱画像量予測のための意味構造認識
- Authors: Yanpeng Sun and Zechao Li
- Abstract要約: The semantic structure aware inference (SSA) was proposed to explore the semantic structure information hidden in different stage of the CNN-based network to generate high-quality CAM in the model inference。
提案手法はパラメータを含まない利点があり,訓練は不要である。したがって,弱教師付き画素ワイド予測タスクにも適用可能である。
- 参考スコア(独自算出の注目度): 36.27226683586425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The pixel-wise dense prediction tasks based on weakly supervisions currently
use Class Attention Maps (CAM) to generate pseudo masks as ground-truth.
However, the existing methods typically depend on the painstaking training
modules, which may bring in grinding computational overhead and complex
training procedures. In this work, the semantic structure aware inference (SSA)
is proposed to explore the semantic structure information hidden in different
stages of the CNN-based network to generate high-quality CAM in the model
inference. Specifically, the semantic structure modeling module (SSM) is first
proposed to generate the class-agnostic semantic correlation representation,
where each item denotes the affinity degree between one category of objects and
all the others. Then the structured feature representation is explored to
polish an immature CAM via the dot product operation. Finally, the polished
CAMs from different backbone stages are fused as the output. The proposed
method has the advantage of no parameters and does not need to be trained.
Therefore, it can be applied to a wide range of weakly-supervised pixel-wise
dense prediction tasks. Experimental results on both weakly-supervised object
localization and weakly-supervised semantic segmentation tasks demonstrate the
effectiveness of the proposed method, which achieves the new state-of-the-art
results on these two tasks.
- Abstract(参考訳): 弱監督に基づく画素単位の高密度予測タスクは、現在、クラス注意マップ(CAM)を使用して、擬似マスクを地道として生成している。
しかし、既存の方法は通常、計算のオーバーヘッドと複雑なトレーニング手順を研削する、面倒なトレーニングモジュールに依存する。
本研究では,CNNネットワークの異なる段階に隠された意味構造情報を探索し,モデル推論における高品質なCAMを生成するために,意味構造認識推論(SSA)を提案する。
具体的には、セマンティック構造モデリングモジュール(SSM)が最初に提案され、クラスに依存しないセマンティック相関表現を生成する。
次に、ドット積演算による未熟なCAMを研磨するために構造的特徴表現を探索する。
最後に、異なるバックボーンステージからの研磨CAMを出力として溶融する。
提案手法はパラメータを持たない利点があり、訓練する必要はない。
したがって、弱教師付き画素ワイド予測タスクの幅広い範囲に適用することができる。
弱教師付きオブジェクトローカライズと弱教師付きセマンティックセグメンテーションタスクの両方に関する実験結果は,提案手法の有効性を示すものである。
関連論文リスト
- Skeleton2vec: A Self-supervised Learning Framework with Contextualized
Target Representations for Skeleton Sequence [56.092059713922744]
予測対象として高レベルな文脈化機能を使用することで,優れた性能が得られることを示す。
具体的には、シンプルで効率的な3D行動表現学習フレームワークであるSkeleton2vecを提案する。
提案するSkeleton2vecは,従来の手法より優れ,最先端の結果が得られる。
論文 参考訳(メタデータ) (2024-01-01T12:08:35Z) - Masked Momentum Contrastive Learning for Zero-shot Semantic
Understanding [39.424931953675994]
自己教師付き事前学習(SSP)は、ラベル付きデータなしで有意義な特徴表現を抽出できる機械学習の一般的な手法として登場した。
本研究は、コンピュータビジョンタスクにおける純粋な自己教師付き学習(SSL)技術の有効性を評価する。
論文 参考訳(メタデータ) (2023-08-22T13:55:57Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Decom--CAM: Tell Me What You See, In Details! Feature-Level Interpretation via Decomposition Class Activation Map [23.71680014689873]
クラスアクティベーションマップ(CAM)は、オブジェクトの位置をハイライトすることで深層モデルの予測を解釈するために広く使われている。
本稿では,分解クラス活性化マップ(Decom-CAM)と呼ばれる2段階の解釈可能性を提案する。
実験の結果,提案したDecom-CAMは最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-05-27T14:33:01Z) - USER: Unified Semantic Enhancement with Momentum Contrast for Image-Text
Retrieval [115.28586222748478]
Image-Text Retrieval (ITR) は、与えられたクエリに意味のあるターゲットインスタンスを、他のモダリティから検索することを目的としている。
既存のアプローチは通常、2つの大きな制限に悩まされる。
論文 参考訳(メタデータ) (2023-01-17T12:42:58Z) - Guiding the PLMs with Semantic Anchors as Intermediate Supervision:
Towards Interpretable Semantic Parsing [57.11806632758607]
本稿では,既存の事前学習言語モデルを階層型デコーダネットワークに組み込むことを提案する。
第一原理構造をセマンティックアンカーとすることで、2つの新しい中間管理タスクを提案する。
いくつかのセマンティック解析ベンチマークで集中的な実験を行い、我々のアプローチがベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2022-10-04T07:27:29Z) - Exploiting Shape Cues for Weakly Supervised Semantic Segmentation [15.791415215216029]
弱教師付きセマンティックセマンティックセグメンテーション (WSSS) は、画像レベルのラベルのみをトレーニング用として、画素単位のクラス予測を生成することを目的としている。
畳み込みニューラルネットワーク(CNN)のテクスチャバイアス特性を補うために形状情報を活用することを提案する。
我々は、クラスと色親和性の両方を考慮した新しい改良手法により、オンライン方式で予測をさらに洗練する。
論文 参考訳(メタデータ) (2022-08-08T17:25:31Z) - Learning structure-aware semantic segmentation with image-level
supervision [36.40302533324508]
CAMにおける失われた構造情報は、下流セマンティックセマンティックセグメンテーションにおけるその応用を制限すると論じる。
劣化予測をペナルティ化する補助意味境界検出モジュールを紹介します。
PASCAL-VOCデータセットの実験結果から,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2021-04-15T03:33:20Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Eigen-CAM: Class Activation Map using Principal Components [1.2691047660244335]
この論文は、解釈可能で堅牢で透明なモデルに対する需要の増加に対応するために、従来の考え方に基づいている。
提案したEigen-CAMは、畳み込み層から学習した特徴/表現の基本的なコンポーネントを計算し、視覚化する。
論文 参考訳(メタデータ) (2020-08-01T17:14:13Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。