論文の概要: Rethinking Saliency-Guided Weakly-Supervised Semantic Segmentation
- arxiv url: http://arxiv.org/abs/2404.00918v2
- Date: Tue, 2 Apr 2024 10:20:28 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-03 23:26:11.480892
- Title: Rethinking Saliency-Guided Weakly-Supervised Semantic Segmentation
- Title(参考訳): サリエンシ誘導弱弱弱化によるセマンティックセマンティックセグメンテーションの再考
- Authors: Beomyoung Kim, Donghyun Kim, Sung Ju Hwang,
- Abstract要約: 本稿では,弱教師付きセマンティックセグメンテーション(WSSS)におけるサリエンシマップの役割について,新たな視点を提示する。
我々は、サリエンシマップの品質が、サリエンシ誘導型WSSSアプローチにおいて重要な要素であることを観察した。
統一された条件下で研究を行うための標準化されたフレームワークである textttWSSS-BED を紹介する。
- 参考スコア(独自算出の注目度): 57.9703659407207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper presents a fresh perspective on the role of saliency maps in weakly-supervised semantic segmentation (WSSS) and offers new insights and research directions based on our empirical findings. We conduct comprehensive experiments and observe that the quality of the saliency map is a critical factor in saliency-guided WSSS approaches. Nonetheless, we find that the saliency maps used in previous works are often arbitrarily chosen, despite their significant impact on WSSS. Additionally, we observe that the choice of the threshold, which has received less attention before, is non-trivial in WSSS. To facilitate more meaningful and rigorous research for saliency-guided WSSS, we introduce \texttt{WSSS-BED}, a standardized framework for conducting research under unified conditions. \texttt{WSSS-BED} provides various saliency maps and activation maps for seven WSSS methods, as well as saliency maps from unsupervised salient object detection models.
- Abstract(参考訳): 本稿では,弱教師付きセマンティックセグメンテーション(WSSS)におけるサリエンシマップの役割について,新たな知見と研究の方向性を実証的知見に基づいて提示する。
我々は、総合的な実験を行い、サリエンシマップの品質がサリエンシ誘導WSSSアプローチにおける重要な要素であることを観察する。
それでも、WSSSに大きな影響を与えるにもかかわらず、以前の作品で使われたサリエンシマップは、しばしば任意に選択される。
さらに,WSSSでは,これまで注目されなかった閾値の選択が非自明であることも確認した。
より有意義で厳密なWSSS調査を容易にするため,統一された条件下での研究を行うための標準化されたフレームワークである「texttt{WSSS-BED}」を紹介した。
\texttt{WSSS-BED} は、7つのWSSSメソッドに対して様々な唾液マップとアクティベーションマップを提供し、また教師なし唾液オブジェクト検出モデルからの唾液マップを提供する。
関連論文リスト
- Rethinking Class Activation Maps for Segmentation: Revealing Semantic
Information in Shallow Layers by Reducing Noise [2.462953128215088]
クラス活性化マップの性能に対する大きな制限は、畳み込みニューラルネットワークの最後の層にある特徴マップの小さな空間分解能である。
本稿では, 雑音を正の勾配で除去し, ノイズを除去する簡易な勾配法を提案する。
提案手法は,他のCAM関連手法にも容易に適用可能であり,高品質なクラスアクティベーションマップの取得が容易である。
論文 参考訳(メタデータ) (2023-08-04T03:04:09Z) - Robust Saliency-Aware Distillation for Few-shot Fine-grained Visual
Recognition [57.08108545219043]
サンプルが少ない新しいサブカテゴリを認識することは、コンピュータビジョンにおいて不可欠で挑戦的な研究課題である。
既存の文献は、ローカルベースの表現アプローチを採用することでこの問題に対処している。
本稿では,ロバスト・サリエンシ・アウェア蒸留法(RSaD)を提案する。
論文 参考訳(メタデータ) (2023-05-12T00:13:17Z) - An Alternative to WSSS? An Empirical Study of the Segment Anything Model
(SAM) on Weakly-Supervised Semantic Segmentation Problems [35.547433613976104]
Segment Anything Model (SAM)は、優れたパフォーマンスと汎用性を示している。
本報告では,弱スーパービジョンセマンティック(WSSS)におけるSAMの適用について検討する。
画像レベルのクラスラベルのみを付与した擬似ラベル生成パイプラインとしてSAMを適応する。
論文 参考訳(メタデータ) (2023-05-02T16:35:19Z) - Segment Anything in Non-Euclidean Domains: Challenges and Opportunities [133.49534701480914]
我々は,非ユークリッド領域内の多様なグラフデータを処理可能な基礎モデルの開発を目指す,新しいセグメンション・ノンユークリッド・アプライシング(SNA)パラダイムを探求する。
私たちは、データとタスクの観点から、ユークリッドと非ユークリッドのドメインの違いを理解することを含む、SAの概念をグラフ解析に適用する際に生じるユニークな課題に目を向けました。
我々は,SNAの課題に取り組むための予備的解決策をいくつか提示し,それらの限界を詳述するとともに,今後のSNA研究の道を開くためのいくつかの潜在的方向を示す。
論文 参考訳(メタデータ) (2023-04-23T10:01:34Z) - Plugin estimators for selective classification with out-of-distribution
detection [67.28226919253214]
現実世界の分類器は、信頼性の低いサンプルの予測を控えることの恩恵を受けることができる。
これらの設定は、選択分類(SC)とアウト・オブ・ディストリビューション(OOD)の検出文献において広範囲に研究されている。
OOD検出による選択分類に関する最近の研究は、これらの問題の統一的な研究を議論している。
本稿では,既存の手法を理論的に基礎づけ,有効かつ一般化したSCOD用プラグイン推定器を提案する。
論文 参考訳(メタデータ) (2023-01-29T07:45:17Z) - Benchmarking the Robustness of LiDAR Semantic Segmentation Models [78.6597530416523]
本稿では,LiDARセマンティックセグメンテーションモデルのロバスト性を,様々な汚職の下で包括的に解析することを目的とする。
本稿では,悪天候,計測ノイズ,デバイス間不一致という3つのグループで16のドメイン外LiDAR破損を特徴とするSemanticKITTI-Cというベンチマークを提案する。
我々は、単純だが効果的な修正によってロバスト性を大幅に向上させるロバストLiDARセグメンテーションモデル(RLSeg)を設計する。
論文 参考訳(メタデータ) (2023-01-03T06:47:31Z) - Salient Object Detection for Point Clouds [13.852801615283747]
我々は、ポイントクラウドのシナリオにおいて最も目を引くオブジェクトを合理的に反映する、有能なオブジェクトのビュー依存の視点を新たに提示する。
我々は,2,872個のイン/アウトドア3DビューからなるポイントクラウドSODのための最初のデータセットであるPCSODを紹介する。
提案モデルでは,不規則点と不規則点を効果的に解析し,有意な物体を検出する。
論文 参考訳(メタデータ) (2022-07-25T03:35:46Z) - Glimpse-Attend-and-Explore: Self-Attention for Active Visual Exploration [47.01485765231528]
アクティブな視覚探索は、限られた視野を持つエージェントが部分的な観察に基づいて環境を理解するのを支援することを目的としている。
タスク固有の不確実性マップではなく、自己注意を用いて視覚探索をガイドするGlimpse-Attend-and-Exploreモデルを提案する。
私たちのモデルは、探索を駆動する際のデータセットバイアスに頼らずに、奨励的な結果を提供します。
論文 参考訳(メタデータ) (2021-08-26T11:41:03Z) - Towards Novel Target Discovery Through Open-Set Domain Adaptation [73.81537683043206]
オープンソースドメイン適応(OSDA)は、ターゲットドメインが外部のソースドメインでは観察できない新しいカテゴリのサンプルを含むと考えている。
対象領域に見られるカテゴリを正確に識別し,未知のカテゴリのセマンティクス特性を効果的に回復するための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-06T04:22:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。