論文の概要: HMFS: Hybrid Masking for Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2203.12826v1
- Date: Thu, 24 Mar 2022 03:07:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-25 13:49:09.583263
- Title: HMFS: Hybrid Masking for Few-Shot Segmentation
- Title(参考訳): HMFS:Few-Shotセグメンテーションのためのハイブリッドマスキング
- Authors: Seonghyeon Moon, Samuel S. Sohn, Honglu Zhou, Sejong Yoon, Vladimir
Pavlovic, Muhammad Haris Khan, and Mubbasir Kapadia
- Abstract要約: 我々は特徴マスキング(FM)を強化するためのシンプルで効果的で効率的なアプローチを開発した。
本研究では,FM法における微細な空間的詳細の損失を補足する基本入力マスキング手法の検証と活用により補足する。
3つの公開ベンチマークの実験結果から、HMFSは現在の最先端手法よりも目に見えるマージンで優れていることが明らかになった。
- 参考スコア(独自算出の注目度): 27.49000348046462
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study few-shot semantic segmentation that aims to segment a target object
from a query image when provided with a few annotated support images of the
target class. Several recent methods resort to a feature masking (FM)
technique, introduced by [1], to discard irrelevant feature activations to
facilitate reliable segmentation mask prediction. A fundamental limitation of
FM is the inability to preserve the fine-grained spatial details that affect
the accuracy of segmentation mask, especially for small target objects. In this
paper, we develop a simple, effective, and efficient approach to enhance
feature masking (FM). We dub the enhanced FM as hybrid masking (HM).
Specifically, we compensate for the loss of fine-grained spatial details in FM
technique by investigating and leveraging a complementary basic input masking
method [2]. To validate the effectiveness of HM, we instantiate it into a
strong baseline [3], and coin the resulting framework as HMFS. Experimental
results on three publicly available benchmarks reveal that HMFS outperforms the
current state-of-the-art methods by visible margins.
- Abstract(参考訳): 対象クラスの注釈付きサポートイメージをいくつか備えた場合,対象オブジェクトをクエリ画像から分割することを目的とした,少数ショットのセマンティックセグメンテーションについて検討する。
いくつかの最近の手法は[1]によって導入された特徴マスキング(FM)技術を利用して、信頼性の高いセグメンテーションマスク予測を容易にするために無関係な特徴アクティベーションを破棄している。
FMの基本的な制限は、特に小さな対象物に対して、セグメンテーションマスクの精度に影響を与えるきめ細かい空間的詳細を保存できないことである。
本稿では,特徴マスキング(FM)を強化するためのシンプルで効果的で効率的な手法を開発する。
FMをハイブリッドマスク (HM) として用いた。
具体的には,FM法における細粒度空間詳細の損失を補足する基本入力マスキング手法 [2] を検証・活用することで補足する。
HMの有効性を検証するため、強力なベースライン[3]にインスタンス化し、その結果のフレームワークをHMFSとして作成する。
3つの公開ベンチマークの実験結果から、HMFSは現在の最先端手法よりも目に見えるマージンで優れていることが明らかになった。
関連論文リスト
- Bridge the Points: Graph-based Few-shot Segment Anything Semantically [79.1519244940518]
プレトレーニング技術の最近の進歩により、視覚基礎モデルの能力が向上した。
最近の研究はSAMをFew-shot Semantic segmentation (FSS)に拡張している。
本稿では,グラフ解析に基づく簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2024-10-09T15:02:28Z) - Semantic Refocused Tuning for Open-Vocabulary Panoptic Segmentation [42.020470627552136]
Open-vocabulary Panoptic segmentationは、イメージを意味のあるマスクに正確に分割することを目的とした、新たなタスクである。
マスク分類は、オープンボキャブ・パノプティクスのセグメンテーションにおける主要なパフォーマンスボトルネックである。
オープンボキャブ・パノプティクスのセグメンテーションを大幅に強化する新しいフレームワークであるセマンティック・リフォーカス・タニングを提案する。
論文 参考訳(メタデータ) (2024-09-24T17:50:28Z) - Variance-insensitive and Target-preserving Mask Refinement for
Interactive Image Segmentation [68.16510297109872]
ポイントベースのインタラクティブなイメージセグメンテーションは、セマンティックセグメンテーションや画像編集といったアプリケーションにおけるマスクアノテーションの負担を軽減することができる。
本稿では,ユーザ入力の少ないセグメンテーション品質を向上する新しい手法である可変無感・ターゲット保存マスクリファインメントを提案する。
GrabCut、バークレー、SBD、DAVISデータセットの実験は、インタラクティブな画像セグメンテーションにおける我々の手法の最先端性能を実証している。
論文 参考訳(メタデータ) (2023-12-22T02:31:31Z) - Understanding Masked Autoencoders From a Local Contrastive Perspective [80.57196495601826]
Masked AutoEncoder (MAE)は、シンプルだが効果的なマスキングと再構築戦略によって、自己指導型学習の分野に革命をもたらした。
そこで我々は,MaEの再構成的側面とコントラスト的側面の両方を解析するために,ローカルコントラストMAEと呼ばれる新しい経験的枠組みを導入する。
論文 参考訳(メタデータ) (2023-10-03T12:08:15Z) - SEMPART: Self-supervised Multi-resolution Partitioning of Image
Semantics [0.5439020425818999]
SEMPARTは、追加の後処理なしで高品質なマスクを迅速に製造する。
以上の結果から,SEMPARTはポストプロセッシングを伴わずに高品質なマスクを高速に生成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-20T00:07:30Z) - DMKD: Improving Feature-based Knowledge Distillation for Object
Detection Via Dual Masking Augmentation [10.437237606721222]
我々は、空間的に重要かつチャネル的に情報的手がかりの両方をキャプチャできるDMKD(Dual Masked Knowledge Distillation)フレームワークを考案した。
対象物検出タスクの実験により,本手法の助けを借りて,学生ネットワークは4.1%,4.3%の性能向上を達成した。
論文 参考訳(メタデータ) (2023-09-06T05:08:51Z) - Masked Frequency Modeling for Self-Supervised Visual Pre-Training [102.89756957704138]
MFM(Masked Frequency Modeling)は、視覚モデルの自己教師付き事前学習のための統合周波数領域に基づくアプローチである。
MFMはまず入力画像の周波数成分の一部をマスクアウトし、周波数スペクトルの欠落周波数を予測する。
MFMは初めて、ViTとCNNの両方で、単純な非シームフレームワークは、以下のものを使って意味のある表現を学習できることを示した。
論文 参考訳(メタデータ) (2022-06-15T17:58:30Z) - PFENet++: Boosting Few-shot Semantic Segmentation with the
Noise-filtered Context-aware Prior Mask [62.37727055343632]
「Few-Shot」のためのガイド機能強化ネットワークで提案された以前のマスクガイダンスを再考する。
本稿では,クエリ画像中のオブジェクトの配置を改善するために,近隣のセマンティックキューを活用するコンテキスト対応プリエントマスク(CAPM)を提案する。
我々は、不要な応答をスクリーニングするために、軽量ノイズ抑圧モジュール(NSM)を組み込むことにより、さらに一歩前進する。
論文 参考訳(メタデータ) (2021-09-28T15:07:43Z) - RefineMask: Towards High-Quality Instance Segmentation with Fine-Grained
Features [53.71163467683838]
RefineMaskは、オブジェクトやシーンの高品質なインスタンスセグメンテーションのための新しい方法です。
インスタンス毎のセグメンテーションプロセス中に粒度の細かい機能を多段階的に組み込む。
以前のほとんどのメソッドで過剰にスムースされたオブジェクトの曲がった部分のようなハードケースをセグメンテーションすることに成功します。
論文 参考訳(メタデータ) (2021-04-17T15:09:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。