論文の概要: Self-supervised Few-shot Learning for Semantic Segmentation: An
Annotation-free Approach
- arxiv url: http://arxiv.org/abs/2307.14446v1
- Date: Wed, 26 Jul 2023 18:33:30 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-28 16:47:51.839891
- Title: Self-supervised Few-shot Learning for Semantic Segmentation: An
Annotation-free Approach
- Title(参考訳): 意味セグメンテーションのための自己教師付き少数ショット学習--アノテーションフリーアプローチ
- Authors: Sanaz Karimijafarbigloo and Reza Azad and Dorit Merhof
- Abstract要約: Few-shot semantic segmentation (FSS)は、医用画像解析の分野で大きな可能性を秘めている。
既存のFSS技術は注釈付きセマンティッククラスに大きく依存しており、医療画像には適さない。
本稿では,アノテーションに依存しない新たな自己教師型FSSフレームワークを提案する。その代わりに,支援画像から得られる固有ベクトルを利用して,クエリマスクを適応的に推定する。
- 参考スコア(独自算出の注目度): 4.855689194518905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Few-shot semantic segmentation (FSS) offers immense potential in the field of
medical image analysis, enabling accurate object segmentation with limited
training data. However, existing FSS techniques heavily rely on annotated
semantic classes, rendering them unsuitable for medical images due to the
scarcity of annotations. To address this challenge, multiple contributions are
proposed: First, inspired by spectral decomposition methods, the problem of
image decomposition is reframed as a graph partitioning task. The eigenvectors
of the Laplacian matrix, derived from the feature affinity matrix of
self-supervised networks, are analyzed to estimate the distribution of the
objects of interest from the support images. Secondly, we propose a novel
self-supervised FSS framework that does not rely on any annotation. Instead, it
adaptively estimates the query mask by leveraging the eigenvectors obtained
from the support images. This approach eliminates the need for manual
annotation, making it particularly suitable for medical images with limited
annotated data. Thirdly, to further enhance the decoding of the query image
based on the information provided by the support image, we introduce a
multi-scale large kernel attention module. By selectively emphasizing relevant
features and details, this module improves the segmentation process and
contributes to better object delineation. Evaluations on both natural and
medical image datasets demonstrate the efficiency and effectiveness of our
method. Moreover, the proposed approach is characterized by its generality and
model-agnostic nature, allowing for seamless integration with various deep
architectures. The code is publicly available at
\href{https://github.com/mindflow-institue/annotation_free_fewshot}{\textcolor{magenta}{GitHub}}.
- Abstract(参考訳): Few-shot semantic segmentation (FSS)は、医療画像解析の分野で大きな可能性を秘めており、限られたトレーニングデータで正確なオブジェクトセグメンテーションを可能にする。
しかし、既存のFSS技術は注釈付きセマンティッククラスに大きく依存しており、アノテーションの不足のため医学画像には適さない。
この課題に対処するために、複数のコントリビューションが提案されている。 まず、スペクトル分解法にインスパイアされた画像分解の問題は、グラフ分割タスクとして再編成される。
自己教師付きネットワークの特徴親和性行列から導出されるラプラシアン行列の固有ベクトルを分析し、支持画像から関心対象の分布を推定する。
次に,アノテーションに依存しない自己教師型FSSフレームワークを提案する。
その代わり、サポート画像から得られた固有ベクトルを利用してクエリマスクを適応的に推定する。
このアプローチは手動のアノテーションの必要性を排除し、注釈付きデータに制限のある医療画像に特に適している。
第3に,サポート画像が提供する情報に基づいて,クエリ画像の復号化をさらに促進するために,マルチスケールの大規模カーネルアテンションモジュールを導入する。
関連する機能や詳細を選択的に強調することにより、このモジュールはセグメンテーションプロセスを改善し、よりよいオブジェクト記述に寄与する。
自然画像データセットと医用画像データセットの評価は,本手法の有効性と有効性を示す。
さらに,提案手法は汎用性とモデルに依存しない性質を特徴とし,様々な深層アーキテクチャとのシームレスな統合を実現する。
コードは \href{https://github.com/mindflow-institue/annotation_free_fewshot}{\textcolor{magenta}{GitHub}} で公開されている。
関連論文リスト
- iSeg: An Iterative Refinement-based Framework for Training-free Segmentation [85.58324416386375]
本稿では,自己注意マップを用いた横断注意マップの繰り返し精錬に関する実験的検討を行った。
トレーニング不要セグメンテーションのための効果的な反復改良フレームワークiSegを提案する。
提案したiSegは,mIoUの3.8%の絶対ゲインを達成している。
論文 参考訳(メタデータ) (2024-09-05T03:07:26Z) - SelfReg-UNet: Self-Regularized UNet for Medical Image Segmentation [2.0792866989795864]
UNetで学んだパターンを調査し、そのパフォーマンスに影響を与える可能性のある2つの重要な要因を観察します。
我々は、エンコーダとデコーダの監督のバランスをとり、UNetの冗長な情報を減らすことを提案する。
提案手法は,プラグアンドプレイ方式で既存のUNetアーキテクチャと容易に統合でき,計算コストは無視できる。
論文 参考訳(メタデータ) (2024-06-21T06:34:56Z) - Holistic Prototype Attention Network for Few-Shot VOS [74.25124421163542]
FSVOS(Few-shot Video Object segmentation)は、少数のサポートイメージに頼って、目に見えないクラスの動的オブジェクトをセグメントすることを目的としている。
本稿では,FSVOS を前進させるための総合プロトタイプアテンションネットワーク (HPAN) を提案する。
論文 参考訳(メタデータ) (2023-07-16T03:48:57Z) - Few Shot Medical Image Segmentation with Cross Attention Transformer [30.54965157877615]
我々は、CAT-Netと呼ばれる、数ショットの医用画像セグメンテーションのための新しいフレームワークを提案する。
提案するネットワークは,サポート画像とクエリ画像の相関関係を抽出し,有用なフォアグラウンド情報のみに限定する。
提案手法を,Abd-CT,Abd-MRI,Card-MRIの3つの公開データセットで検証した。
論文 参考訳(メタデータ) (2023-03-24T09:10:14Z) - ReFit: A Framework for Refinement of Weakly Supervised Semantic
Segmentation using Object Border Fitting for Medical Images [4.945138408504987]
Weakly Supervised Semantic (WSSS)は、画像レベルの監視のみに依存しているため、ネットワークの必要性に対処する上で有望なアプローチである。
本稿では,最新クラスのアクティベーションマップとポストプロセッシング手法を組み合わせたReFitフレームワークを提案する。
本手法をWSSS予測に適用することにより,医用画像の最先端WSSS法に対して最大10%の改善を実現した。
論文 参考訳(メタデータ) (2023-03-14T12:46:52Z) - Self-Supervised Correction Learning for Semi-Supervised Biomedical Image
Segmentation [84.58210297703714]
半教師付きバイオメディカルイメージセグメンテーションのための自己教師付き補正学習パラダイムを提案する。
共有エンコーダと2つの独立デコーダを含むデュアルタスクネットワークを設計する。
異なるタスクのための3つの医用画像分割データセットの実験により,本手法の優れた性能が示された。
論文 参考訳(メタデータ) (2023-01-12T08:19:46Z) - Latent Graph Representations for Critical View of Safety Assessment [2.9724186623561435]
CVS予測の手法として,まず乱れのあるシーングラフを用いて手術画像の表現を行い,その表現をグラフニューラルネットワークを用いて処理する手法を提案する。
我々のグラフ表現は、意味情報を明示的に符号化し、解剖学的推論を改善するとともに、視覚的特徴を識別可能性を維持し、意味的誤りに対する堅牢性を提供する。
本手法は,ボックスアノテーションのトレーニングにおいて,複数のベースラインメソッドよりも優れるだけでなく,セグメンテーションマスクのトレーニング時にも効果的にスケールし,最先端のパフォーマンスを維持していることを示す。
論文 参考訳(メタデータ) (2022-12-08T09:21:09Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - Self-Guided and Cross-Guided Learning for Few-Shot Segmentation [12.899804391102435]
単発セグメンテーションのための自己誘導学習手法を提案する。
注釈付き支持画像の初期予測を行うことにより、被覆および検出された前景領域を一次および補助支持ベクトルに符号化する。
プライマリサポートベクターと補助サポートベクターの両方を集約することで、クエリイメージ上でより良いセグメンテーション性能が得られます。
論文 参考訳(メタデータ) (2021-03-30T07:36:41Z) - Self-Supervised Tuning for Few-Shot Segmentation [82.32143982269892]
Few-shotのセグメンテーションは、アノテートされたサンプルがほとんどない各画像ピクセルにカテゴリラベルを割り当てることを目的としている。
既存のメタラーニング手法では, 画像から抽出した視覚的特徴を埋め込み空間に埋め込むと, カテゴリー別識別記述子の生成に失敗する傾向にある。
本稿では,複数のエピソードにまたがる潜在特徴の分布を,自己分割方式に基づいて動的に調整する適応型フレームワークチューニングを提案する。
論文 参考訳(メタデータ) (2020-04-12T03:53:53Z) - High-Order Information Matters: Learning Relation and Topology for
Occluded Person Re-Identification [84.43394420267794]
本稿では,高次関係とトポロジ情報を識別的特徴とロバストなアライメントのために学習し,新しい枠組みを提案する。
我々のフレームワークはOccluded-Dukeデータセットで最先端の6.5%mAPスコアを大幅に上回っている。
論文 参考訳(メタデータ) (2020-03-18T12:18:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。