論文の概要: I$^2$R: Inter and Intra-image Refinement in Few Shot Segmentation
- arxiv url: http://arxiv.org/abs/2507.05838v1
- Date: Tue, 08 Jul 2025 10:06:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 16:34:37.844863
- Title: I$^2$R: Inter and Intra-image Refinement in Few Shot Segmentation
- Title(参考訳): I$^2$R:Few Shot Segmentationにおける画像内リファインメントと画像内リファインメント
- Authors: Ourui Fu, Hangzhou He, Xinliang Zhang, Lei Zhu, Shuang Zeng, ZhaoHeng Xie, Yanye Lu,
- Abstract要約: 少数ショットセグメンテーションは、最小限の例を用いて新しいクラスに迅速に一般化できるセグメンテーションモデルを開発することを目的としている。
我々はtextbfI$2$R という新しい FSS 手法を提案する。
PASCAL-5$i$とCOCO-20$i$の1ショット設定で,mIoUの1.9%と2.1%の改善を実現し,最先端の手法よりも優れていた。
- 参考スコア(独自算出の注目度): 16.104882871073325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The annotation bottleneck in semantic segmentation has driven significant interest in few-shot segmentation, which aims to develop segmentation models capable of generalizing rapidly to novel classes using minimal exemplars. Conventional training paradigms typically generate query prior maps by extracting masked-area features from support images, followed by making predictions guided by these prior maps. However, current approaches remain constrained by two critical limitations stemming from inter- and intra-image discrepancies, both of which significantly degrade segmentation performance: 1) The semantic gap between support and query images results in mismatched features and inaccurate prior maps; 2) Visually similar yet semantically distinct regions within support or query images lead to false negative or false positive predictions. We propose a novel FSS method called \textbf{I$^2$R}: 1) Using category-specific high level representations which aggregate global semantic cues from support and query images, enabling more precise inter-image region localization and address the first limitation. 2) Directional masking strategy that suppresses inconsistent support-query pixel pairs, which exhibit high feature similarity but conflicting mask, to mitigate the second issue. Experiments demonstrate that our method outperforms state-of-the-art approaches, achieving improvements of 1.9\% and 2.1\% in mIoU under the 1-shot setting on PASCAL-5$^i$ and COCO-20$^i$ benchmarks, respectively.
- Abstract(参考訳): 意味的セグメンテーションにおけるアノテーションのボトルネックは、最小限の例を用いて新しいクラスに迅速に一般化できるセグメンテーションモデルを開発することを目的とした、少数ショットセグメンテーションに大きな関心を惹き付けている。
従来の訓練パラダイムは、通常、サポート画像からマスク付きエリアの特徴を抽出してクエリ先行マップを生成し、それに続いて、これらの先行マップでガイドされる予測を行う。
しかし、現在のアプローチは、画像内および画像内不一致に起因する2つの重要な制限によって制約され、どちらもセグメンテーション性能が著しく低下している。
1)サポートイメージとクエリイメージのセマンティックギャップは,一致しない特徴と不正確な事前マップをもたらす。
2)サポート画像やクエリ画像内の視覚的に類似しているが意味的に異なる領域は偽陰性または偽陽性の予測につながる。
我々は, textbf{I$^2$R} と呼ばれる新しい FSS 法を提案する。
1)サポート画像とクエリ画像からグローバルなセマンティックキューを集約するカテゴリ固有のハイレベル表現を使用することで,画像間ローカライゼーションをより正確にし,第1の制限に対処することができる。
2)2番目の課題を緩和するために,特徴的類似性が高いが矛盾するマスクを呈する,一貫性のないサポート・クエリ・ピクセル対を抑える指向性マスキング戦略について検討した。
実験により, PASCAL-5$^i$とCOCO-20$^i$の1ショット設定において, mIoUの1.9\%と2.1\%の改善を達成し, 最先端の手法よりも優れていることが示された。
関連論文リスト
- MixReorg: Cross-Modal Mixed Patch Reorganization is a Good Mask Learner
for Open-World Semantic Segmentation [110.09800389100599]
セマンティックセグメンテーションのための新鮮で簡単な事前学習パラダイムであるMixReorgを提案する。
我々のアプローチは、パッチとテキストの対応を保ちながら、画像パッチを混合することで、きめ細かいパッチテキストペアデータを生成することである。
マスク学習者としてMixReorgを使用することで、従来のテキスト教師付きセマンティックセマンティックセマンティックモデルは、非常に一般化可能なピクセル・セマンティックアライメントを実現することができる。
論文 参考訳(メタデータ) (2023-08-09T09:35:16Z) - High-fidelity Pseudo-labels for Boosting Weakly-Supervised Segmentation [17.804090651425955]
画像レベルの弱い教師付きセグメンテーション(WSSS)は、トレーニング中にセグメンテーションマスクを代理することで、通常膨大なデータアノテーションコストを削減する。
本研究は,GAPの代替となる重要サンプリングと特徴類似性損失という,CAMを改善するための2つの手法に基づく。
複数の独立二項問題の後部二項問題に基づいて両手法を再構成する。
パフォーマンスが向上し、より一般的なものになり、事実上あらゆるWSSSメソッドを増強できるアドオンメソッドが出来上がります。
論文 参考訳(メタデータ) (2023-04-05T17:43:57Z) - Cross-domain Few-shot Segmentation with Transductive Fine-tuning [29.81009103722184]
本稿では,数ショットの条件下でのクエリ画像の集合に基づいて,ベースモデルをトランスダクティブに微調整することを提案する。
提案手法は,すべてのクロスドメインタスクにおいて,FSSモデルの性能を一貫して,かつ著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-27T06:44:41Z) - Progressively Dual Prior Guided Few-shot Semantic Segmentation [57.37506990980975]
Few-shotのセマンティックセマンティックセマンティクスタスクは、いくつかのアノテーション付きサポートサンプルを使用して、クエリイメージのセマンティクスを実行することを目的としている。
本稿では,先進的に2重にガイドされた数発のセマンティックセマンティックセグメンテーションネットワークを提案する。
論文 参考訳(メタデータ) (2022-11-20T16:19:47Z) - Few-Shot Segmentation via Cycle-Consistent Transformer [74.49307213431952]
本稿では,サポートとターゲット画像間の画素ワイドな関係を利用して,数ショットのセマンティックセマンティックセグメンテーション作業を容易にすることに焦点を当てる。
本稿では, 有害なサポート機能を除去するために, 新規なサイクル一貫性アテンション機構を提案する。
提案したCyCTRは,従来の最先端手法と比較して著しく改善されている。
論文 参考訳(メタデータ) (2021-06-04T07:57:48Z) - Semantic Distribution-aware Contrastive Adaptation for Semantic
Segmentation [50.621269117524925]
ドメイン適応セマンティックセグメンテーション(ドメイン適応セマンティックセグメンテーション)とは、特定のソースドメインのアノテーションだけで特定のターゲットドメイン上で予測を行うことを指す。
画素ワイド表示アライメントを可能にする意味分布対応コントラスト適応アルゴリズムを提案する。
複数のベンチマークでSDCAを評価し、既存のアルゴリズムを大幅に改善します。
論文 参考訳(メタデータ) (2021-05-11T13:21:25Z) - Self-Guided and Cross-Guided Learning for Few-Shot Segmentation [12.899804391102435]
単発セグメンテーションのための自己誘導学習手法を提案する。
注釈付き支持画像の初期予測を行うことにより、被覆および検出された前景領域を一次および補助支持ベクトルに符号化する。
プライマリサポートベクターと補助サポートベクターの両方を集約することで、クエリイメージ上でより良いセグメンテーション性能が得られます。
論文 参考訳(メタデータ) (2021-03-30T07:36:41Z) - Seed the Views: Hierarchical Semantic Alignment for Contrastive
Representation Learning [116.91819311885166]
一つの画像から生成されたビューをtextbfCross-samples や Multi-level representation に拡張することで,階層的なセマンティックアライメント戦略を提案する。
提案手法はCsMlと呼ばれ,サンプル間の多層視覚表現を堅牢な方法で統合する機能を備えている。
論文 参考訳(メタデータ) (2020-12-04T17:26:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。