論文の概要: Hierarchical Spatial and Channel Aggregation for Cross-domain Few-shot Segmentation
- arxiv url: http://arxiv.org/abs/2606.24296v1
- Date: Tue, 23 Jun 2026 08:18:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 22:16:48.849521
- Title: Hierarchical Spatial and Channel Aggregation for Cross-domain Few-shot Segmentation
- Title(参考訳): クロスドメインFew-shotセグメンテーションのための階層的空間とチャネルアグリゲーション
- Authors: Sujun Sun, Mingwu Ren, Haofeng Zhang,
- Abstract要約: クロスドメインFew-shot (CD-FSS) は、ソースドメインの豊富な注釈付きサンプルから一般化可能なセグメンテーション能力を学ぶことを目的としている。
提案手法は,4つのターゲット・ドメイン・データセット上での最先端性能を実現する。
- 参考スコア(独自算出の注目度): 8.277992670183004
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-domain Few-shot Segmentation (CD-FSS) aims to learn generalizable segmentation capability from abundant annotated samples in the source domain, enabling accurate segmentation of novel classes in the target domain with only a few annotated samples. Existing CD-FSS methods mainly focus on mitigating feature distribution shifts caused by style gaps while ignoring significant differences in class semantic granularity and discriminative attributes across domains, leading to two key degradations in support-query matching: semantic over-alignment and attribute over-alignment. To this end, we propose the Dual Hierarchical Aggregation Network (DHANet), which comprises three key modules. First, the Hierarchical Spatial Aggregation (HSA) module performs multi-scale region aggregation of pixel features along the spatial dimension, generating hierarchical semantic-enhanced features to alleviate semantic over-alignment. Additionally, the HCA module conducts multi-scale attribute aggregation along the channel dimension, generating hierarchical attribute-enhanced features to mitigate attribute over-alignment. Finally, we propose the Online Probabilistic Semantic Bank (OPSB), which progressively constructs and updates class probability distributions from query predictions during inference, and samples multiple pseudo-prototypes as additional support information to mitigate insufficient support. Extensive experiments on four target-domain datasets demonstrate that our method achieves state-of-the-art performance.
- Abstract(参考訳): クロスドメインFew-shot Segmentation (CD-FSS)は、ソースドメイン内の豊富なアノテーション付きサンプルから一般化可能なセグメンテーション能力を学習することを目的としており、少数のアノテーション付きサンプルでターゲットドメイン内の新規クラスの正確なセグメンテーションを可能にする。
既存のCD-FSS法は主に、スタイルギャップに起因する特徴分布シフトの緩和に焦点を当て、ドメイン間のクラスセマンティックな粒度と識別的な属性に大きな違いを無視し、セマンティックなオーバーアライメントとアトリビュートオーバーアライメントの2つの重要な劣化をもたらす。
この目的のために,3つの鍵モジュールからなるDHANetを提案する。
まず,階層的空間アグリゲーション(HSA)モジュールは,空間次元に沿った画素特徴のマルチスケール領域アグリゲーションを行い,階層的セマンティックアンハンスド特徴を生成し,セマンティックオーバーアライメントを緩和する。
さらに、HCAモジュールはチャネル次元に沿ってマルチスケールの属性アグリゲーションを実行し、階層的な属性アンハンスな特徴を生成し、属性オーバーアライメントを緩和する。
最後に,オンライン確率セマンティックバンク (OPSB) を提案する。この銀行は,推論中の問合せ予測からクラス確率分布を段階的に構築・更新し,複数の擬似プロトタイプを追加支援情報としてサンプル化し,不十分なサポートを緩和する。
4つのターゲットドメインデータセットに対する大規模な実験により,本手法が最先端の性能を実現することを示す。
関連論文リスト
- Training-free Cross-domain Few-shot Segmentation via Robust Semantic Representation and Matching [8.277992670183004]
クロスドメインFew-shot (CD-FSS) は、ソースドメインから異なるターゲットドメインに学習した知識を転送することを目的としている。
トレーニングオーバーヘッドとオーバーフィッティングの両方を回避するために,トレーニング不要のフレームワークを提案する。
論文 参考訳(メタデータ) (2026-06-23T08:19:30Z) - Bridging Granularity Gaps: Hierarchical Semantic Learning for Cross-domain Few-shot Segmentation [10.442470344182993]
クロスドメインFew-shot (CD-FSS) は、トレーニングに関わらないターゲットドメインから新しいクラスを分割することを目的としている。
この問題に対処するための階層型意味学習フレームワークを提案する。
論文 参考訳(メタデータ) (2025-11-15T13:13:26Z) - Unified Domain Adaptive Semantic Segmentation [105.05235403072021]
Unsupervised Adaptive Domain Semantic (UDA-SS)は、ラベル付きソースドメインからラベル付きターゲットドメインに監督を移すことを目的としている。
本稿では,特徴量と特徴量との相違に対処するQuad-directional Mixup(QuadMix)法を提案する。
提案手法は,4つの挑戦的UDA-SSベンチマークにおいて,最先端の成果を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2023-11-22T09:18:49Z) - Semi-supervised Domain Adaptation via Prototype-based Multi-level
Learning [4.232614032390374]
半教師付きドメイン適応(SSDA)では、各クラスのいくつかのラベル付きターゲットサンプルが、完全なラベル付きソースドメインからターゲットドメインへの知識表現の転送を支援する。
本稿では,ラベル付き対象サンプルの可能性をうまく活用するために,プロトタイプベースのマルチレベル学習(ProML)フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-04T10:09:30Z) - Beyond the Prototype: Divide-and-conquer Proxies for Few-shot
Segmentation [63.910211095033596]
少ないショットのセグメンテーションは、少数の濃密なラベル付けされたサンプルのみを与えられた、目に見えないクラスオブジェクトをセグメンテーションすることを目的としている。
分割・分散の精神において, 単純かつ多目的な枠組みを提案する。
提案手法は、DCP(disvision-and-conquer proxies)と呼ばれるもので、適切な信頼性のある情報の開発を可能にする。
論文 参考訳(メタデータ) (2022-04-21T06:21:14Z) - Birds of A Feather Flock Together: Category-Divergence Guidance for
Domain Adaptive Segmentation [35.63920597305474]
教師なしドメイン適応(UDA)は、ソースドメインからターゲットドメインへの特定のモデルの一般化能力を高めることを目的としている。
本研究では,クラス間分離・クラス内アグリゲーション(ISIA)機構を提案する。
各カテゴリの整合複雑性を計測することにより、適応重み付きインスタンスマッチング(AIM)戦略を設計し、インスタンスレベルの適応をさらに最適化する。
論文 参考訳(メタデータ) (2022-04-05T11:17:19Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - I^3Net: Implicit Instance-Invariant Network for Adapting One-Stage
Object Detectors [64.93963042395976]
暗黙のInstance-Invariant Network(I3Net)は、ワンステージ検出器の適応に適しています。
i3netは、異なる層における深い特徴の自然な特徴を利用してインスタンス不変な特徴を暗黙的に学習する。
実験によると、I3Netはベンチマークデータセットの最先端のパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2021-03-25T11:14:36Z) - Cross-Domain Grouping and Alignment for Domain Adaptive Semantic
Segmentation [74.3349233035632]
深層畳み込みニューラルネットワーク(CNN)内のソースドメインとターゲットドメインにセマンティックセグメンテーションネットワークを適用する既存の技術は、対象ドメイン自身や推定カテゴリ内のクラス間変異を考慮していない。
学習可能なクラスタリングモジュールと、クロスドメイングルーピングとアライメントと呼ばれる新しいドメイン適応フレームワークを導入する。
本手法はセマンティクスセグメンテーションにおける適応性能を一貫して向上させ,様々なドメイン適応設定において最先端を上回っている。
論文 参考訳(メタデータ) (2020-12-15T11:36:21Z) - Cross-domain Detection via Graph-induced Prototype Alignment [114.8952035552862]
カテゴリレベルのドメインアライメントを求めるグラフ誘発プロトタイプアライメント(GPA)フレームワークを提案する。
さらに,クラス不均衡がドメイン適応に与える影響を軽減するために,クラス重み付きコントラスト損失を設計する。
我々のアプローチは、既存の手法よりも顕著なマージンで優れています。
論文 参考訳(メタデータ) (2020-03-28T17:46:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。