論文の概要: Self-Disentanglement and Re-Composition for Cross-Domain Few-Shot Segmentation
- arxiv url: http://arxiv.org/abs/2506.02677v1
- Date: Tue, 03 Jun 2025 09:23:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.514812
- Title: Self-Disentanglement and Re-Composition for Cross-Domain Few-Shot Segmentation
- Title(参考訳): クロスドメインFew-Shotセグメンテーションの自己分散と再構成
- Authors: Jintao Tong, Yixiong Zou, Guangyao Chen, Yuhua Li, Ruixuan Li,
- Abstract要約: Cross-Domain Few-Shot (CD-FSS) は、ソースドメインのデータセットから、限られたアノテーションで見えないターゲットドメインのデータセットに知識を転送することを目的としている。
現在の手法では、マスク予測のためのトレーニングとテストサンプルの距離を比較するのが一般的である。
この広く採用されている手法には絡み合いの問題があり、ソースドメインパターンを結合する傾向がある。
- 参考スコア(独自算出の注目度): 14.585178464610182
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cross-Domain Few-Shot Segmentation (CD-FSS) aims to transfer knowledge from a source-domain dataset to unseen target-domain datasets with limited annotations. Current methods typically compare the distance between training and testing samples for mask prediction. However, we find an entanglement problem exists in this widely adopted method, which tends to bind sourcedomain patterns together and make each of them hard to transfer. In this paper, we aim to address this problem for the CD-FSS task. We first find a natural decomposition of the ViT structure, based on which we delve into the entanglement problem for an interpretation. We find the decomposed ViT components are crossly compared between images in distance calculation, where the rational comparisons are entangled with those meaningless ones by their equal importance, leading to the entanglement problem. Based on this interpretation, we further propose to address the entanglement problem by learning to weigh for all comparisons of ViT components, which learn disentangled features and re-compose them for the CD-FSS task, benefiting both the generalization and finetuning. Experiments show that our model outperforms the state-of-the-art CD-FSS method by 1.92% and 1.88% in average accuracy under 1-shot and 5-shot settings, respectively.
- Abstract(参考訳): Cross-Domain Few-Shot Segmentation (CD-FSS)は、ソースドメインのデータセットから、限られたアノテーションで見えないターゲットドメインのデータセットに知識を転送することを目的としている。
現在の手法では、マスク予測のためのトレーニングとテストサンプルの距離を比較するのが一般的である。
しかし、この広く採用されている手法には絡み合いの問題があり、ソースドメインパターンを結合させ、それぞれを転送しにくくする傾向がある。
本稿では,CD-FSSタスクにおいてこの問題に対処することを目的とする。
まず、ViT構造を自然分解し、解釈のために絡み合う問題を探索する。
分解されたViT成分は距離計算における画像間で交差的に比較され、そこでは有意な比較が等しく重要視され、絡み合わさった問題に繋がる。
この解釈に基づいて,不整形特徴を学習し,それらをCD-FSSタスクに再構成し,一般化と微視化の両立を図ったViTコンポーネントのすべての比較を考察することで,絡み合う問題に対処することを提案する。
実験の結果,本モデルでは,1ショットと5ショットでそれぞれ平均精度が1.92%,1.88%向上し,最先端のCD-FSS法よりも優れていた。
関連論文リスト
- DARC: Distribution-Aware Re-Coloring Model for Generalizable Nucleus
Segmentation [68.43628183890007]
ドメインギャップは、異なるフォアグラウンド(核)-バックグラウンド比によっても引き起こされる可能性があると我々は主張する。
まず、異なる領域間の劇的な画像色変化を緩和する再カラー化手法を提案する。
次に,前景-背景比の変動に頑健な新しいインスタンス正規化手法を提案する。
論文 参考訳(メタデータ) (2023-09-01T01:01:13Z) - Dense Affinity Matching for Few-Shot Segmentation [83.65203917246745]
Few-Shot (FSS) は、新しいクラスイメージをいくつかのサンプルで分割することを目的としている。
本稿では,サポートクエリ間の相互作用を生かした密接な親和性マッチングフレームワークを提案する。
我々のフレームワークは0.68万のパラメータしか持たない異なる設定で非常に競争力のある性能を示す。
論文 参考訳(メタデータ) (2023-07-17T12:27:15Z) - Cross-domain Few-shot Segmentation with Transductive Fine-tuning [29.81009103722184]
本稿では,数ショットの条件下でのクエリ画像の集合に基づいて,ベースモデルをトランスダクティブに微調整することを提案する。
提案手法は,すべてのクロスドメインタスクにおいて,FSSモデルの性能を一貫して,かつ著しく向上させることができる。
論文 参考訳(メタデータ) (2022-11-27T06:44:41Z) - Boosting Few-shot Fine-grained Recognition with Background Suppression
and Foreground Alignment [53.401889855278704]
FS-FGR (Few-shot Fine-fine Recognition) は、限られたサンプルの助けを借りて、新しいきめ細かなカテゴリを認識することを目的としている。
本研究では,背景アクティベーション抑制 (BAS) モジュール,フォアグラウンドオブジェクトアライメント (FOA) モジュール,および局所的局所的(L2L) 類似度測定器からなる2段階の背景アライメントとフォアグラウンドアライメントフレームワークを提案する。
複数のベンチマークで行った実験により,提案手法は既存の最先端技術よりも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-10-04T07:54:40Z) - Adaptation to CT Reconstruction Kernels by Enforcing Cross-domain
Feature Maps Consistency [0.06117371161379209]
本研究は,スムーズで訓練し,鋭い再構築カーネル上で試験したモデルにおいて,新型コロナウイルスのセグメンテーション品質の低下を示すものである。
本稿では,F-Consistency(F-Consistency)と呼ばれる,教師なし適応手法を提案する。
論文 参考訳(メタデータ) (2022-03-28T10:00:03Z) - Maximum Spatial Perturbation Consistency for Unpaired Image-to-Image
Translation [56.44946660061753]
本稿では,最大空間摂動整合(MSPC)と呼ばれる普遍正規化手法を提案する。
MSPCは空間摂動関数(T)と変換演算子(G)を可換(TG = GT)に強制する。
提案手法は,ほとんどのI2Iベンチマークにおいて最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-03-23T19:59:04Z) - Causality-inspired Single-source Domain Generalization for Medical Image
Segmentation [12.697945585457441]
合成ドメインシフトトレーニング例にセグメンテーションモデルを公開するための簡単なデータ拡張手法を提案する。
具体的には,1)画像強度とテクスチャの相違に頑健な深層モデルを実現するために,ランダムに重み付けされた浅層ネットワーク群を用いる。
我々は、ネットワークが予測を行うためのドメイン固有の手がかりとして捉えうる画像内のオブジェクト間の急激な相関を取り除き、未知のドメインに分解する可能性がある。
論文 参考訳(メタデータ) (2021-11-24T14:45:17Z) - DSP: Dual Soft-Paste for Unsupervised Domain Adaptive Semantic
Segmentation [97.74059510314554]
セグメンテーションのための教師なしドメイン適応(UDA)は、ラベル付きソースドメインで訓練されたセグメンテーションモデルをラベル付きターゲットドメインに適応させることを目的としている。
既存の手法では、大きなドメインギャップに悩まされながら、ドメイン不変の特徴を学習しようとする。
本稿では,新しいDual Soft-Paste (DSP)法を提案する。
論文 参考訳(メタデータ) (2021-07-20T16:22:40Z) - Deep Semantic Matching with Foreground Detection and Cycle-Consistency [103.22976097225457]
深層ネットワークに基づく弱い教師付きセマンティックマッチングに対処する。
本研究では,背景乱れの影響を抑えるために,前景領域を明示的に推定する。
複数の画像にまたがって予測変換を強制し、幾何的に可視かつ一貫したサイクル一貫性の損失を発生させる。
論文 参考訳(メタデータ) (2020-03-31T22:38:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。