論文の概要: Unlocking Generalization in Polyp Segmentation with DINO Self-Attention "keys"
- arxiv url: http://arxiv.org/abs/2512.13376v1
- Date: Mon, 15 Dec 2025 14:29:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.698503
- Title: Unlocking Generalization in Polyp Segmentation with DINO Self-Attention "keys"
- Title(参考訳): DINOセルフアテンションキーを用いたポリプセグメンテーションにおけるアンロック一般化
- Authors: Carla Monteiro, Valentina Corbetta, Regina Beets-Tan, Luís F. Teixeira, Wilson Silva,
- Abstract要約: 本稿では,DINOの自己意図的「キー」機能の本質的ロバスト性を利用して,ロバストセグメンテーションを実現するフレームワークを提案する。
視覚変換器(ViT)の最も深い層からトークンを抽出する従来の手法とは異なり、本手法では単純な畳み込みデコーダを用いてポリプマスクを予測する。
その結果,このパイプラインがSOTA(State-of-the-art)の性能を達成することを示す。
- 参考スコア(独自算出の注目度): 1.1309064441249301
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic polyp segmentation is crucial for improving the clinical identification of colorectal cancer (CRC). While Deep Learning (DL) techniques have been extensively researched for this problem, current methods frequently struggle with generalization, particularly in data-constrained or challenging settings. Moreover, many existing polyp segmentation methods rely on complex, task-specific architectures. To address these limitations, we present a framework that leverages the intrinsic robustness of DINO self-attention "key" features for robust segmentation. Unlike traditional methods that extract tokens from the deepest layers of the Vision Transformer (ViT), our approach leverages the key features of the self-attention module with a simple convolutional decoder to predict polyp masks, resulting in enhanced performance and better generalizability. We validate our approach using a multi-center dataset under two rigorous protocols: Domain Generalization (DG) and Extreme Single Domain Generalization (ESDG). Our results, supported by a comprehensive statistical analysis, demonstrate that this pipeline achieves state-of-the-art (SOTA) performance, significantly enhancing generalization, particularly in data-scarce and challenging scenarios. While avoiding a polyp-specific architecture, we surpass well-established models like nnU-Net and UM-Net. Additionally, we provide a systematic benchmark of the DINO framework's evolution, quantifying the specific impact of architectural advancements on downstream polyp segmentation performance.
- Abstract(参考訳): 大腸癌 (CRC) の診断において, 自動ポリープセグメンテーションが重要である。
ディープラーニング(DL)技術はこの問題に対して広範囲に研究されてきたが、現在の手法は一般化に苦慮することが多い。
さらに、多くの既存のpolypセグメンテーション手法は複雑なタスク固有のアーキテクチャに依存している。
これらの制約に対処するために,DINOの自己意図的「キー」機能の本質的ロバスト性を活用して,ロバストセグメンテーションを実現するフレームワークを提案する。
視覚変換器(ViT)の最も深い層からトークンを抽出する従来の手法とは異なり,本手法では,ポリプマスクの予測に単純な畳み込みデコーダを用いて自己保持モジュールの重要な特徴を活用し,性能の向上と一般化性の向上を実現している。
本稿では,DG(Domain Generalization)とESDG(Extreme Single Domain Generalization)の2つの厳密なプロトコルの下で,マルチセンタデータセットを用いてアプローチを検証する。
総合的な統計分析により,このパイプラインは最先端(SOTA)性能を達成し,特にデータスカースや挑戦的なシナリオにおいて,一般化を著しく向上させることを示した。
ポリプ固有のアーキテクチャを避ける一方で、nnU-NetやUM-Netといった確立したモデルを超えています。
さらに、DINOフレームワークの進化のシステマティックなベンチマークを提供し、下流ポリプセグメンテーション性能に対するアーキテクチャの進歩の影響を定量化する。
関連論文リスト
- An Entropy-Guided Curriculum Learning Strategy for Data-Efficient Acoustic Scene Classification under Domain Shift [12.42019711058722]
音響シーン分類(ASC)は、録音装置全体にわたる一般化の課題に直面している。
DCASE 2024 Challenge Task 1は、いくつかのデバイスで記録された小さなラベル付きサブセットからモデルを学ぶことを要求することで、この問題を強調している。
データ効率のよいASCにおける領域シフト問題に対処するエントロピー誘導型カリキュラム学習戦略を提案する。
論文 参考訳(メタデータ) (2025-09-14T09:01:52Z) - Deepfake Detection that Generalizes Across Benchmarks [48.85953407706351]
ディープフェイク検出器の非表示操作技術への一般化は、実用的展開の課題である。
この研究は、基礎となる事前学習された視覚エンコーダのパラメータ効率適応により、ロバストな一般化が達成可能であることを示す。
提案手法は、平均的クロスデータセットAUROCにおける、より複雑な、最新のアプローチよりも優れた、最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-08-08T12:03:56Z) - Frequency Prior Guided Matching: A Data Augmentation Approach for Generalizable Semi-Supervised Polyp Segmentation [5.951218651336557]
ポリプエッジは、多様なデータセット間で、驚くほど一貫した周波数シグネチャを示す。
FPGMはラベル付きポリープのエッジ領域から前もってドメイン不変周波数を学習する。
ラベルのない画像に対してスペクトル摂動を原則として行い、その振幅スペクトルを学習済みの画像と整合させる。
例外的なゼロショットの一般化能力を示し、データ共有シナリオにおけるDiceスコアの10%以上の絶対的なゲインを達成する。
論文 参考訳(メタデータ) (2025-07-30T16:08:40Z) - Object Style Diffusion for Generalized Object Detection in Urban Scene [69.04189353993907]
本稿では,GoDiffという新しい単一ドメインオブジェクト検出一般化手法を提案する。
擬似ターゲットドメインデータとソースドメインデータを統合することで、トレーニングデータセットを多様化する。
実験により,本手法は既存の検出器の一般化能力を高めるだけでなく,他の単一領域一般化手法のプラグ・アンド・プレイ拡張として機能することが示された。
論文 参考訳(メタデータ) (2024-12-18T13:03:00Z) - PointDGMamba: Domain Generalization of Point Cloud Classification via Generalized State Space Model [77.00221501105788]
領域一般化(DG)は、最近、点雲分類の一般化性を改善するために研究されている。
本稿では、DG PCCにおける状態空間モデル(SSM)の一般化可能性について研究する。
本稿では,未知の領域に対して強い一般化性を持つ新しいフレームワークであるPointDGMambaを提案する。
論文 参考訳(メタデータ) (2024-08-24T12:53:48Z) - Edge-aware Feature Aggregation Network for Polyp Segmentation [38.11584888416297]
本研究では,ポリプセグメンテーションのためのエッジ対応特徴集約ネットワーク(EFA-Net)を提案する。
EFA-Netは、ポリプセグメンテーションの性能を高めるために、クロスレベルとマルチスケールの機能を完全に活用することができる。
広く採用されている5つの大腸内視鏡データセットの実験結果から,我々のEFA-Netは,一般化と有効性の観点から,最先端のポリプセグメンテーション法より優れていることが示された。
論文 参考訳(メタデータ) (2023-09-19T11:09:38Z) - NormAUG: Normalization-guided Augmentation for Domain Generalization [60.159546669021346]
ディープラーニングのためのNormAUG(Normalization-guided Augmentation)と呼ばれるシンプルで効果的な手法を提案する。
本手法は特徴レベルで多様な情報を導入し,主経路の一般化を改善する。
テスト段階では、アンサンブル戦略を利用して、モデルの補助経路からの予測を組み合わせ、さらなる性能向上を図る。
論文 参考訳(メタデータ) (2023-07-25T13:35:45Z) - Towards Lightweight Cross-domain Sequential Recommendation via External
Attention-enhanced Graph Convolution Network [7.1102362215550725]
クロスドメインシークエンシャルレコメンデーション(CSR)は、複数のドメインからのインタラクションをモデル化することで、重複したユーザの振る舞いパターンの進化を描いている。
上記の課題,すなわちLEA-GCNを解決するために,軽量な外部注意強化GCNベースのフレームワークを導入する。
フレームワークの構造をさらに緩和し、ユーザ固有のシーケンシャルパターンを集約するために、新しい二重チャネル外部注意(EA)コンポーネントを考案する。
論文 参考訳(メタデータ) (2023-02-07T03:06:29Z) - Lesion-aware Dynamic Kernel for Polyp Segmentation [49.63274623103663]
ポリープセグメンテーションのための障害対応動的ネットワーク(LDNet)を提案する。
従来のU字型エンコーダ・デコーダ構造であり、動的カーネル生成と更新スキームが組み込まれている。
この単純だが効果的なスキームは、我々のモデルに強力なセグメンテーション性能と一般化能力を与える。
論文 参考訳(メタデータ) (2023-01-12T09:53:57Z) - Shape-aware Meta-learning for Generalizing Prostate MRI Segmentation to
Unseen Domains [68.73614619875814]
前立腺MRIのセグメント化におけるモデル一般化を改善するために,新しい形状認識メタラーニング手法を提案する。
実験結果から,本手法は未確認領域の6つの設定すべてにおいて,最先端の一般化手法を一貫して上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2020-07-04T07:56:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。