論文の概要: Multi-Kernel Gated Decoder Adapters for Robust Multi-Task Thyroid Ultrasound under Cross-Center Shift
- arxiv url: http://arxiv.org/abs/2603.08906v1
- Date: Mon, 09 Mar 2026 20:18:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 15:25:23.812603
- Title: Multi-Kernel Gated Decoder Adapters for Robust Multi-Task Thyroid Ultrasound under Cross-Center Shift
- Title(参考訳): クロスセンターシフト下におけるロバストマルチタスク甲状腺超音波用マルチカーネルゲートデコーダアダプタ
- Authors: Maziar Sabouri, Nourhan Bayasi, Arman Rahmim,
- Abstract要約: CNN(ResNet34)と医療用ViT(MedSAM)のバックボーン間の干渉について述べる。
この障害モードにより、デコーダ側のアダプタの軽量なファミリが提案される。
- 参考スコア(独自算出の注目度): 3.6219347779447038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thyroid ultrasound (US) automation couples two competing requirements: global, geometry-driven reasoning for nodule delineation and local, texture-driven reasoning for malignancy risk assessment. Under cross-center domain shift, these cues degrade asymmetrically, yet most multi-task pipelines rely on a single shared backbone, often inducing negative transfer. In this paper, we characterize this interference across CNN (ResNet34) and medical ViT (MedSAM) backbones, and observe a consistent trend: ViTs transfer geometric priors that benefit segmentation, whereas CNNs more reliably preserve texture cues for malignancy discrimination under strong shift and artifacts. Motivated by this failure mode, we propose a lightweight family of decoder-side adapters, the Multi-Kernel Gated Adapter (MKGA) and a residual variant (ResMKGA), which refine multi-scale skip features using complementary receptive fields and apply semantic, context-conditioned gating to suppress artifact-prone content before fusion. Across two US benchmarks, the proposed adapters improve cross-center robustness: they strengthen out-of-domain segmentation and, in the CNN setting, yield clear gains in clinical TI-RADS diagnostic accuracy compared to standard multi-task baselines. Code and models will be released.
- Abstract(参考訳): 甲状腺超音波(US)自動化は,大域的・幾何学的推論と局所的・テクスチャ的推論と悪性度リスク評価の2つの競合する要件を結合する。
クロスセンタードメインシフトの下では、これらのキューは非対称に分解されるが、ほとんどのマルチタスクパイプラインは単一の共有バックボーンに依存し、しばしば負の転送を引き起こす。
本稿では,この干渉をCNN (ResNet34) と医療用ViT (MedSAM) のバックボーンで特徴づけ,一貫した傾向を観察する。
この障害モードにより,マルチカーネルGated Adapter (MKGA) とResMKGA (ResMKGA) の軽量なデコーダ側アダプタ群が提案される。
2つの米国ベンチマークにおいて、提案したアダプタは、ドメイン外のセグメンテーションを強化し、CNN設定では、標準的なマルチタスクベースラインと比較して、臨床TI-RADSの診断精度が明らかに向上する。
コードとモデルはリリースされる。
関連論文リスト
- Gated Differential Linear Attention: A Linear-Time Decoder for High-Fidelity Medical Segmentation [15.30336007288786]
PVT-GDLAはデコーダ中心のトランスフォーマーで、線形時間でシャープで長距離の依存関係を復元する。
これは、CT、MRI、超音波、皮膚内視鏡のベンチマークで同等のトレーニング予算で最先端の精度を達成する。
論文 参考訳(メタデータ) (2026-03-03T08:26:08Z) - Uncertainty-Guided Selective Adaptation Enables Cross-Platform Predictive Fluorescence Microscopy [65.15943255667733]
自動深度選択機能付きサブネットワーク画像翻訳ADDA(SIT-ADDA-Auto)について紹介する。
より深い層を凍結しながら、最も初期の畳み込み層のみを適応させることで、信頼できる転送が得られることを示す。
この結果から,マイクロスコープにおけるラベルなし適応の設計規則とフィールド設定のレシピが提供され,コードが公開されている。
論文 参考訳(メタデータ) (2025-11-15T03:01:05Z) - Unleashing Vision Foundation Models for Coronary Artery Segmentation: Parallel ViT-CNN Encoding and Variational Fusion [12.839049648094893]
冠動脈セグメンテーションは冠動脈疾患(CAD)のコンピュータ診断に重要である
並列符号化アーキテクチャを用いて,視覚基盤モデル(VFM)のパワーを利用する新しいフレームワークを提案する。
提案手法は, 精度の高い冠動脈セグメンテーションにおいて, 最先端の手法よりも優れ, 優れた性能を発揮する。
論文 参考訳(メタデータ) (2025-07-17T09:25:00Z) - Diagnosis for Less-Prevalent Thyroid Carcinoma Subtype Using a Dual-Branch Attention Deep Network with Ultrasound Images [5.558034869630433]
非均一な形態的特徴とデータ不均衡は、超音波画像を用いたまれな甲状腺癌の分類において重要な課題である。
本稿では,マルチタスク学習フレームワークであるChannel-Spatial Attention Synergy Network (CSASN)を提案する。
論文 参考訳(メタデータ) (2025-05-04T18:23:03Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Decomposing the Neurons: Activation Sparsity via Mixture of Experts for Continual Test Time Adaptation [37.79819260918366]
継続的なテスト時間適応(CTTA)は、トレーニング済みのモデルを進化し続けるターゲットドメインに適応させることを目的としている。
我々はCTTAタスクのアダプタとしてMixture-of-Activation-Sparsity-Experts (MoASE)の統合について検討する。
論文 参考訳(メタデータ) (2024-05-26T08:51:39Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - MS-DETR: Multispectral Pedestrian Detection Transformer with Loosely Coupled Fusion and Modality-Balanced Optimization [43.04788370184486]
ミスアライメントとモダリティの不均衡は 多スペクトル歩行者検出において 最も重要な問題です
MS-DETRは2つのモダリティ固有のバックボーンとトランスフォーマーエンコーダで構成され、その後マルチモーダルトランスフォーマーデコーダが続く。
我々のエンドツーエンドのMS-DETRは、挑戦的なKAIST、CVC-14、LLVIPベンチマークデータセットよりも優れた性能を示している。
論文 参考訳(メタデータ) (2023-02-01T07:45:10Z) - ARPM-net: A novel CNN-based adversarial method with Markov Random Field
enhancement for prostate and organs at risk segmentation in pelvic CT images [10.011212599949541]
本研究は,CT画像の多臓器セマンティックセマンティックセグメンテーションを改善するために,新しいCNNに基づく対角深層学習法を開発することを目的とする。
MRF(Markov Random Field)拡張ネットワーク (ARPM-net) は, 対向学習方式を実装している。
モデル輪郭の精度はDice similarity coefficient (DSC), Average Hausdorff Distance (AHD), Average Surface Hausdorff Distance (ASHD), relative Volume difference (VD) を用いて測定した。
論文 参考訳(メタデータ) (2020-08-11T02:40:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。