論文の概要: Lagrange Duality and Compound Multi-Attention Transformer for Semi-Supervised Medical Image Segmentation
- arxiv url: http://arxiv.org/abs/2409.07793v1
- Date: Thu, 12 Sep 2024 06:52:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-13 17:27:46.012237
- Title: Lagrange Duality and Compound Multi-Attention Transformer for Semi-Supervised Medical Image Segmentation
- Title(参考訳): 半監督医用画像分割のためのラグランジュデューナリティと複合マルチアテンション変換器
- Authors: Fuchen Zheng, Quanjun Li, Weixuan Li, Xuhang Chen, Yihang Dong, Guoheng Huang, Chi-Man Pun, Shoujun Zhou,
- Abstract要約: 半教師付き学習における総合的な学習目標として,境界認識型コントラスト損失と統合されたラグランジュ二重性損失(LDC)を提案する。
また、ResUNetとTransformerの強みを相乗化する新しいネットワークであるCMAformerを紹介する。
以上の結果から,CMAformerは機能融合フレームワークと新たな一貫性の喪失と相まって,半教師付き学習アンサンブルにおいて強い相補性を示すことが明らかとなった。
- 参考スコア(独自算出の注目度): 27.758157788769253
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Medical image segmentation, a critical application of semantic segmentation in healthcare, has seen significant advancements through specialized computer vision techniques. While deep learning-based medical image segmentation is essential for assisting in medical diagnosis, the lack of diverse training data causes the long-tail problem. Moreover, most previous hybrid CNN-ViT architectures have limited ability to combine various attentions in different layers of the Convolutional Neural Network. To address these issues, we propose a Lagrange Duality Consistency (LDC) Loss, integrated with Boundary-Aware Contrastive Loss, as the overall training objective for semi-supervised learning to mitigate the long-tail problem. Additionally, we introduce CMAformer, a novel network that synergizes the strengths of ResUNet and Transformer. The cross-attention block in CMAformer effectively integrates spatial attention and channel attention for multi-scale feature fusion. Overall, our results indicate that CMAformer, combined with the feature fusion framework and the new consistency loss, demonstrates strong complementarity in semi-supervised learning ensembles. We achieve state-of-the-art results on multiple public medical image datasets. Example code are available at: \url{https://github.com/lzeeorno/Lagrange-Duality-and-CMAformer}.
- Abstract(参考訳): 医療におけるセマンティックセグメンテーションの重要な応用である医用画像セグメンテーションは、特殊なコンピュータビジョン技術によって大幅に進歩している。
深層学習に基づく医用画像のセグメンテーションは, 診断支援に不可欠であるが, 多様なトレーニングデータの欠如は, 長期的問題を引き起こす。
さらに、これまでのほとんどのハイブリッドCNN-ViTアーキテクチャは、畳み込みニューラルネットワークの異なる層における様々な注意を結合する能力に制限がある。
これらの課題に対処するために,境界認識型コントラスト型ロスと統合したLagrange Duality Consistency (LDC) Lossを提案する。
さらに,ResUNetとTransformerの強みを相乗化する新しいネットワークであるCMAformerを紹介する。
CMAformerのクロスアテンションブロックは、マルチスケールな特徴融合のための空間的注意とチャネル的注意を効果的に統合する。
以上の結果から,CMAformerは機能融合フレームワークと新たな一貫性の喪失と相まって,半教師付き学習アンサンブルにおいて強い相補性を示すことが明らかとなった。
複数の公開医用画像データセットで最先端の結果を得る。
例えば、 \url{https://github.com/lzeeorno/Lagrange-Duality-and-CMAformer} のコードは以下の通り。
関連論文リスト
- SMAFormer: Synergistic Multi-Attention Transformer for Medical Image Segmentation [28.490211130600702]
SMAFormerはトランスフォーマーをベースとしたアーキテクチャで,腫瘍や臓器のセグメンテーションを強化するために複数の注意機構を融合する。
まず、Pixel Attention、Channel Attention、Spatial Attention for Feature Enrichmentの利点を生かしたSMAトランスフォーマーブロックを提案する。
第2に,注目機構遷移と特徴融合の間に生じる情報損失の課題に対処するため,我々は特徴融合変調器を設計する。
論文 参考訳(メタデータ) (2024-08-31T04:23:33Z) - Dual-scale Enhanced and Cross-generative Consistency Learning for Semi-supervised Medical Image Segmentation [49.57907601086494]
医用画像のセグメンテーションはコンピュータ支援診断において重要な役割を担っている。
半教師型医用画像(DEC-Seg)のための新しいDual-scale Enhanced and Cross-generative consistency learning frameworkを提案する。
論文 参考訳(メタデータ) (2023-12-26T12:56:31Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Scale-aware Super-resolution Network with Dual Affinity Learning for
Lesion Segmentation from Medical Images [50.76668288066681]
低解像度医用画像から様々な大きさの病変を適応的に分割する,スケールアウェアな超解像ネットワークを提案する。
提案するネットワークは,他の最先端手法と比較して一貫した改善を実現した。
論文 参考訳(メタデータ) (2023-05-30T14:25:55Z) - Multi-Level Global Context Cross Consistency Model for Semi-Supervised
Ultrasound Image Segmentation with Diffusion Model [0.0]
本研究では,Latent Diffusion Model (LDM) によって生成された画像を,半教師付き学習のためのラベル付き画像として利用するフレームワークを提案する。
提案手法により,確率分布の知識をセグメント化ネットワークに効果的に伝達することが可能となり,セグメント化精度が向上する。
論文 参考訳(メタデータ) (2023-05-16T14:08:24Z) - M$^{2}$SNet: Multi-scale in Multi-scale Subtraction Network for Medical
Image Segmentation [73.10707675345253]
医用画像から多様なセグメンテーションを仕上げるマルチスケールサブトラクションネットワーク(M$2$SNet)を提案する。
本手法は,4つの異なる医用画像セグメンテーションタスクの11つのデータセットに対して,異なる評価基準の下で,ほとんどの最先端手法に対して好意的に機能する。
論文 参考訳(メタデータ) (2023-03-20T06:26:49Z) - TransFusion: Multi-view Divergent Fusion for Medical Image Segmentation
with Transformers [8.139069987207494]
コンボリューション層と強力なアテンション機構を用いた多視点画像情報をマージするトランスフォーマーベースのアーキテクチャであるTransFusionを提案する。
特に、ディバージェント・フュージョン・アテンション(DiFA)モジュールは、リッチ・クロスビュー・コンテキスト・モデリングとセマンティック・インテリジェンス・マイニングのために提案されている。
論文 参考訳(メタデータ) (2022-03-21T04:02:54Z) - MEDUSA: Multi-scale Encoder-Decoder Self-Attention Deep Neural Network
Architecture for Medical Image Analysis [71.2022403915147]
医用画像解析に適したマルチスケールエンコーダデコーダ自己保持機構であるMEDUSAを紹介する。
我々は、COVIDx、RSNA RICORD、RSNA Pneumonia Challengeなどの医療画像分析ベンチマークの最先端性能を得た。
論文 参考訳(メタデータ) (2021-10-12T15:05:15Z) - TransAttUnet: Multi-level Attention-guided U-Net with Transformer for
Medical Image Segmentation [33.45471457058221]
本稿では,TransAttUnetと呼ばれるトランスフォーマーベースの医用画像セマンティックセマンティック・セマンティック・フレームワークを提案する。
特に,デコーダブロック間の複数スケールのスキップ接続を確立することで,セマンティック・スケールのアップサンプリング機能を集約する。
我々の手法は一貫して最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2021-07-12T09:17:06Z) - Few-shot Medical Image Segmentation using a Global Correlation Network
with Discriminative Embedding [60.89561661441736]
医療画像分割のための新しい手法を提案する。
深層畳み込みネットワークを用いた数ショット画像セグメンタを構築します。
深層埋め込みの識別性を高め,同一クラスの特徴領域のクラスタリングを促進する。
論文 参考訳(メタデータ) (2020-12-10T04:01:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。