論文の概要: Confidence-Weighted Semi-Supervised Learning for Skin Lesion Segmentation Using Hybrid CNN-Transformer Networks
- arxiv url: http://arxiv.org/abs/2510.15354v1
- Date: Fri, 17 Oct 2025 06:35:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.497638
- Title: Confidence-Weighted Semi-Supervised Learning for Skin Lesion Segmentation Using Hybrid CNN-Transformer Networks
- Title(参考訳): ハイブリッドCNN変換器ネットワークを用いた皮膚病変分割のための信頼度重み付き半教師付き学習
- Authors: Saqib Qamar,
- Abstract要約: MIRA-Uは,不確実性を認識した教師/学生の擬似ラベルとハイブリッドCNN-Transformerアーキテクチャを組み合わせた半教師付きフレームワークである。
提案手法では,U字型CNN-Transformer学生ネットワークを案内する信頼度重み付き擬似ラベルを生成するために,マスク付き画像モデリングを用いて事前学習した教師ネットワークを用いる。
この設計により、擬似ラベルの品質と境界線が向上し、再構成ベースとCNNのみのベースラインを超えた。
- 参考スコア(独自算出の注目度): 0.20305676256390928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automated skin lesion segmentation through dermoscopic analysis is essential for early skin cancer detection, yet remains challenging due to limited annotated training data. We present MIRA-U, a semi-supervised framework that combines uncertainty-aware teacher-student pseudo-labeling with a hybrid CNN-Transformer architecture. Our approach employs a teacher network pre-trained via masked image modeling to generate confidence-weighted soft pseudo-labels, which guide a U-shaped CNN-Transformer student network featuring cross-attention skip connections. This design enhances pseudo-label quality and boundary delineation, surpassing reconstruction-based and CNN-only baselines, particularly in low-annotation regimes. Extensive evaluation on ISIC-2016 and PH2 datasets demonstrates superior performance, achieving a Dice Similarity Coefficient (DSC) of 0.9153 and Intersection over Union (IoU) of 0.8552 using only 50% labeled data. Code is publicly available on GitHub.
- Abstract(参考訳): 皮膚内視鏡検査による皮膚病変の自動分画は早期皮膚がん検出に不可欠であるが,注記データが少ないため依然として困難である。
MIRA-Uは,不確実性を認識した教師/学生の擬似ラベルとハイブリッドCNN-Transformerアーキテクチャを組み合わせた半教師付きフレームワークである。
提案手法では,教師ネットワークをマスク画像モデリングにより事前訓練し,U字型CNN-Transformer学生ネットワークを案内する信頼度重み付き擬似ラベルを生成する。
この設計は、特に低アノテーション体制において、リコンストラクションベースとCNNのみのベースラインを越え、擬似ラベルの品質と境界線を向上する。
ISIC-2016とPH2データセットの大規模な評価は優れた性能を示し、わずか50%のラベル付きデータを使用して0.9153のDice similarity Coefficient(DSC)と0.8552のIntersection over Union(IoU)を達成する。
コードはGitHubで公開されている。
関連論文リスト
- Learning and Interpreting Gravitational-Wave Features from CNNs with a Random Forest Approach [9.455814650734618]
本稿では,CNNに基づく特徴抽出器とランダムフォレスト(RF)分類器を組み合わせたハイブリッドアーキテクチャを提案する。
提案手法では, 物理的に解釈可能な4つの指標 – 分散, 信号対雑音比 (SNR) , 波形重なり, ピーク振幅 – を導入している。
長期歪データセットを用いて実験した結果,我々のハイブリッドモデルはベースラインCNNモデルよりも優れていた。
論文 参考訳(メタデータ) (2025-05-26T07:33:27Z) - Denoising Diffusion Autoencoders are Unified Self-supervised Learners [58.194184241363175]
本稿では,拡散モデルにおけるネットワーク,すなわち拡散オートエンコーダ(DDAE)が,自己教師型学習者の統合であることを示す。
DDAEはすでに、補助エンコーダを使わずに、中間層内で線形分離可能な表現を強く学習している。
CIFAR-10 と Tiny-ImageNet の線形評価精度は95.9% と 50.0% である。
論文 参考訳(メタデータ) (2023-03-17T04:20:47Z) - HARDC : A novel ECG-based heartbeat classification method to detect
arrhythmia using hierarchical attention based dual structured RNN with
dilated CNN [3.8791511769387625]
不整脈分類のための拡張CNN (HARDC) 法を用いたハイブリッド階層型双方向リカレントニューラルネットワークを開発した。
提案したHARDCは、拡張CNNと双方向リカレントニューラルネットワークユニット(BiGRU-BiLSTM)アーキテクチャをフル活用して、融合機能を生成する。
以上の結果から,複数種類の不整脈信号の分類を自動化し,高度に計算した手法が有望であることが示唆された。
論文 参考訳(メタデータ) (2023-03-06T13:26:29Z) - Prompt Tuning for Parameter-efficient Medical Image Segmentation [79.09285179181225]
2つの医用画像データセットのセマンティックセグメンテーションにパラメータ効率が良いが効果的な適応を実現するために,いくつかのコントリビューションを提案し,検討する。
我々はこのアーキテクチャを、オンライン生成プロトタイプへの割り当てに基づく専用密集型セルフスーパービジョンスキームで事前訓練する。
得られたニューラルネットワークモデルにより、完全に微調整されたモデルとパラメータに適応したモデルとのギャップを緩和できることを実証する。
論文 参考訳(メタデータ) (2022-11-16T21:55:05Z) - Transformer-CNN Cohort: Semi-supervised Semantic Segmentation by the
Best of Both Students [18.860732413631887]
本稿では、視覚変換器(ViT)と畳み込みニューラルネットワーク(CNN)に基づく2人の学生からなる、新しい半教師付き学習(SSL)手法を提案する。
提案手法は,非ラベルデータに対する擬似ラベルによる予測と異種特徴空間の多レベル整合正則化を,下位に組み込む。
我々はCityscapesとPascal VOC 2012データセットのTCCフレームワークを検証する。
論文 参考訳(メタデータ) (2022-09-06T02:11:08Z) - Do We Really Need a Learnable Classifier at the End of Deep Neural
Network? [118.18554882199676]
本研究では、ニューラルネットワークを学習して分類器をランダムにETFとして分類し、訓練中に固定する可能性について検討する。
実験結果から,バランスの取れたデータセットの画像分類において,同様の性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-03-17T04:34:28Z) - Examining and Mitigating Kernel Saturation in Convolutional Neural
Networks using Negative Images [0.8594140167290097]
CNNにおける畳み込みカーネル飽和の影響を解析する。
トレーニングデータセットに負の画像を追加することで、飽和を緩和し、分類精度を高めるための単純なデータ増強技術を提案する。
以上の結果から,CNNは畳み込みカーネル飽和の影響を受けやすく,トレーニングデータセットに負のイメージを補うことで,分類精度が統計的に顕著に向上する可能性が示唆された。
論文 参考訳(メタデータ) (2021-05-10T06:06:49Z) - Knowledge Distillation By Sparse Representation Matching [107.87219371697063]
本稿では,一方の畳み込みネットワーク(cnn)から他方へ,スパース表現を用いて中間知識を伝達するスパース表現マッチング(srm)を提案する。
勾配降下を利用して効率的に最適化し、任意のCNNにプラグアンドプレイで統合できるニューラルプロセッシングブロックとして定式化します。
実験の結果,教師と生徒のネットワーク間のアーキテクチャの違いに頑健であり,複数のデータセットにまたがる他のkd技術よりも優れていた。
論文 参考訳(メタデータ) (2021-03-31T11:47:47Z) - Collaborative Boundary-aware Context Encoding Networks for Error Map
Prediction [65.44752447868626]
本稿では,AEP-Net と呼ばれる協調的コンテキスト符号化ネットワークを提案する。
具体的には、画像とマスクのより優れた特徴融合のための協調的な特徴変換分岐と、エラー領域の正確な局所化を提案する。
AEP-Netはエラー予測タスクの平均DSCが0.8358,0.8164であり、ピアソン相関係数が0.9873である。
論文 参考訳(メタデータ) (2020-06-25T12:42:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。