論文の概要: HADS-Net:A Hybrid Attention-Augmented Dual-Stream Network with Physics-Informed Augmentation for Breast Ultrasound Image Classification
- arxiv url: http://arxiv.org/abs/2605.20536v1
- Date: Tue, 19 May 2026 22:16:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.397575
- Title: HADS-Net:A Hybrid Attention-Augmented Dual-Stream Network with Physics-Informed Augmentation for Breast Ultrasound Image Classification
- Title(参考訳): HADS-Net:胸部超音波画像分類のための物理インフォーム付きハイブリッドアテンション拡張デュアルストリームネットワーク
- Authors: Chinedu Emmanuel Mbonu, Blessing Nwamaka Iduh, Joseph Ikechukwu Odo, Doris Chinedu Asogwa,
- Abstract要約: HADS-Netはハイブリッドアテンション拡張デュアルストリームネットワークである。
グローバルなテクスチャと2つの平行な経路を通して局所的な境界線を利用する。
精度は96.58%、マクロOC-AUCは0.9978、マクロF1は0.9654、クラスF1スコアは0.970、0.951、0.976である。
- 参考スコア(独自算出の注目度): 0.04999814847776097
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate classification of breast ultrasound images into benign, malignant, and normal categories is a critical clinical task complicated by speckle noise, acoustic shadowing, and inter-class visual ambiguity. Existing deep learning methods rely on single-stream architectures with generic augmentation that ignores ultrasound acquisition physics, and no prior method dedicates a stream to the lesion boundary features identified as the most diagnostically significant visual cue. We propose HADS-Net, a Hybrid Attention-Augmented Dual-Stream Network exploiting global texture and local boundary cues through two parallel pathways. Stream 1 applies physics-informed augmentation simulating speckle noise, acoustic shadowing, and gain variation before extracting features via pretrained EfficientNet-B3 projected to 512 dimensions. Stream 2 extracts Sobel edge maps processed by a lightweight CNN projected to the same 512-dimensional space. A cross-attention fusion module allows the texture stream to selectively query boundary features, producing a jointly optimised representation classified by an MLP trained with adaptive class-weighted focal loss. Five-fold stratified cross-validation with cosine annealing over 50 epochs is used, with the globally best checkpoint selected by lowest validation loss evaluated on a held-out test set. On the BUSI dataset, HADS-Net achieves 96.58% accuracy, macro ROC-AUC of 0.9978, macro F1 of 0.9654, and per-class F1-scores of 0.970, 0.951, and 0.976 for benign, malignant, and normal. No malignant lesion is misclassified as normal. These results confirm that modality-specific augmentation with cross-modal attention fusion is an effective strategy for ultrasound-based breast cancer diagnosis.
- Abstract(参考訳): 乳房超音波像の良性,悪性,正常のカテゴリーへの正確な分類は,スペックルノイズ,音響シャドーイング,クラス間の視覚的あいまいさによって複雑化する重要な臨床課題である。
既存のディープラーニング手法は、超音波取得物理を無視した汎用的な拡張による単一ストリームアーキテクチャに依存しており、診断上最も重要な視覚的キューとして認識される病変境界特徴にストリームを割り当てる従来の手法は存在しなかった。
本研究では,グローバルなテクスチャと局所境界キューを2つの並列経路を通じて活用するハイブリッドアテンション拡張Dual-Stream NetworkであるHADS-Netを提案する。
Stream 1は、512次元に投影されたトレーニング済みのEfficientNet-B3を介して特徴を抽出する前に、スペックルノイズ、音響シャドーイング、ゲイン変動をシミュレートした物理インフォーム拡張を適用する。
ストリーム2は、同じ512次元空間に投影された軽量CNNによって処理されたソベルエッジマップを抽出する。
クロスアテンション融合モジュールは、テクスチャストリームが境界特徴を選択的にクエリし、適応的なクラス重み付き焦点損失で訓練されたMDPによって分類された共同最適化表現を生成する。
50エポック以上のコサイン焼鈍を伴う5倍層状クロスバリデーションを用い, ホールドアウト試験セットで評価された最小の検証損失により, 世界最良チェックポイントが選択された。
BUSIデータセットでは、HADS-Netの精度は96.58%、マクロOC-AUCは0.9978、マクロF1は0.9654、クラス毎F1スコアは0.970、0.951、0.976である。
悪性病変は正常と誤分類されない。
以上の結果より, 超音波による乳がん診断において, モダリティ特異的増悪と相互注意融合が有効であることが明らかとなった。
関連論文リスト
- A deep learning pipeline for PAM50 subtype classification using histopathology images and multi-objective patch selection [0.2958068627971103]
PAM50遺伝子シグネチャは、乳がんを固有のサブタイプに分類する標準として広く認識されている。
本研究では,コストのかかる分子アッセイへの依存を減らすことを目的とした,新しい最適化駆動型ディープラーニングフレームワークを提案する。
提案手法は,非支配的ソート遺伝的アルゴリズムII(NSGA-II)とモンテカルロのドロップアウトに基づく不確実性推定を組み合わせ,パッチ情報量,空間的多様性,不確実性,パッチ数などを共同で最適化する。
論文 参考訳(メタデータ) (2026-04-02T09:13:24Z) - UltraLBM-UNet: Ultralight Bidirectional Mamba-based Model for Skin Lesion Segmentation [34.50069854212544]
このUltraLBM-UNetは,マルチブランチ局所的特徴認識と双方向マンバに基づくグローバルモデリング機構を統合した軽量なU-Net変種である。
提案モデルでは, 既存の軽量およびMambaのパラメータが0.034M, 0.060GFLOPよりも優れ, 常に最先端のセグメンテーション精度を実現している。
これらの結果は、正確な、堅牢な病変解析が不可欠である、ポイント・オブ・ケア展開におけるUltraLBM-UNetの適合性を強調した。
論文 参考訳(メタデータ) (2025-12-25T09:05:02Z) - A Deep Learning Framework for Thyroid Nodule Segmentation and Malignancy Classification from Ultrasound Images [2.875000842489767]
本稿では,完全自動化された悪性度予測のための2段階のフレームワークを提案する。
本手法は,臨床的に関係のある領域にのみ集中させ,解釈可能性を実現する。
これは、超音波画像上で甲状腺結節を検出し、悪性度を予測するための、最初の完全なエンドツーエンドパイプラインである。
論文 参考訳(メタデータ) (2025-11-14T23:23:24Z) - A Semantic Segmentation Algorithm for Pleural Effusion Based on DBIF-AUNet [22.657295396752023]
胸水セマンティックセグメンテーションは臨床診断と治療の精度とタイムラインを大幅に向上させる可能性がある。
既存の手法は、様々な画像のバリエーションや複雑なエッジに悩まされることが多い。
本稿では,これらの課題に対処するため,Dual-Branch Interactive Fusion Attention Model (DBIF-AUNet)を提案する。
論文 参考訳(メタデータ) (2025-08-08T10:14:51Z) - HGNet: High-Order Spatial Awareness Hypergraph and Multi-Scale Context Attention Network for Colorectal Polyp Detection [8.385970320948024]
HGNetは高次空間認識ハイパーグラフとマルチスケールコンテキストアテンションを統合している。
HGNetは94%の精度、90.6%のリコール、90%のmAP@0.5を達成し、小さな病変の分化と臨床的解釈性を著しく改善した。
論文 参考訳(メタデータ) (2025-07-07T11:09:05Z) - HistoART: Histopathology Artifact Detection and Reporting Tool [37.31105955164019]
ワイルスライドイメージング(WSI)は、組織標本の詳細な高分解能検査のために広く用いられている。
WSIは、スライドの準備とスキャンの間に導入されたアーティファクトに弱いままです。
本稿では,WSIに対する3つのロバストなアーティファクト検出手法を提案し,比較する。
論文 参考訳(メタデータ) (2025-06-23T17:22:19Z) - Prototype Learning Guided Hybrid Network for Breast Tumor Segmentation in DCE-MRI [58.809276442508256]
本稿では,畳み込みニューラルネットワーク(CNN)とトランスフォーマー層を組み合わせたハイブリッドネットワークを提案する。
プライベートおよびパブリックなDCE-MRIデータセットの実験結果から,提案したハイブリッドネットワークは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-11T15:46:00Z) - WATUNet: A Deep Neural Network for Segmentation of Volumetric Sweep
Imaging Ultrasound [1.2903292694072621]
ボリューム・スイープ・イメージング(VSI)は、訓練を受けていないオペレーターが高品質な超音波画像をキャプチャできる革新的な手法である。
本稿ではWavelet_Attention_UNet(WATUNet)と呼ばれる新しいセグメンテーションモデルを提案する。
このモデルでは、簡単な接続ではなく、ウェーブレットゲート(WG)とアテンションゲート(AG)をエンコーダとデコーダの間に組み込んで、上記の制限を克服する。
論文 参考訳(メタデータ) (2023-11-17T20:32:37Z) - Skeleton Graph-based Ultrasound-CT Non-rigid Registration [40.40844749663152]
皮膚下骨表面の特徴を用いて患者固有の特性を適応させるスケルトングラフに基づく非リグイド登録を提案する。
提案手法を検証するために,1人のボランティアと7つのCT軟骨点群から,異なる患者からUS軟骨点群を手動で抽出した。
論文 参考訳(メタデータ) (2023-05-14T19:21:43Z) - Multiple Time Series Fusion Based on LSTM An Application to CAP A Phase
Classification Using EEG [56.155331323304]
本研究では,深層学習に基づく脳波チャンネルの特徴レベル融合を行う。
チャネル選択,融合,分類手順を2つの最適化アルゴリズムで最適化した。
論文 参考訳(メタデータ) (2021-12-18T14:17:49Z) - Hybrid guiding: A multi-resolution refinement approach for semantic
segmentation of gigapixel histopathological images [0.7490318169877296]
セマンティックセグメンテーションのための、H2G-Netと呼ばれるカスケード畳み込みニューラルネットワーク設計を提案する。
設計にはパッチワイズ方式による検出段階と、畳み込みオートエンコーダを用いた改良段階が含まれる。
最高の設計は90 WSIの独立したテストセットでDiceスコア0.933を達成した。
論文 参考訳(メタデータ) (2021-12-07T02:31:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。