論文の概要: Prototype-Enhanced Multi-View Learning for Thyroid Nodule Ultrasound Classification
- arxiv url: http://arxiv.org/abs/2603.28315v1
- Date: Mon, 30 Mar 2026 11:37:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.364752
- Title: Prototype-Enhanced Multi-View Learning for Thyroid Nodule Ultrasound Classification
- Title(参考訳): 甲状腺結節超音波分類のためのプロトタイプ強化多視点学習
- Authors: Yangmei Chen, Zhongyuan Zhang, Xikun Zhang, Xinyu Hao, Mingliang Hou, Renqiang Luo, Ziqi Xu,
- Abstract要約: 既存のディープラーニング手法は、様々な超音波デバイスや臨床環境に展開する際に、限られた堅牢性や一般化を示すことが多い。
データ不均一性を考慮したプロトタイプ強化多視点学習フレームワークPEMV-thyroidを提案する。
複数の甲状腺超音波データセットの実験では、PEMV甲状腺は最先端の手法より一貫して優れていることが示されている。
- 参考スコア(独自算出の注目度): 7.268080443895895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Thyroid nodule classification using ultrasound imaging is essential for early diagnosis and clinical decision-making; however, despite promising performance on in-distribution data, existing deep learning methods often exhibit limited robustness and generalisation when deployed across different ultrasound devices or clinical environments. This limitation is mainly attributed to the pronounced heterogeneity of thyroid ultrasound images, which can lead models to capture spurious correlations rather than reliable diagnostic cues. To address this challenge, we propose PEMV-thyroid, a Prototype-Enhanced Multi-View learning framework that accounts for data heterogeneity by learning complementary representations from multiple feature perspectives and refining decision boundaries through a prototype-based correction mechanism with mixed prototype information. By integrating multi-view representations with prototype-level guidance, the proposed approach enables more stable representation learning under heterogeneous imaging conditions. Extensive experiments on multiple thyroid ultrasound datasets demonstrate that PEMV-thyroid consistently outperforms state-of-the-art methods, particularly in cross-device and cross-domain evaluation scenarios, leading to improved diagnostic accuracy and generalisation performance in real-world clinical settings. The source code is available at https://github.com/chenyangmeii/Prototype-Enhanced-Multi-View-Learning.
- Abstract(参考訳): 超音波画像を用いた甲状腺結節分類は早期診断や臨床診断には不可欠であるが、分布内データの有望な性能にもかかわらず、既存の深層学習法は様々な超音波装置や臨床環境に展開する際には、限られた堅牢性や一般化を示すことが多い。
この制限は主に甲状腺超音波像の顕著な均一性によるもので、信頼性の高い診断方法ではなく、急激な相関をモデルに捉えることができる。
この課題に対処するため,PEMV-thyroidを提案する。PEMV-thyroidは,複数の特徴から相補的表現を学習し,プロトタイプをベースとした修正機構を通じて決定境界を改良することにより,データ不均一性を考慮に入れた,プロトタイプ拡張型多視点学習フレームワークである。
マルチビュー表現とプロトタイプレベルのガイダンスを組み合わせることで、異種画像条件下でのより安定した表現学習を実現することができる。
複数の甲状腺超音波データセットに対する広範囲な実験により、PEMV-thyroidは、特にクロスデバイスおよびクロスドメイン評価シナリオにおいて、常に最先端の手法よりも優れており、実際の臨床環境での診断精度と一般化性能が向上することが示された。
ソースコードはhttps://github.com/chenyangmeii/Prototype-Enhanced-Multi-View-Learningで公開されている。
関連論文リスト
- Quasi-multimodal-based pathophysiological feature learning for retinal disease diagnosis [4.437523386839875]
多モードデータ合成と融合を統合した統合フレームワークが網膜疾患の分類とグレーディングのために提案されている。
提案する学習システムは,画像空間と特徴空間の両方の可視化を通して,徹底的に解釈される。
この研究は網膜疾患スクリーニングの精度と効率を高めるだけでなく、様々な医用画像モダリティにまたがるデータ拡張のためのスケーラブルなフレームワークも提供する。
論文 参考訳(メタデータ) (2026-02-03T15:13:57Z) - A Semantically Enhanced Generative Foundation Model Improves Pathological Image Synthesis [82.01597026329158]
本稿では,組織合成のための相関調整フレームワーク(CRAFTS)について紹介する。
CRAFTSは、生物学的精度を確保するためにセマンティックドリフトを抑制する新しいアライメント機構を組み込んでいる。
本モデルは,30種類の癌にまたがる多彩な病理像を生成する。
論文 参考訳(メタデータ) (2025-12-15T10:22:43Z) - A Fully Open and Generalizable Foundation Model for Ultrasound Clinical Applications [77.3888788549565]
一般臨床用超音波基礎モデルであるEchoCareについて紹介する。
我々は、キュレートされた、一般公開された大規模なデータセットであるEchoCareData上で、自己教師付き学習を通じてEchoCareを開発した。
最小限のトレーニングで、EchoCareは10の代表的なベンチマークで最先端の比較モデルを上回っている。
論文 参考訳(メタデータ) (2025-09-15T10:05:31Z) - Multiscale Latent Diffusion Model for Enhanced Feature Extraction from Medical Images [5.395912799904941]
CTスキャナーモデルと取得プロトコルのバリエーションは、抽出した放射能特性に有意な変動をもたらす。
LTDiff++は医療画像の特徴抽出を強化するために設計されたマルチスケール潜在拡散モデルである。
論文 参考訳(メタデータ) (2024-10-05T02:13:57Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - On Sensitivity and Robustness of Normalization Schemes to Input
Distribution Shifts in Automatic MR Image Diagnosis [58.634791552376235]
深層学習(DL)モデルは、再構成画像を入力として、複数の疾患の診断において最先端のパフォーマンスを達成した。
DLモデルは、トレーニングとテストフェーズ間の入力データ分布の変化につながるため、さまざまなアーティファクトに敏感である。
本稿では,グループ正規化やレイヤ正規化といった他の正規化手法を用いて,画像のさまざまなアーチファクトに対して,モデル性能にロバスト性を注入することを提案する。
論文 参考訳(メタデータ) (2023-06-23T03:09:03Z) - Ambiguous Medical Image Segmentation using Diffusion Models [60.378180265885945]
我々は,グループ洞察の分布を学習することで,複数の可算出力を生成する単一拡散モデルに基づくアプローチを提案する。
提案モデルでは,拡散の固有のサンプリングプロセスを利用してセグメンテーションマスクの分布を生成する。
その結果,提案手法は既存の最先端曖昧なセグメンテーションネットワークよりも優れていることがわかった。
論文 参考訳(メタデータ) (2023-04-10T17:58:22Z) - Personalized Diagnostic Tool for Thyroid Cancer Classification using
Multi-view Ultrasound [12.86992700452335]
甲状腺癌の発生率は世界中で増加している。
多視点情報を統合するための最適な方法を見つけることは、臨床医の経験にも依存する。
患者ごとに意思決定プロセスをカスタマイズできるパーソナライズド診断ツールを提案する。
論文 参考訳(メタデータ) (2022-07-01T15:32:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。