論文の概要: T2ID-CAS: Diffusion Model and Class Aware Sampling to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection
- arxiv url: http://arxiv.org/abs/2504.21231v1
- Date: Tue, 29 Apr 2025 23:46:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-09 23:05:39.940944
- Title: T2ID-CAS: Diffusion Model and Class Aware Sampling to Mitigate Class Imbalance in Neck Ultrasound Anatomical Landmark Detection
- Title(参考訳): T2ID-CAS:Nick Ultrasound Anatomical Landmark Detectionにおけるクラス不均衡軽減のための拡散モデルとクラスアウェア
- Authors: Manikanta Varaganti, Amulya Vankayalapati, Nour Awad, Gregory R. Dion, Laura J. Brattain,
- Abstract要約: ネック超音波(US)は、迅速かつ正確な介入を可能にする非侵襲的でリアルタイムなイメージングを提供することによって、気道管理において重要な役割を担っている。
深層学習に基づく頚部USの解剖学的ランドマーク検出は、手続き効率をさらに向上させる。
本稿では,テキストから画像への潜伏拡散モデルとクラス認識サンプリングを組み合わせたハイブリッド手法T2ID-CASを提案する。
- 参考スコア(独自算出の注目度): 0.3495246564946556
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Neck ultrasound (US) plays a vital role in airway management by providing non-invasive, real-time imaging that enables rapid and precise interventions. Deep learning-based anatomical landmark detection in neck US can further facilitate procedural efficiency. However, class imbalance within datasets, where key structures like tracheal rings and vocal folds are underrepresented, presents significant challenges for object detection models. To address this, we propose T2ID-CAS, a hybrid approach that combines a text-to-image latent diffusion model with class-aware sampling to generate high-quality synthetic samples for underrepresented classes. This approach, rarely explored in the ultrasound domain, improves the representation of minority classes. Experimental results using YOLOv9 for anatomical landmark detection in neck US demonstrated that T2ID-CAS achieved a mean Average Precision of 88.2, significantly surpassing the baseline of 66. This highlights its potential as a computationally efficient and scalable solution for mitigating class imbalance in AI-assisted ultrasound-guided interventions.
- Abstract(参考訳): ネック超音波(US)は、迅速かつ正確な介入を可能にする非侵襲的でリアルタイムなイメージングを提供することによって、気道管理において重要な役割を担っている。
深層学習に基づく頚部USの解剖学的ランドマーク検出は、手続き効率をさらに向上させる。
しかし、気管リングや声帯といった重要な構造が不足しているデータセット内のクラス不均衡は、物体検出モデルに重大な課題をもたらす。
そこで本研究では,テキストから画像への潜伏拡散モデルとクラス認識サンプリングを組み合わせたハイブリッド手法T2ID-CASを提案する。
超音波領域で滅多に探索されるこのアプローチは、マイノリティクラスの表現を改善する。
T2ID-CAS の平均精度は 88.2 であり, 平均精度は66。
このことは、AI支援超音波ガイドによる介入において、クラス不均衡を緩和するための計算効率が高くスケーラブルなソリューションとしての可能性を強調している。
関連論文リスト
- HDC: Hierarchical Distillation for Multi-level Noisy Consistency in Semi-Supervised Fetal Ultrasound Segmentation [2.964206587462833]
HDCと呼ばれる新しい半教師付きセグメンテーションフレームワークが提案されている。
この枠組みは,特徴表現の整合化のための相関誘導損失と,雑音の多い学生学習を安定化するための相互情報損失の2つの目的を持つ階層的蒸留機構を導入している。
論文 参考訳(メタデータ) (2025-04-14T04:52:24Z) - Efficient Lung Ultrasound Severity Scoring Using Dedicated Feature Extractor [12.280417624228544]
MeDiVLADは多レベル肺超音波検査のための新しいパイプラインである。
我々は、自己知識蒸留を利用して、ラベルや集合フレームレベルの特徴を伴わずに視覚変換器(ViT)を事前訓練する。
最小限の微調整により、MeDiVLADはフレームレベルおよびビデオレベルのスコアリングにおいて従来の完全教師付き手法よりも優れることを示す。
論文 参考訳(メタデータ) (2025-01-21T22:28:22Z) - StealthDiffusion: Towards Evading Diffusion Forensic Detection through Diffusion Model [62.25424831998405]
StealthDiffusionは、AI生成した画像を高品質で受け入れがたい敵の例に修正するフレームワークである。
ホワイトボックスとブラックボックスの設定の両方で有効であり、AI生成した画像を高品質な敵の偽造に変換する。
論文 参考訳(メタデータ) (2024-08-11T01:22:29Z) - Stethoscope-guided Supervised Contrastive Learning for Cross-domain
Adaptation on Respiratory Sound Classification [1.690115983364313]
本稿では、ソースドメインから異なるターゲットドメインに知識を転送するクロスドメイン適応手法を提案する。
特に、個々の領域として異なる聴診器タイプを考慮し、新しい聴診器誘導型教師付きコントラスト学習手法を提案する。
ICBHIデータセットの実験結果から,提案手法はドメイン依存性の低減とICBHIスコア61.71%の達成に有効であることが示された。
論文 参考訳(メタデータ) (2023-12-15T08:34:31Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Automated pharyngeal phase detection and bolus localization in
videofluoroscopic swallowing study: Killing two birds with one stone? [1.4337588659482519]
ビデオフルオロスコープドローイング研究(VFSS)は、ドローイングを評価するための金標準イメージング技術である。
研究者は、摂食の咽頭相を自動的に検出できることを実証した。
本稿では,咽頭位相検出と骨の局在化に弱い教師付きで取り組むディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-08T18:25:01Z) - Deep AUC Maximization for Medical Image Classification: Challenges and
Opportunities [60.079782224958414]
我々は、AUCによる新たな深層学習手法による機会と課題を提示し、議論する(別名、アンダーラインbfディープアンダーラインbfAUC分類)。
論文 参考訳(メタデータ) (2021-11-01T15:31:32Z) - A Deep Learning Approach to Predicting Collateral Flow in Stroke
Patients Using Radiomic Features from Perfusion Images [58.17507437526425]
側方循環は、血流を妥協した領域に酸素を供給する特殊な無酸素流路から生じる。
実際のグレーティングは主に、取得した画像の手動検査によって行われる。
MR灌流データから抽出した放射線学的特徴に基づいて,脳卒中患者の側方血流低下を予測するための深層学習手法を提案する。
論文 参考訳(メタデータ) (2021-10-24T18:58:40Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Semi-Supervised Active Learning for COVID-19 Lung Ultrasound
Multi-symptom Classification [13.878896181984262]
本稿では,複雑な特徴をモデル化し,ラベリングコストを削減するため,TSAL法を提案する。
そこで本研究では,多症状多ラベル(MSML)分類ネットワークを提案し,肺症状の識別的特徴について検討した。
678本の動画から6,836枚の画像が採取された71人の臨床患者を含む、COVID19-LUSMSという新しい肺データセットが構築されている。
論文 参考訳(メタデータ) (2020-09-09T10:45:34Z) - CovidDeep: SARS-CoV-2/COVID-19 Test Based on Wearable Medical Sensors
and Efficient Neural Networks [51.589769497681175]
新型コロナウイルス(SARS-CoV-2)がパンデミックを引き起こしている。
SARS-CoV-2の逆転写-ポリメラーゼ連鎖反応に基づく現在の試験体制は、試験要求に追いついていない。
我々は,効率的なDNNと市販のWMSを組み合わせたCovidDeepというフレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-20T21:47:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。