論文の概要: VLCD: Vision-Language Contrastive Distillation for Accurate and Efficient Automatic Placenta Analysis
- arxiv url: http://arxiv.org/abs/2506.02229v1
- Date: Mon, 02 Jun 2025 20:12:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:35.073315
- Title: VLCD: Vision-Language Contrastive Distillation for Accurate and Efficient Automatic Placenta Analysis
- Title(参考訳): VLCD : 高精度かつ効率的な自動胎盤分析のための視覚・言語コントラスト蒸留法
- Authors: Manas Mehta, Yimu Pan, Kelly Gallagher, Alison D. Gernand, Jeffery A. Goldstein, Delia Mwinyelle, Leena Mithal, James Z. Wang,
- Abstract要約: 胎盤の病理検査は、出産に伴う健康リスクの検出および緩和に有効な方法である。
近年のAIの進歩により、胎盤の写真と、出産関連病理の徴候の検出と分類のための病理報告が利用できるようになった。
本稿では,その精度と効率を高めるために,視覚言語によるコントラスト学習フレームワークの2つの改良を提案する。
- 参考スコア(独自算出の注目度): 1.366127486479084
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Pathological examination of the placenta is an effective method for detecting and mitigating health risks associated with childbirth. Recent advancements in AI have enabled the use of photographs of the placenta and pathology reports for detecting and classifying signs of childbirth-related pathologies. However, existing automated methods are computationally extensive, which limits their deployability. We propose two modifications to vision-language contrastive learning (VLC) frameworks to enhance their accuracy and efficiency: (1) text-anchored vision-language contrastive knowledge distillation (VLCD)-a new knowledge distillation strategy for medical VLC pretraining, and (2) unsupervised predistillation using a large natural images dataset for improved initialization. Our approach distills efficient neural networks that match or surpass the teacher model in performance while achieving model compression and acceleration. Our results showcase the value of unsupervised predistillation in improving the performance and robustness of our approach, specifically for lower-quality images. VLCD serves as an effective way to improve the efficiency and deployability of medical VLC approaches, making AI-based healthcare solutions more accessible, especially in resource-constrained environments.
- Abstract(参考訳): 胎盤の病理検査は、出産に伴う健康リスクの検出および緩和に有効な方法である。
近年のAIの進歩により、胎盤の写真と、出産関連病理の徴候の検出と分類のための病理報告が利用できるようになった。
しかし、既存の自動化手法は計算量が大きく、デプロイ可能性に制限がある。
1) 医用VLCプレトレーニングのための新しい知識蒸留戦略であるVLCD (text-anchored vision-lang contrastive knowledge distillation) と,(2) 大規模自然画像データセットを用いた教師なし事前蒸留による初期化の改善。
提案手法は,モデル圧縮とアクセラレーションを達成しつつ,教師モデルに適合する,あるいは超越する効率の良いニューラルネットワークを抽出する。
本研究は,低画質画像に対する非教師なし前処理の有効性を実証するものである。
VLCDは、医療用VLCアプローチの効率性とデプロイ性を改善する効果的な方法として機能し、特にリソース制約のある環境で、AIベースのヘルスケアソリューションをよりアクセスしやすくする。
関連論文リスト
- Federated Learning with LoRA Optimized DeiT and Multiscale Patch Embedding for Secure Eye Disease Recognition [2.1358421658740214]
本研究では,AIを用いた医用イメージングと疾患検出を先進的に進めるために,データ効率画像変換器(DeIT)を用いたアプローチを提案する。
AUC、F1スコア、精度、最小損失、トップ5の精度で最先端のパフォーマンスを実現している。
Grad-CAM++視覚化は、重要な病理領域を強調し、モデルの臨床的関連性を高めることにより、解釈可能性を向上させる。
論文 参考訳(メタデータ) (2025-05-11T13:51:56Z) - The Efficacy of Semantics-Preserving Transformations in Self-Supervised Learning for Medical Ultrasound [60.80780313225093]
本研究は, 肺超音波の自己教師あり学習におけるデータ拡張と前処理方略の影響を系統的に検討した。
画像領域に共通して使用されるベースラインパイプライン、超音波用に設計された新しいセマンティック保存パイプライン、両方のパイプラインから最も効果的な変換の蒸留セットの3つのデータ拡張パイプラインが評価された。
論文 参考訳(メタデータ) (2025-04-10T16:26:47Z) - Predicting Stroke through Retinal Graphs and Multimodal Self-supervised Learning [0.46835339362676565]
脳卒中の早期発見は介入に不可欠であり、信頼できるモデルを必要とする。
臨床情報とともに効率的な網膜像表現法を提案し,心血管の健康状態の包括的把握を試みた。
論文 参考訳(メタデータ) (2024-11-08T14:40:56Z) - IBO: Inpainting-Based Occlusion to Enhance Explainable Artificial Intelligence Evaluation in Histopathology [1.9440228513607511]
Inpainting-Based Occlusion (IBO) は,Denoising Diffusion Probabilistic Model を利用した新しい手法である。
まず,学習された知覚的イメージパッチ類似度(LPIPS)測定値を用いて知覚的類似性を評価するとともに,AUC分析によるモデル予測への影響を定量化する。
論文 参考訳(メタデータ) (2024-08-29T09:57:55Z) - Classification of Breast Cancer Histopathology Images using a Modified Supervised Contrastive Learning Method [4.303291247305105]
モデルロバスト性を高めるために、画像レベルラベルとドメイン固有の拡張の両方を活用することで教師付きコントラスト学習法を改善する。
乳癌の病理組織像から得られたBreakHisデータセットについて検討した。
この改良は93.63%の絶対精度に対応し、データの特性を利用してより適切な表現空間を学習するアプローチの有効性を強調した。
論文 参考訳(メタデータ) (2024-05-06T17:06:11Z) - An Evaluation of Lightweight Deep Learning Techniques in Medical Imaging
for High Precision COVID-19 Diagnostics [0.0]
決定支援システムは、画像の物理的検査に固有の課題を緩和する。
ほとんどのディープラーニングアルゴリズムは、リソース制約のあるデバイスの実装には適していない。
本稿では,MobileNetV2モデルを用いた新型コロナウイルス検出のための軽量深層学習手法の開発と評価について述べる。
論文 参考訳(メタデータ) (2023-05-30T13:14:03Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Harmonizing Pathological and Normal Pixels for Pseudo-healthy Synthesis [68.5287824124996]
そこで本研究では,新しいタイプの識別器であるセグメンタを提案し,病変の正確な特定と擬似健康画像の視覚的品質の向上を図っている。
医用画像強調に生成画像を適用し,低コントラスト問題に対処するために拡張結果を利用する。
BraTSのT2モダリティに関する総合的な実験により、提案手法は最先端の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-03-29T08:41:17Z) - Performance or Trust? Why Not Both. Deep AUC Maximization with
Self-Supervised Learning for COVID-19 Chest X-ray Classifications [72.52228843498193]
ディープラーニングモデルのトレーニングでは、パフォーマンスと信頼の間に妥協をしなければなりません。
本研究は、新型コロナウイルス患者のコンピュータ支援スクリーニングのための自己教師型学習と新しい代理損失を統合したものである。
論文 参考訳(メタデータ) (2021-12-14T21:16:52Z) - Explaining Clinical Decision Support Systems in Medical Imaging using
Cycle-Consistent Activation Maximization [112.2628296775395]
ディープニューラルネットワークを用いた臨床意思決定支援は、着実に関心が高まりつつあるトピックとなっている。
臨床医は、その根底にある意思決定プロセスが不透明で理解しにくいため、この技術の採用をためらうことが多い。
そこで我々は,より小さなデータセットであっても,分類器決定の高品質な可視化を生成するCycleGANアクティベーションに基づく,新たな意思決定手法を提案する。
論文 参考訳(メタデータ) (2020-10-09T14:39:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。