論文の概要: Multimodal Deep Learning for Diabetic Foot Ulcer Staging Using Integrated RGB and Thermal Imaging
- arxiv url: http://arxiv.org/abs/2603.26952v1
- Date: Fri, 27 Mar 2026 19:47:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.707725
- Title: Multimodal Deep Learning for Diabetic Foot Ulcer Staging Using Integrated RGB and Thermal Imaging
- Title(参考訳): 統合RGBと熱画像を用いた糖尿病性下肢潰瘍のマルチモーダルディープラーニング
- Authors: Gulengul Mermer, Mustafa Furkan Aksu, Gozde Ozsezer, Sevki Cetinkalp, Orhan Er, Mehmet Kemal Gullu,
- Abstract要約: 糖尿病性足潰瘍(DFU)は、糖尿病の重篤な合併症の一つで、治療や医療費の上昇につながる。
本研究の目的は,DFUステージの分類におけるマルチモーダル画像の利用がディープラーニングモデルに与える影響を検討することである。
我々は,RGBと熱画像の同時撮影が可能なRaspberry Piベースのポータブルイメージングシステムを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diabetic foot ulcers (DFU) are one of the serious complications of diabetes that can lead to amputations and high healthcare costs. Regular monitoring and early diagnosis are critical for reducing the clinical burden and the risk of amputation. The aim of this study is to investigate the impact of using multimodal images on deep learning models for the classification of DFU stages. To this end, we developed a Raspberry Pi-based portable imaging system capable of simultaneously capturing RGB and thermal images. Using this prototype, a dataset consisting of 1,205 samples was collected in a hospital setting. The dataset was labeled by experts into six distinct stages. To evaluate the models performance, we prepared three different training sets: RGB-only, thermal-only, and RGB+Thermal (with the thermal image added as a fourth channel). We trained these training sets on the DenseNet121, EfficientNetV2, InceptionV3, ResNet50, and VGG16 models. The results show that the multimodal training dataset, in which RGB and thermal data are combined across four channels, outperforms single-modal approaches. The highest performance was observed in the VGG16 model trained on the RGB+Thermal dataset. The model achieved an accuracy of 93.25%, an F1-score of 92.53%, and an MCC of 91.03%. Grad-CAM heatmap visualizations demonstrated that the thermal channel helped the model focus on the correct location by highlighting temperature anomalies in the ulcer region, while the RGB channel supported the decision-making process with complementary structural and textural information.
- Abstract(参考訳): 糖尿病性足潰瘍(DFU)は、糖尿病の重篤な合併症の一つで、治療や医療費の上昇につながる。
定期的なモニタリングと早期診断は、臨床上の負担と切断のリスクを軽減するために重要である。
本研究の目的は,DFUステージの分類におけるマルチモーダル画像の利用がディープラーニングモデルに与える影響を検討することである。
そこで我々は,RGBと熱画像の同時撮影が可能なRaspberry Piベースのポータブルイメージングシステムを開発した。
この試作品を用いて、病院で1,205個のサンプルからなるデータセットを収集した。
データセットは専門家によって6つの異なるステージにラベル付けされた。
モデルの性能を評価するため,RGBのみ,サーマルのみ,RGB+サーマル(サーマル画像を第4チャンネルとして追加)の3種類のトレーニングセットを用意した。
DenseNet121、EfficientNetV2、InceptionV3、ResNet50、VGG16モデルでこれらのトレーニングセットをトレーニングしました。
その結果,RGBと熱データを4つのチャネルで組み合わせたマルチモーダルトレーニングデータセットは,単一モーダルアプローチよりも優れていた。
最も高いパフォーマンスは、RGB+ThermalデータセットでトレーニングされたVGG16モデルで観測された。
このモデルは精度93.25%、F1スコア92.53%、MCC91.03%を達成した。
Grad-CAM熱マップの可視化では、温度チャネルが潰瘍領域の温度異常を強調することにより、モデルが正しい位置に集中するのに役立ち、RGBチャネルは相補的な構造情報とテクスチャ情報で意思決定プロセスを支持した。
関連論文リスト
- Mobile-Ready Automated Triage of Diabetic Retinopathy Using Digital Fundus Images [0.0]
本稿では,糖尿病網膜症の重症度をデジタル・ファンドス画像から効率的に評価するための,簡易な自動ディープラーニングフレームワークを提案する。
コンシスタント・ランク・ロジット(CORAL)を持つMobileNetV3アーキテクチャを用いて,疾患の進行をモデル化する。
提案システムは、早期糖尿病網膜症スクリーニングのためのスケーラブルで実用的なツールを提供する。
論文 参考訳(メタデータ) (2026-02-25T14:26:18Z) - Detecting spills using thermal imaging, pretrained deep learning models, and a robotic platform [0.0]
本稿では,RGBと熱画像を用いた事前学習モデルを用いたリアルタイム流出検知システムを提案する。
VGG19やNasNetMobileといった軽量モデルを使って,最大100%の精度を実現しています。
実際のロボットとテストデータセットによる実験の結果、熱画像に基づいて訓練されたVGG19モデルが最もよく機能することが示された。
論文 参考訳(メタデータ) (2025-10-09T19:40:58Z) - Taylor-Series Expanded Kolmogorov-Arnold Network for Medical Imaging Classification [0.0]
本研究は,限られた多様なデータセットを用いた正確な医用画像分類のためのKAN(Kolmogorov-Arnold Networks)を紹介する。
モデルはSBTAYLOR-KAN、B-splinesとTaylorシリーズの統合、SBRBF-KAN、Morletウェーブレット変換にB-splinesを埋め込むSBWAVELET-KANである。
脳MRI,胸部X線,結核X線,皮膚病変画像を前処理なしで評価した。
論文 参考訳(メタデータ) (2025-09-17T04:33:54Z) - Exploring Few-Shot Object Detection on Blood Smear Images: A Case Study of Leukocytes and Schistocytes [37.440449828136586]
調査は、DE-ViTと呼ばれる新しいアプローチに焦点を当てている。
この手法はFew-Shotパラダイムで採用されており、トレーニングは限られた数の画像に依存している。
DE-ViTはCOCOデータセットとLVISデータセットで最先端のパフォーマンスを示しているが、どちらもRaabin-WBCデータセットでのパフォーマンスを上回っている。
論文 参考訳(メタデータ) (2025-03-21T12:46:49Z) - An Explainable Non-local Network for COVID-19 Diagnosis [37.378584156643825]
新型3次元非局所ネットワーク(NL-RAN)を用いて,COVID-19,コモン肺炎,正常などのCT画像の分類を行った。
ネットワークにはグローバル情報をキャプチャするための非ローカルモジュールが埋め込まれており、3Dアテンションモジュールは病変の詳細に集中するために埋め込まれている。
実験結果から,提案手法は既存手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2024-08-08T08:35:21Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - An Ensemble Method to Automatically Grade Diabetic Retinopathy with
Optical Coherence Tomography Angiography Images [4.640835690336653]
糖尿病網膜症解析チャレンジ(DRAC)2022から得られる糖尿病網膜症(DR)画像を自動的に評価するアンサンブル法を提案する。
まず、最先端の分類ネットワークを採用し、利用可能なデータセットの異なる分割でUW-OCTA画像のグレードをトレーニングする。
最終的に、25のモデルを取得し、そのうち上位16のモデルを選択し、アンサンブルして最終的な予測を生成する。
論文 参考訳(メタデータ) (2022-12-12T22:06:47Z) - CIRCA: comprehensible online system in support of chest X-rays-based
COVID-19 diagnosis [37.41181188499616]
深層学習技術は、新型コロナウイルスの迅速検出と疾患の進行のモニタリングに役立つ。
5つの異なるデータセットを使用して、モデルトレーニングのための23の799 CXRの代表的なデータセットを構築した。
The U-Net-based model was developed to identified a clinically relevant region of the CXR。
論文 参考訳(メタデータ) (2022-10-11T13:30:34Z) - A self-supervised learning strategy for postoperative brain cavity
segmentation simulating resections [46.414990784180546]
畳み込みニューラルネットワーク(CNN)は最先端の画像セグメンテーション技術である。
CNNはトレーニングに大量の注釈付きデータセットを必要とする。
自己教師型学習戦略は、トレーニングにラベルのないデータを活用することができる。
論文 参考訳(メタデータ) (2021-05-24T12:27:06Z) - Robust pedestrian detection in thermal imagery using synthesized images [39.33977680993236]
熱領域における歩行者検出を2段階に分けて改善する手法を提案する。
まず、生成データ拡張アプローチを使用し、次いで、生成されたデータを用いたドメイン適応法は、RGB歩行者検出器に適応する。
我々の検出器は,最先端技術に関して,KAIST上で最高の単一モダリティ検出結果を達成する。
論文 参考訳(メタデータ) (2021-02-03T11:08:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。