論文の概要: Integrating Vision and Location with Transformers: A Multimodal Deep Learning Framework for Medical Wound Analysis
- arxiv url: http://arxiv.org/abs/2504.10452v1
- Date: Mon, 14 Apr 2025 17:39:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:51:16.632049
- Title: Integrating Vision and Location with Transformers: A Multimodal Deep Learning Framework for Medical Wound Analysis
- Title(参考訳): トランスフォーマーによる視覚と位置情報の統合:医療画像解析のためのマルチモーダル深層学習フレームワーク
- Authors: Ramin Mousa, Hadis Taherinia, Khabiba Abdiyeva, Amir Ali Bengari, Mohammadmahdi Vahediahmar,
- Abstract要約: 深層学習(DL)は創傷診断の強力なツールである。
位置データを提供するためにボディマップも作成され、傷の専門医が傷の場所をより効果的にラベル付けるのに役立つ。
提案モデルでは,画像データを用いた精度0.8123,画像データと創傷位置を組み合わせた精度0.8007を実現した。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Effective recognition of acute and difficult-to-heal wounds is a necessary step in wound diagnosis. An efficient classification model can help wound specialists classify wound types with less financial and time costs and also help in deciding on the optimal treatment method. Traditional machine learning models suffer from feature selection and are usually cumbersome models for accurate recognition. Recently, deep learning (DL) has emerged as a powerful tool in wound diagnosis. Although DL seems promising for wound type recognition, there is still a large scope for improving the efficiency and accuracy of the model. In this study, a DL-based multimodal classifier was developed using wound images and their corresponding locations to classify them into multiple classes, including diabetic, pressure, surgical, and venous ulcers. A body map was also created to provide location data, which can help wound specialists label wound locations more effectively. The model uses a Vision Transformer to extract hierarchical features from input images, a Discrete Wavelet Transform (DWT) layer to capture low and high frequency components, and a Transformer to extract spatial features. The number of neurons and weight vector optimization were performed using three swarm-based optimization techniques (Monster Gorilla Toner (MGTO), Improved Gray Wolf Optimization (IGWO), and Fox Optimization Algorithm). The evaluation results show that weight vector optimization using optimization algorithms can increase diagnostic accuracy and make it a very effective approach for wound detection. In the classification using the original body map, the proposed model was able to achieve an accuracy of 0.8123 using image data and an accuracy of 0.8007 using a combination of image data and wound location. Also, the accuracy of the model in combination with the optimization models varied from 0.7801 to 0.8342.
- Abstract(参考訳): 急性および難治性の創傷を効果的に認識することは、創傷の診断に必要となるステップである。
効率的な分類モデルは、創傷専門家が金銭的・時間的コストの少ない傷種を分類するのに役立ち、また最適な治療方法を決定するのにも役立ちます。
従来の機械学習モデルは特徴選択に悩まされており、通常は正確な認識のための面倒なモデルである。
近年,創傷診断の強力なツールとしてディープラーニング(DL)が出現している。
DLは創傷型認識に有望であるように思われるが, モデルの有効性と精度を向上する範囲は大きい。
本研究では, 糖尿病, 血圧, 外科的, 静脈潰瘍などの複数のクラスに分類するために, 創傷画像とそれに対応する位置を用いて, DLをベースとしたマルチモーダル分類器を開発した。
位置データを提供するためにボディマップも作成され、傷の専門医が傷の場所をより効果的にラベル付けるのに役立つ。
このモデルは、入力画像から階層的特徴を抽出するビジョン変換器、低周波成分と高周波成分をキャプチャする離散ウェーブレット変換(DWT)層、空間的特徴を抽出するトランスフォーマを使用する。
ニューロン数と重みベクトル最適化は,3つのSwarmベースの最適化手法 (Monster Gorilla Toner (MGTO), Improved Gray Wolf Optimization (IGWO), Fox Optimization Algorithm) を用いて行った。
評価結果から,最適化アルゴリズムを用いた重みベクトル最適化により診断精度が向上し,創傷検出に極めて有効なアプローチであることが示唆された。
元のボディマップを用いた分類では,画像データを用いた精度が0.8123,画像データと創傷位置を組み合わせた精度が0.8007であった。
また、最適化モデルと組み合わせたモデルの精度は0.7801から0.8342に変化した。
関連論文リスト
- Efficient Brain Tumor Classification with Lightweight CNN Architecture: A Novel Approach [0.0]
MRI画像を用いた脳腫瘍の分類は、早期かつ正確な検出が患者の予後に大きな影響を及ぼす医療診断において重要である。
近年のディープラーニング(DL)の進歩は将来性を示しているが、多くのモデルは精度と計算効率のバランスに苦慮している。
本稿では,分離可能な畳み込みと圧縮・励振ブロック(SEブロック)を統合した新しいモデルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-02-01T21:06:42Z) - Enhancing Skin Cancer Diagnosis (SCD) Using Late Discrete Wavelet Transform (DWT) and New Swarm-Based Optimizers [0.0]
皮膚がんは最も致命的ながんの1つであり、診断を受けなければ危険が増幅され、迅速に治療される。
早期発見と皮膚がん診断(SCD)の強力なツールとしてディープラーニングが登場した
本稿では,事前に訓練されたネットワークとウェーブレット変換を併用した最適化手法を用いて,皮膚がん検出のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2024-11-30T13:17:52Z) - Brain Tumor Classification on MRI in Light of Molecular Markers [61.77272414423481]
1p/19q遺伝子の同時欠失は、低グレードグリオーマの臨床成績と関連している。
本研究の目的は,MRIを用いた畳み込みニューラルネットワークを脳がん検出に活用することである。
論文 参考訳(メタデータ) (2024-09-29T07:04:26Z) - Comparative Performance Analysis of Transformer-Based Pre-Trained Models for Detecting Keratoconus Disease [0.0]
本研究は、変性眼疾患である角膜症(keratoconus)の診断のために、訓練済みの8つのCNNを比較した。
MobileNetV2は角膜と正常な症例を誤分類の少ない場合に最も正確なモデルであった。
論文 参考訳(メタデータ) (2024-08-16T20:15:24Z) - Adapting Visual-Language Models for Generalizable Anomaly Detection in Medical Images [68.42215385041114]
本稿では,CLIPモデルを用いた医用異常検出のための軽量な多レベル適応と比較フレームワークを提案する。
提案手法では,複数の残像アダプタを事前学習した視覚エンコーダに統合し,視覚的特徴の段階的向上を実現する。
医学的異常検出ベンチマーク実験により,本手法が現在の最先端モデルを大幅に上回っていることが示された。
論文 参考訳(メタデータ) (2024-03-19T09:28:19Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - An Improved Deep Convolutional Neural Network by Using Hybrid
Optimization Algorithms to Detect and Classify Brain Tumor Using Augmented
MRI Images [0.9990687944474739]
本稿では,最適化アルゴリズムを改良することにより,深層畳み込み学習の改善を実現する。
提案手法の性能を2073個のMRI画像で検証する実験を行った。
性能比較では、DCNN-G-HHOは既存の手法よりもはるかに成功しており、特にスコアの精度は97%である。
論文 参考訳(メタデータ) (2022-06-08T14:29:06Z) - Vision Transformers for femur fracture classification [59.99241204074268]
Vision Transformer (ViT) はテスト画像の83%を正確に予測することができた。
史上最大かつ最もリッチなデータセットを持つサブフラクチャーで良い結果が得られた。
論文 参考訳(メタデータ) (2021-08-07T10:12:42Z) - Multiclass Burn Wound Image Classification Using Deep Convolutional
Neural Networks [0.0]
創傷専門家が管理プロトコルのより正確な診断と最適化を可能にするためには、継続的な創傷監視が重要です。
本研究では, 深層学習による傷傷画像の分類を, 傷の状況に応じて2、3つのカテゴリに分類する。
論文 参考訳(メタデータ) (2021-03-01T23:54:18Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Classification of COVID-19 in CT Scans using Multi-Source Transfer
Learning [91.3755431537592]
我々は,従来のトランスファー学習の改良にマルチソース・トランスファー・ラーニングを応用して,CTスキャンによる新型コロナウイルスの分類を提案する。
マルチソースファインチューニングアプローチでは、ImageNetで微調整されたベースラインモデルよりも優れています。
我々の最高のパフォーマンスモデルは、0.893の精度と0.897のリコールスコアを達成でき、ベースラインのリコールスコアを9.3%上回った。
論文 参考訳(メタデータ) (2020-09-22T11:53:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。