論文の概要: Decentralized LoRA Augmented Transformer with Context-aware Multi-scale Feature Learning for Secured Eye Diagnosis
- arxiv url: http://arxiv.org/abs/2505.06982v2
- Date: Mon, 28 Jul 2025 05:12:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 14:15:46.351124
- Title: Decentralized LoRA Augmented Transformer with Context-aware Multi-scale Feature Learning for Secured Eye Diagnosis
- Title(参考訳): セキュア眼科診断のためのコンテキスト認識型マルチスケール特徴学習機能付き分散LoRA拡張変圧器
- Authors: Md. Naimur Asif Borno, Md Sakib Hossain Shovon, MD Hanif Sikder, Iffat Firozy Rimi, Tahani Jaser Alahmadi, Mohammad Ali Moni,
- Abstract要約: 本稿では、コンテキスト認識型マルチスケールパッチ埋め込み、ローランド適応(LoRA)、知識蒸留、フェデレーション学習を統合し、これらの課題に統一的に対処する新しいデータ効率画像変換器(DeiT)ベースのフレームワークを提案する。
提案モデルでは,マルチスケールパッチ表現と局所的および大域的注意機構を活用することで,局所的および大域的網膜特徴を効果的に捉えている。
- 参考スコア(独自算出の注目度): 2.1358421658740214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate and privacy-preserving diagnosis of ophthalmic diseases remains a critical challenge in medical imaging, particularly given the limitations of existing deep learning models in handling data imbalance, data privacy concerns, spatial feature diversity, and clinical interpretability. This paper proposes a novel Data efficient Image Transformer (DeiT) based framework that integrates context aware multiscale patch embedding, Low-Rank Adaptation (LoRA), knowledge distillation, and federated learning to address these challenges in a unified manner. The proposed model effectively captures both local and global retinal features by leveraging multi scale patch representations with local and global attention mechanisms. LoRA integration enhances computational efficiency by reducing the number of trainable parameters, while federated learning ensures secure, decentralized training without compromising data privacy. A knowledge distillation strategy further improves generalization in data scarce settings. Comprehensive evaluations on two benchmark datasets OCTDL and the Eye Disease Image Dataset demonstrate that the proposed framework consistently outperforms both traditional CNNs and state of the art transformer architectures across key metrics including AUC, F1 score, and precision. Furthermore, Grad-CAM++ visualizations provide interpretable insights into model predictions, supporting clinical trust. This work establishes a strong foundation for scalable, secure, and explainable AI applications in ophthalmic diagnostics.
- Abstract(参考訳): データ不均衡、データプライバシの懸念、空間的特徴の多様性、臨床解釈可能性に関する既存のディープラーニングモデルの限界を考えると、眼科疾患の正確かつプライバシー保護的な診断は医療画像において依然として重要な課題である。
本稿では、コンテキスト認識型マルチスケールパッチ埋め込み、ローランド適応(LoRA)、知識蒸留、フェデレーション学習を統合し、これらの課題に統一的に対処する新しいデータ効率画像変換器(DeiT)ベースのフレームワークを提案する。
提案モデルでは,マルチスケールパッチ表現と局所的および大域的注意機構を活用することで,局所的および大域的網膜特徴を効果的に捉えている。
LoRA統合はトレーニング可能なパラメータの数を減らし、計算効率を向上させる一方、フェデレーション学習はデータのプライバシを損なうことなく、セキュアで分散化されたトレーニングを保証する。
知識蒸留戦略は、データ不足設定の一般化をさらに改善する。
OCTDLとEye Disease Image Datasetの2つのベンチマークデータセットに関する包括的な評価は、提案されたフレームワークが、AUC、F1スコア、精度を含む主要な指標にわたって、従来のCNNと最先端のトランスフォーマーアーキテクチャの両方を一貫して上回っていることを示している。
さらに、Grad-CAM++視覚化は、モデル予測に対する解釈可能な洞察を提供し、臨床信頼をサポートする。
この研究は、眼科診断におけるスケーラブルでセキュアで説明可能なAIアプリケーションのための強力な基盤を確立する。
関連論文リスト
- Enhancing DR Classification with Swin Transformer and Shifted Window Attention [9.99302279736049]
糖尿病網膜症 (DR) は, 早期発見の重要性を浮き彫りにしている。
画像トリミング、コントラスト制限適応ヒストグラム等化(CLAHE)、およびモデル一般化とレジリエンスを改善するためのターゲットデータ拡張を組み込んだ頑健な前処理パイプラインを提案する。
我々は,多クラスDR分類のためのAptosデータセットとIDRiDデータセットを用いて,精度89.65%,精度97.40%を実現した。
論文 参考訳(メタデータ) (2025-04-20T13:23:20Z) - Revisiting Medical Image Retrieval via Knowledge Consolidation [46.6989555659494]
本稿では,階層的特徴と機能に関する知識を集約する新しい手法を提案する。
本稿では,Depth-aware Representation Fusion (DaRF)とStructure-aware Contrastive Hashing (SCH)を紹介する。
解剖学的放射線学データセットの平均精度は5.6~38.9%向上した。
論文 参考訳(メタデータ) (2025-03-12T13:16:42Z) - Advancing UWF-SLO Vessel Segmentation with Source-Free Active Domain Adaptation and a Novel Multi-Center Dataset [11.494899967255142]
UWF-SLO画像における正確な血管セグメンテーションは網膜疾患の診断に不可欠である。
高い解像度のUWF-SLO画像を手動でラベル付けすることは、非常に難しく、時間がかかり、高価な作業である。
本研究では、パッチベースのアクティブドメイン適応アプローチを活用する先駆的なフレームワークを紹介する。
論文 参考訳(メタデータ) (2024-06-19T15:49:06Z) - Distributed Federated Learning-Based Deep Learning Model for Privacy MRI Brain Tumor Detection [11.980634373191542]
分散トレーニングは、大規模な医用画像データセットの処理を容易にし、疾患診断の精度と効率を向上させる。
本稿では,データプライバシと効率的な疾患診断という2つの課題に対処するために,Federated Learning(FL)を活用した医用画像分類の革新的なアプローチを提案する。
論文 参考訳(メタデータ) (2024-04-15T09:07:19Z) - Enhancing and Adapting in the Clinic: Source-free Unsupervised Domain
Adaptation for Medical Image Enhancement [34.11633495477596]
ソースレス非教師なし領域適応医療画像強調法(SAME)を提案する。
構造化学習データからロバストなソースモデルを学習するために,まず構造保存強化ネットワークを構築した。
強化タスクの知識蒸留を促進するために擬似ラベルピッカーを開発した。
論文 参考訳(メタデータ) (2023-12-03T10:01:59Z) - Leveraging Semi-Supervised Graph Learning for Enhanced Diabetic
Retinopathy Detection [0.0]
糖尿病網膜症(DR: Diabetic Retinopathy)は、早期発見と治療の急激な必要性を浮き彫りにしている。
機械学習(ML)技術の最近の進歩は、DR検出における将来性を示しているが、ラベル付きデータの可用性は、しばしばパフォーマンスを制限している。
本研究では,DR検出に適したSemi-Supervised Graph Learning SSGLアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-02T04:42:08Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - USIM-DAL: Uncertainty-aware Statistical Image Modeling-based Dense
Active Learning for Super-resolution [47.38982697349244]
デンス回帰(Dense regression)は、画像の超解像、エンハンスメント、深さ推定などのタスクのためのコンピュータビジョンで広く使われているアプローチである。
この問題に対処するために,能動学習を高密度回帰モデルに組み込むことを提案する。
アクティブな学習により、モデルはラベル付けのための最も有益なサンプルを選択し、全体的なアノテーションコストを削減し、パフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2023-05-27T16:33:43Z) - Cross-Site Severity Assessment of COVID-19 from CT Images via Domain
Adaptation [64.59521853145368]
CT画像によるコロナウイルス病2019(COVID-19)の早期かつ正確な重症度評価は,集中治療単位のイベント推定に有効である。
ラベル付きデータを拡張し、分類モデルの一般化能力を向上させるためには、複数のサイトからデータを集約する必要がある。
この課題は、軽度の感染症と重度の感染症の集団不均衡、部位間のドメイン分布の相違、不均一な特徴の存在など、いくつかの課題に直面する。
論文 参考訳(メタデータ) (2021-09-08T07:56:51Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Multi-label Thoracic Disease Image Classification with Cross-Attention
Networks [65.37531731899837]
胸部X線画像から胸部疾患を自動分類するためのCAN(Cross-Attention Networks)を提案する。
また,クロスエントロピー損失を超える新たな損失関数を設計し,クラス間の不均衡を克服する。
論文 参考訳(メタデータ) (2020-07-21T14:37:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。