論文の概要: A Hybrid Framework Bridging CNN and ViT based on Theory of Evidence for Diabetic Retinopathy Grading
- arxiv url: http://arxiv.org/abs/2510.26315v1
- Date: Thu, 30 Oct 2025 10:08:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.749643
- Title: A Hybrid Framework Bridging CNN and ViT based on Theory of Evidence for Diabetic Retinopathy Grading
- Title(参考訳): 糖尿病網膜症グレーディングのエビデンス理論に基づくCNNとViTのハイブリッドフレームワーク
- Authors: Junlai Qiu, Yunzhu Chen, Hao Zheng, Yawen Huang, Yuexiang Li,
- Abstract要約: 糖尿病網膜症(DR)は中高年者における視覚障害の主要な原因である。
畳み込みニューラルネットワーク(CNN)や視覚変換器(ViT)をベースとした様々な自動DR診断システムが最近確立されている。
- 参考スコア(独自算出の注目度): 31.032002367721947
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Diabetic retinopathy (DR) is a leading cause of vision loss among middle-aged and elderly people, which significantly impacts their daily lives and mental health. To improve the efficiency of clinical screening and enable the early detection of DR, a variety of automated DR diagnosis systems have been recently established based on convolutional neural network (CNN) or vision Transformer (ViT). However, due to the own shortages of CNN / ViT, the performance of existing methods using single-type backbone has reached a bottleneck. One potential way for the further improvements is integrating different kinds of backbones, which can fully leverage the respective strengths of them (\emph{i.e.,} the local feature extraction capability of CNN and the global feature capturing ability of ViT). To this end, we propose a novel paradigm to effectively fuse the features extracted by different backbones based on the theory of evidence. Specifically, the proposed evidential fusion paradigm transforms the features from different backbones into supporting evidences via a set of deep evidential networks. With the supporting evidences, the aggregated opinion can be accordingly formed, which can be used to adaptively tune the fusion pattern between different backbones and accordingly boost the performance of our hybrid model. We evaluated our method on two publicly available DR grading datasets. The experimental results demonstrate that our hybrid model not only improves the accuracy of DR grading, compared to the state-of-the-art frameworks, but also provides the excellent interpretability for feature fusion and decision-making.
- Abstract(参考訳): 糖尿病網膜症(DR)は、中高年者や高齢者の視力喪失の主要な原因であり、日常生活や精神健康に大きな影響を及ぼす。
臨床スクリーニングの効率を向上し、DRの早期検出を可能にするため、近年、畳み込みニューラルネットワーク(CNN)や視覚変換器(ViT)に基づく様々な自動DR診断システムが確立されている。
しかし、CNN/ViTが不足しているため、シングルタイプのバックボーンを使用した既存のメソッドのパフォーマンスはボトルネックに達している。
さらなる改善の1つの可能性として、異なる種類のバックボーンを統合することで、それぞれの強度をフル活用することができる(つまり、CNNの局所的特徴抽出能力とViTのグローバルな特徴捕捉能力)。
そこで本研究では,証拠理論に基づいて,異なるバックボーンから抽出した特徴を効果的に融合する新しいパラダイムを提案する。
具体的には、提案した顕在的融合パラダイムは、異なるバックボーンから深い顕在的ネットワークを通じて、その特徴を裏付けるエビデンスへと変換する。
支持された証拠により、集約された意見は、異なるバックボーン間の融合パターンを適応的に調整し、それによってハイブリッドモデルの性能を高めることができる。
本手法を2つの公開DRグレーティングデータセットで評価した。
実験の結果,我々のハイブリッドモデルは,最新のフレームワークと比較してDRグレーティングの精度を向上するだけでなく,特徴融合や意思決定に優れた解釈性を提供することが示された。
関連論文リスト
- AdvBlur: Adversarial Blur for Robust Diabetic Retinopathy Classification and Cross-Domain Generalization [0.0]
糖尿病網膜症(DR)は、世界中の視覚障害の主要な原因である。
基礎画像からDRを予測するためのディープラーニング(DL)モデルが開発されている。
取得装置の違い、人口格差、画像条件の違いによる分布変動によるロバスト性維持における多くの課題に直面している。
本稿では,AdvBlurと呼ばれる新しいDR分類手法を提案する。
論文 参考訳(メタデータ) (2025-10-28T02:10:54Z) - DGSSA: Domain generalization with structural and stylistic augmentation for retinal vessel segmentation [17.396365010722423]
網膜血管形態は糖尿病、緑内障、高血圧などの疾患の診断に重要である。
従来のセグメンテーション手法は、トレーニングとテストのデータが同様の分布を共有していると仮定する。
本稿では,網膜血管画像分割のための新しいアプローチ DGSSA を提案する。
論文 参考訳(メタデータ) (2025-01-07T01:47:57Z) - Generalizing to Unseen Domains in Diabetic Retinopathy Classification [8.59772105902647]
糖尿病網膜症分類における分布や領域の特定にモデルを一般化する問題について検討した。
本稿では、視覚変換器の自己蒸留を実現するための、シンプルで効果的な領域一般化(DG)手法を提案する。
本稿では,オープンソースのDR分類データセット上での最先端DG手法の性能について報告する。
論文 参考訳(メタデータ) (2023-10-26T09:11:55Z) - Brain Imaging-to-Graph Generation using Adversarial Hierarchical Diffusion Models for MCI Causality Analysis [44.45598796591008]
機能的磁気共鳴画像(fMRI)を軽度認知障害解析のための効果的な接続性にマッピングするために,脳画像から画像へのBIGG(Brain Imaging-to-graph generation)フレームワークを提案する。
発電機の階層変換器は、複数のスケールでノイズを推定するように設計されている。
ADNIデータセットの評価は,提案モデルの有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-18T06:54:56Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - A Robust Backpropagation-Free Framework for Images [47.97322346441165]
画像データに対するエラーカーネル駆動型アクティベーションアライメントアルゴリズムを提案する。
EKDAAは、ローカルに派生したエラー送信カーネルとエラーマップを導入することで達成される。
結果は、識別不能なアクティベーション機能を利用するEKDAAトレーニングCNNに対して提示される。
論文 参考訳(メタデータ) (2022-06-03T21:14:10Z) - Retinopathy of Prematurity Stage Diagnosis Using Object Segmentation and
Convolutional Neural Networks [68.96150598294072]
未熟児網膜症(英: Retinopathy of Prematurity、ROP)は、主に体重の低い未熟児に影響を及ぼす眼疾患である。
網膜の血管の増殖を招き、視力喪失を招き、最終的には網膜剥離を招き、失明を引き起こす。
近年,ディープラーニングを用いて診断を自動化する試みが盛んに行われている。
本稿では,従来のモデルの成功を基盤として,オブジェクトセグメンテーションと畳み込みニューラルネットワーク(CNN)を組み合わせた新しいアーキテクチャを開発する。
提案システムでは,まず対象分割モデルを訓練し,画素レベルでの区切り線を識別し,その結果のマスクを追加の"カラー"チャネルとして付加する。
論文 参考訳(メタデータ) (2020-04-03T14:07:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。