論文の概要: Cross-Field Transformer for Diabetic Retinopathy Grading on Two-feld
Fundus Images
- arxiv url: http://arxiv.org/abs/2211.14552v1
- Date: Sat, 26 Nov 2022 12:39:57 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-29 18:15:41.267268
- Title: Cross-Field Transformer for Diabetic Retinopathy Grading on Two-feld
Fundus Images
- Title(参考訳): Two-feld Fundus 画像を用いた糖尿病網膜症用クロスフィールドトランス
- Authors: Junlin Hou, Jilan Xu, Fan Xiao, Rui-Wei Zhao, Yuejie Zhang, Haidong
Zou, Lina Lu, Wenwen Xue, Rui Feng
- Abstract要約: まず,DRグレーディングのための新しいベンチマークデータセット(DRTiD)を構築した。
そこで本研究では,CrossFiT (CrossFiT) と呼ばれる新しいDRグレーディング手法を提案する。
- 参考スコア(独自算出の注目度): 9.211425049275798
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic diabetic retinopathy (DR) grading based on fundus photography has
been widely explored to benefit the routine screening and early treatment.
Existing researches generally focus on single-feld fundus images, which have
limited field of view for precise eye examinations. In clinical applications,
ophthalmologists adopt two-feld fundus photography as the dominating tool,
where the information from each feld (i.e.,macula-centric and optic
disc-centric) is highly correlated and complementary, and benefits
comprehensive decisions. However, automatic DR grading based on two-feld fundus
photography remains a challenging task due to the lack of publicly available
datasets and effective fusion strategies. In this work, we first construct a
new benchmark dataset (DRTiD) for DR grading, consisting of 3,100 two-feld
fundus images. To the best of our knowledge, it is the largest public DR
dataset with diverse and high-quality two-feld images. Then, we propose a novel
DR grading approach, namely Cross-Field Transformer (CrossFiT), to capture the
correspondence between two felds as well as the long-range spatial correlations
within each feld. Considering the inherent two-feld geometric constraints, we
particularly define aligned position embeddings to preserve relative consistent
position in fundus. Besides, we perform masked cross-field attention during
interaction to flter the noisy relations between fields. Extensive experiments
on our DRTiD dataset and a public DeepDRiD dataset demonstrate the
effectiveness of our CrossFiT network. The new dataset and the source code of
CrossFiT will be publicly available at https://github.com/FDU-VTS/DRTiD.
- Abstract(参考訳): 基礎写真に基づく自動糖尿病網膜症 (DR) グレーディングは, 定期スクリーニングと早期治療のために広く研究されている。
既存の研究は、眼科検査の視野が限られている単眼眼底像に焦点を当てている。
臨床応用において、眼科医は二つの眼底撮影を支配ツールとして採用し、各眼窩からの情報(macula-centric and optic disc-centric)は高い相関性と相補的であり、総合的な決定の恩恵を受ける。
しかし、公開データセットと効果的な融合戦略が欠如しているため、2フェルド写真に基づく自動drグレーティングは依然として困難な課題である。
本研究では,まず,3,100枚の2フェルド眼底画像からなるdrグレーディングのための新しいベンチマークデータセット(drtid)を構築した。
我々の知る限りでは、多彩で高品質な2フェルト画像を持つ、最大のパブリックDRデータセットである。
そこで我々は,2つのフェルト間の対応と,各フェルト内の長距離空間相関を捉えるために,クロスフィールド変換器(CrossFiT)という新しいDRグレーディング手法を提案する。
内在する2次元の幾何学的制約を考えると、特に基底における相対的一貫した位置を保つために整列位置埋め込みを定義する。
また,相互作用の際,フィールド間のノイズ関係を弱めるために,マスク付きクロスフィールドアテンションを行う。
DRTiDデータセットとパブリックなDeepDRiDデータセットに関する大規模な実験は、私たちのCrossFiTネットワークの有効性を示しています。
新しいデータセットとCrossFiTのソースコードはhttps://github.com/FDU-VTS/DRTiDで公開される。
関連論文リスト
- Cross-Fundus Transformer for Multi-modal Diabetic Retinopathy Grading with Cataract [17.77175890577782]
糖尿病網膜症(英: Diabetic retinopathy, DR)は、世界の視覚障害の主要な原因であり、糖尿病の合併症である。
本研究では,カラーファンドス写真(IFP)と赤外線ファンドス写真(IFP)の情報をより正確なDRグレーディングに融合する,新しい多モード深層学習フレームワークを提案する。
論文 参考訳(メタデータ) (2024-11-01T16:38:49Z) - Eye-gaze Guided Multi-modal Alignment for Medical Representation Learning [65.54680361074882]
アイゲイズガイドマルチモーダルアライメント(EGMA)フレームワークは、アイゲイズデータを利用して、医用視覚的特徴とテキスト的特徴のアライメントを改善する。
我々は4つの医療データセット上で画像分類と画像テキスト検索の下流タスクを行う。
論文 参考訳(メタデータ) (2024-03-19T03:59:14Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Leveraging Multimodal Fusion for Enhanced Diagnosis of Multiple Retinal
Diseases in Ultra-wide OCTA [4.741967726600469]
我々は、最初のマルチモーダル、マルチディスリーズ、そして最も広い視野のUW-OCTAデータセットである、先駆的なM3 OCTAデータセットをキュレートした。
複数の疾患の診断にマルチモーダル情報を活用する初めてのクロスモーダル融合フレームワークを提案する。
M3 OCTAデータセットの構築は、眼科画像分析コミュニティにおける研究を進めることを目的としている。
論文 参考訳(メタデータ) (2023-11-17T05:23:57Z) - Source-free Active Domain Adaptation for Diabetic Retinopathy Grading
Based on Ultra-wide-field Fundus Image [4.679304803181914]
領域適応 (DA) は糖尿病性網膜症 (DR) に広く応用されている。
本稿では、DRグレーディング問題自体に取り組むために、新しいソースフリーアクティブドメイン適応(SFADA)を提案する。
提案したSFADAは最先端のDRグレーディング性能を実現し,精度を20.9%向上し,2次加重カッパを18.63%向上させた。
論文 参考訳(メタデータ) (2023-09-19T13:52:06Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - Multimodal Information Fusion for Glaucoma and DR Classification [1.5616442980374279]
複数の情報源からの情報を組み合わせることで、臨床医はより正確な判断をすることができる。
本稿では,網膜解析の課題を解決するために,ディープラーニングに基づく3つのマルチモーダル情報融合戦略について検討する。
論文 参考訳(メタデータ) (2022-09-02T12:19:03Z) - AlignTransformer: Hierarchical Alignment of Visual Regions and Disease
Tags for Medical Report Generation [50.21065317817769]
本稿では,Align Hierarchical Attention (AHA)とMulti-Grained Transformer (MGT)モジュールを含むAlign Transformerフレームワークを提案する。
パブリックなIU-XrayとMIMIC-CXRデータセットの実験は、AlignTransformerが2つのデータセットの最先端メソッドと競合する結果が得られることを示している。
論文 参考訳(メタデータ) (2022-03-18T13:43:53Z) - DRDrV3: Complete Lesion Detection in Fundus Images Using Mask R-CNN,
Transfer Learning, and LSTM [2.9360071145551068]
糖尿病網膜症(DR)による病変の検出・発見に最適な2つのサブモジュールからなる新しい病変検出アーキテクチャを提案する。
また、2つの一般的な評価基準を用いて、平均平均精度(mAP)とIOU(IOU)の交点であるモデルの出力を評価する。
この新たなソリューションにより、専門家は高い信頼性で病変を検出し、高い精度で損傷の重症度を推定できるという仮説を立てる。
論文 参考訳(メタデータ) (2021-08-18T11:36:37Z) - FetReg: Placental Vessel Segmentation and Registration in Fetoscopy
Challenge Dataset [57.30136148318641]
Fetoscopy Laser Photocoagulation はツイン・ツー・ツイン・トランスフュージョン症候群(TTTS)の治療に広く用いられている治療法である
これにより、プロシージャ時間と不完全アブレーションが増加し、持続的なTTTSが生じる可能性がある。
コンピュータ支援による介入は、ビデオモザイクによって胎児の視野を広げ、船体ネットワークのより良い視覚化を提供することによって、これらの課題を克服するのに役立つかもしれない。
本稿では,長期フェトスコープビデオからドリフトフリーモザイクを作成することを目的とした,胎児環境のための汎用的でロバストなセマンティックセマンティックセグメンテーションとビデオモザイクアルゴリズムを開発するための大規模マルチセントデータセットを提案する。
論文 参考訳(メタデータ) (2021-06-10T17:14:27Z) - Fader Networks for domain adaptation on fMRI: ABIDE-II study [68.5481471934606]
我々は3次元畳み込みオートエンコーダを用いて、無関係な空間画像表現を実現するとともに、ABIDEデータ上で既存のアプローチより優れていることを示す。
論文 参考訳(メタデータ) (2020-10-14T16:50:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。