論文の概要: Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images
- arxiv url: http://arxiv.org/abs/2402.13475v1
- Date: Wed, 21 Feb 2024 02:16:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 17:19:12.545543
- Title: Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images
- Title(参考訳): 不規則時系列画像からの緑内障予知のためのマルチスケール時空間変圧器による非定常学習
- Authors: Xikai Yang, Jian Wu, Xi Wang, Yuchen Yuan, Ning Li Wang, Pheng-Ann
Heng
- Abstract要約: 緑内障は、進行性視神経線維損傷と不可逆性失明を引き起こす主要な眼疾患の1つである。
逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を提案する。
本手法は, 軽度認知障害とアルツハイマー病の予測に90.3%の精度で, アルツハイマー病神経画像イニシアチブ(ADNI)MRIデータセットに優れた一般化能力を示す。
- 参考スコア(独自算出の注目度): 45.894671834869975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glaucoma is one of the major eye diseases that leads to progressive optic
nerve fiber damage and irreversible blindness, afflicting millions of
individuals. Glaucoma forecast is a good solution to early screening and
intervention of potential patients, which is helpful to prevent further
deterioration of the disease. It leverages a series of historical fundus images
of an eye and forecasts the likelihood of glaucoma occurrence in the future.
However, the irregular sampling nature and the imbalanced class distribution
are two challenges in the development of disease forecasting approaches. To
this end, we introduce the Multi-scale Spatio-temporal Transformer Network
(MST-former) based on the transformer architecture tailored for sequential
image inputs, which can effectively learn representative semantic information
from sequential images on both temporal and spatial dimensions. Specifically,
we employ a multi-scale structure to extract features at various resolutions,
which can largely exploit rich spatial information encoded in each image.
Besides, we design a time distance matrix to scale time attention in a
non-linear manner, which could effectively deal with the irregularly sampled
data. Furthermore, we introduce a temperature-controlled Balanced Softmax
Cross-entropy loss to address the class imbalance issue. Extensive experiments
on the Sequential fundus Images for Glaucoma Forecast (SIGF) dataset
demonstrate the superiority of the proposed MST-former method, achieving an AUC
of 98.6% for glaucoma forecasting. Besides, our method shows excellent
generalization capability on the Alzheimer's Disease Neuroimaging Initiative
(ADNI) MRI dataset, with an accuracy of 90.3% for mild cognitive impairment and
Alzheimer's disease prediction, outperforming the compared method by a large
margin.
- Abstract(参考訳): 緑内障は、進行性視神経線維損傷と不可逆性視覚障害を引き起こす主要な眼疾患の1つである。
緑内障の予知は、潜在的な患者の早期スクリーニングと介入に良い解決策であり、疾患のさらなる悪化を防ぐのに有用である。
眼の一連の歴史的基礎画像を活用し、将来の緑内障発生の可能性を予測している。
しかし,不規則なサンプリング特性と不均衡なクラス分布は,疾患予測手法の開発における2つの課題である。
この目的のために,逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を導入し,時間次元と空間次元の両方で逐次画像から代表的意味情報を効果的に学習する。
具体的には,多次元構造を用いて様々な解像度の特徴を抽出し,各画像にエンコードされたリッチな空間情報を活用する。
さらに,不規則にサンプリングされたデータを効果的に処理できる非線形な方法で時間注意をスケールするために,時間距離行列を設計する。
さらに, クラス不均衡問題に対処するために, 温度制御型ソフトマックスクロスエントロピー損失を導入する。
緑内障予測のためのシークエンシャル・ファンドス画像(SIGF)データセットの大規模な実験は、提案したMST-former法の優位性を実証し、緑内障予測のAUCが98.6%に達した。
また,アルツハイマー病の神経画像化イニシアチブ(adni)mriデータセットにおいて優れた一般化能を示し,軽度認知障害とアルツハイマー病予測の精度は90.3%であり,比較法を大差で上回った。
関連論文リスト
- Unscrambling disease progression at scale: fast inference of event permutations with optimal transport [2.9087305408570945]
疾患進行モデルでは、慢性変性状態として、患者の特徴の変化の群レベルの時間的軌跡を推定する。
本研究では,Birkhoff polytopeに属する事象の潜在置換行列として,最適な輸送からモデル疾患進行へのアイデアを活用する。
実験は、シミュレーションにおけるノイズに対する速度、精度、堅牢性の増加を実証する。
論文 参考訳(メタデータ) (2024-10-18T11:44:29Z) - Deep Learning to Predict Glaucoma Progression using Structural Changes in the Eye [0.20718016474717196]
緑内障は視神経症を特徴とする慢性眼疾患であり、不可逆的な視力喪失を引き起こす。
早期発見は萎縮をモニターし、さらなる視力障害を防ぐ治療戦略を開発するために重要である。
本研究では,深層学習モデルを用いて,複雑な疾患の特徴と進行基準を同定する。
論文 参考訳(メタデータ) (2024-06-09T01:12:41Z) - Harnessing the power of longitudinal medical imaging for eye disease prognosis using Transformer-based sequence modeling [49.52787013516891]
今回提案した Longitudinal Transformer for Survival Analysis (LTSA, Longitudinal Transformer for Survival Analysis, LTSA) は, 縦断的医用画像から動的疾患の予後を予測できる。
時間的注意分析により、最新の画像は典型的には最も影響力のあるものであるが、以前の画像は追加の予後に価値があることが示唆された。
論文 参考訳(メタデータ) (2024-05-14T17:15:28Z) - AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - Diagnosing Alzheimer's Disease using Early-Late Multimodal Data Fusion
with Jacobian Maps [1.5501208213584152]
アルツハイマー病(英語: Alzheimer's disease、AD)は、老化に影響を及ぼす神経変性疾患である。
本稿では,自動特徴抽出とランダム森林のための畳み込みニューラルネットワークを利用する,効率的な早期融合(ELF)手法を提案する。
脳の容積の微妙な変化を検出するという課題に対処するために、画像をヤコビ領域(JD)に変換する。
論文 参考訳(メタデータ) (2023-10-25T19:02:57Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - RADNet: Ensemble Model for Robust Glaucoma Classification in Color
Fundus Images [0.0]
緑内障は最も重篤な眼疾患の1つで、急激な進行と不可逆性失明を特徴とする。
集団の正常な緑内障検診では早期発見が改善するが,病原性チェックアップの望ましい頻度は期待できないことが多い。
本研究では,高度な画像前処理手法と深層分類ネットワークのアンサンブルを併用した画像前処理手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T16:48:00Z) - Temporal Context Matters: Enhancing Single Image Prediction with Disease
Progression Representations [8.396615243014768]
本稿では,時間経過情報を活用した深層学習手法を提案する。
本手法では, 自己注意に基づく時間的畳み込みネットワーク(TCN)を用いて, 疾患の軌跡を最も反映した表現を学習する。
ビジョン変換器は、単点画像から特徴を抽出するために、自己教師型で事前訓練される。
論文 参考訳(メタデータ) (2022-03-02T22:11:07Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。