論文の概要: Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images
- arxiv url: http://arxiv.org/abs/2402.13475v1
- Date: Wed, 21 Feb 2024 02:16:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 17:19:12.545543
- Title: Multi-scale Spatio-temporal Transformer-based Imbalanced Longitudinal
Learning for Glaucoma Forecasting from Irregular Time Series Images
- Title(参考訳): 不規則時系列画像からの緑内障予知のためのマルチスケール時空間変圧器による非定常学習
- Authors: Xikai Yang, Jian Wu, Xi Wang, Yuchen Yuan, Ning Li Wang, Pheng-Ann
Heng
- Abstract要約: 緑内障は、進行性視神経線維損傷と不可逆性失明を引き起こす主要な眼疾患の1つである。
逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を提案する。
本手法は, 軽度認知障害とアルツハイマー病の予測に90.3%の精度で, アルツハイマー病神経画像イニシアチブ(ADNI)MRIデータセットに優れた一般化能力を示す。
- 参考スコア(独自算出の注目度): 45.894671834869975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glaucoma is one of the major eye diseases that leads to progressive optic
nerve fiber damage and irreversible blindness, afflicting millions of
individuals. Glaucoma forecast is a good solution to early screening and
intervention of potential patients, which is helpful to prevent further
deterioration of the disease. It leverages a series of historical fundus images
of an eye and forecasts the likelihood of glaucoma occurrence in the future.
However, the irregular sampling nature and the imbalanced class distribution
are two challenges in the development of disease forecasting approaches. To
this end, we introduce the Multi-scale Spatio-temporal Transformer Network
(MST-former) based on the transformer architecture tailored for sequential
image inputs, which can effectively learn representative semantic information
from sequential images on both temporal and spatial dimensions. Specifically,
we employ a multi-scale structure to extract features at various resolutions,
which can largely exploit rich spatial information encoded in each image.
Besides, we design a time distance matrix to scale time attention in a
non-linear manner, which could effectively deal with the irregularly sampled
data. Furthermore, we introduce a temperature-controlled Balanced Softmax
Cross-entropy loss to address the class imbalance issue. Extensive experiments
on the Sequential fundus Images for Glaucoma Forecast (SIGF) dataset
demonstrate the superiority of the proposed MST-former method, achieving an AUC
of 98.6% for glaucoma forecasting. Besides, our method shows excellent
generalization capability on the Alzheimer's Disease Neuroimaging Initiative
(ADNI) MRI dataset, with an accuracy of 90.3% for mild cognitive impairment and
Alzheimer's disease prediction, outperforming the compared method by a large
margin.
- Abstract(参考訳): 緑内障は、進行性視神経線維損傷と不可逆性視覚障害を引き起こす主要な眼疾患の1つである。
緑内障の予知は、潜在的な患者の早期スクリーニングと介入に良い解決策であり、疾患のさらなる悪化を防ぐのに有用である。
眼の一連の歴史的基礎画像を活用し、将来の緑内障発生の可能性を予測している。
しかし,不規則なサンプリング特性と不均衡なクラス分布は,疾患予測手法の開発における2つの課題である。
この目的のために,逐次画像入力に適した変換器アーキテクチャに基づくマルチスケール時空間変換器ネットワーク(MST-former)を導入し,時間次元と空間次元の両方で逐次画像から代表的意味情報を効果的に学習する。
具体的には,多次元構造を用いて様々な解像度の特徴を抽出し,各画像にエンコードされたリッチな空間情報を活用する。
さらに,不規則にサンプリングされたデータを効果的に処理できる非線形な方法で時間注意をスケールするために,時間距離行列を設計する。
さらに, クラス不均衡問題に対処するために, 温度制御型ソフトマックスクロスエントロピー損失を導入する。
緑内障予測のためのシークエンシャル・ファンドス画像(SIGF)データセットの大規模な実験は、提案したMST-former法の優位性を実証し、緑内障予測のAUCが98.6%に達した。
また,アルツハイマー病の神経画像化イニシアチブ(adni)mriデータセットにおいて優れた一般化能を示し,軽度認知障害とアルツハイマー病予測の精度は90.3%であり,比較法を大差で上回った。
関連論文リスト
- AnomalyDiffusion: Few-Shot Anomaly Image Generation with Diffusion Model [59.08735812631131]
製造業において異常検査が重要な役割を担っている。
既存の異常検査手法は、異常データが不足しているため、その性能に制限がある。
本稿では,新しい拡散型マイクロショット異常生成モデルであるAnomalyDiffusionを提案する。
論文 参考訳(メタデータ) (2023-12-10T05:13:40Z) - InceptionCaps: A Performant Glaucoma Classification Model for
Data-scarce Environment [0.0]
緑内障は不可逆的な眼疾患で 世界第2位の視覚障害の原因です
本稿では,InceptionV3を畳み込みベースとしたカプセルネットワーク(CapsNet)をベースとした新しいディープラーニングモデルであるInceptionCapsを提案する。
InceptionCapsは0.956、特異性0.96、AUC0.9556を達成し、RIM-ONE v2データセット上での最先端のディープラーニングモデルのパフォーマンスを上回った。
論文 参考訳(メタデータ) (2023-11-24T11:58:11Z) - Diagnosing Alzheimer's Disease using Early-Late Multimodal Data Fusion
with Jacobian Maps [1.5501208213584152]
アルツハイマー病(英語: Alzheimer's disease、AD)は、老化に影響を及ぼす神経変性疾患である。
本稿では,自動特徴抽出とランダム森林のための畳み込みニューラルネットワークを利用する,効率的な早期融合(ELF)手法を提案する。
脳の容積の微妙な変化を検出するという課題に対処するために、画像をヤコビ領域(JD)に変換する。
論文 参考訳(メタデータ) (2023-10-25T19:02:57Z) - Automatic diagnosis of knee osteoarthritis severity using Swin
transformer [55.01037422579516]
変形性膝関節症 (KOA) は膝関節の慢性的な痛みと硬直を引き起こす疾患である。
我々は,Swin Transformer を用いて KOA の重大度を予測する自動手法を提案する。
論文 参考訳(メタデータ) (2023-07-10T09:49:30Z) - HGIB: Prognosis for Alzheimer's Disease via Hypergraph Information
Bottleneck [3.8988556182958005]
情報ボトルネック戦略(HGIB)に基づく新しいハイパーグラフフレームワークを提案する。
本フレームワークは,無関係な情報を識別することを目的としており,今後のMCI変換予測のための関連情報の調和にのみ焦点をあてている。
我々は、ADNIに関する広範な実験を通じて、提案したHGIBフレームワークが、アルツハイマー病予後のための既存の最先端ハイパーグラフニューラルネットワークより優れていることを実証した。
論文 参考訳(メタデータ) (2023-03-18T10:53:43Z) - RADNet: Ensemble Model for Robust Glaucoma Classification in Color
Fundus Images [0.0]
緑内障は最も重篤な眼疾患の1つで、急激な進行と不可逆性失明を特徴とする。
集団の正常な緑内障検診では早期発見が改善するが,病原性チェックアップの望ましい頻度は期待できないことが多い。
本研究では,高度な画像前処理手法と深層分類ネットワークのアンサンブルを併用した画像前処理手法を提案する。
論文 参考訳(メタデータ) (2022-05-25T16:48:00Z) - Temporal Context Matters: Enhancing Single Image Prediction with Disease
Progression Representations [8.396615243014768]
本稿では,時間経過情報を活用した深層学習手法を提案する。
本手法では, 自己注意に基づく時間的畳み込みネットワーク(TCN)を用いて, 疾患の軌跡を最も反映した表現を学習する。
ビジョン変換器は、単点画像から特徴を抽出するために、自己教師型で事前訓練される。
論文 参考訳(メタデータ) (2022-03-02T22:11:07Z) - Unsupervised deep learning techniques for powdery mildew recognition
based on multispectral imaging [63.62764375279861]
本稿では,キュウリ葉の粉状ミドウを自動的に認識する深層学習手法を提案する。
マルチスペクトルイメージングデータに適用した教師なし深層学習技術に焦点をあてる。
本稿では, オートエンコーダアーキテクチャを用いて, 疾患検出のための2つの手法を提案する。
論文 参考訳(メタデータ) (2021-12-20T13:29:13Z) - Assessing glaucoma in retinal fundus photographs using Deep Feature
Consistent Variational Autoencoders [63.391402501241195]
緑内障は症状が重くなるまで無症状のままでいるため、検出が困難である。
緑内障の早期診断は機能的,構造的,臨床的評価に基づいて行われることが多い。
ディープラーニング手法はこのジレンマを、マーカー識別段階をバイパスし、ハイレベルな情報を分析してデータを分類することで部分的に解決している。
論文 参考訳(メタデータ) (2021-10-04T16:06:49Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。