論文の概要: Revolutionizing Space Health (Swin-FSR): Advancing Super-Resolution of
Fundus Images for SANS Visual Assessment Technology
- arxiv url: http://arxiv.org/abs/2308.06332v1
- Date: Fri, 11 Aug 2023 18:17:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-15 18:03:25.262690
- Title: Revolutionizing Space Health (Swin-FSR): Advancing Super-Resolution of
Fundus Images for SANS Visual Assessment Technology
- Title(参考訳): revolutionizing space health (swin-fsr) : sans視覚評価技術のための眼底画像の超高解像度化
- Authors: Khondker Fariha Hossain, Sharif Amit Kamran, Joshua Ong, Andrew G.
Lee, Alireza Tavakkoli
- Abstract要約: 我々はSwin-FSRと呼ばれる新しいモデルを導入し、Swin Transformerの空間的および深度的な注意を基礎画像の超解像に適用する。
我々のアーキテクチャは3つの公開データセット上で47.89,49.00,45.32のピーク信号対雑音比(PSNR)を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The rapid accessibility of portable and affordable retinal imaging devices
has made early differential diagnosis easier. For example, color funduscopy
imaging is readily available in remote villages, which can help to identify
diseases like age-related macular degeneration (AMD), glaucoma, or pathological
myopia (PM). On the other hand, astronauts at the International Space Station
utilize this camera for identifying spaceflight-associated neuro-ocular
syndrome (SANS). However, due to the unavailability of experts in these
locations, the data has to be transferred to an urban healthcare facility (AMD
and glaucoma) or a terrestrial station (e.g, SANS) for more precise disease
identification. Moreover, due to low bandwidth limits, the imaging data has to
be compressed for transfer between these two places. Different super-resolution
algorithms have been proposed throughout the years to address this.
Furthermore, with the advent of deep learning, the field has advanced so much
that x2 and x4 compressed images can be decompressed to their original form
without losing spatial information. In this paper, we introduce a novel model
called Swin-FSR that utilizes Swin Transformer with spatial and depth-wise
attention for fundus image super-resolution. Our architecture achieves Peak
signal-to-noise-ratio (PSNR) of 47.89, 49.00 and 45.32 on three public
datasets, namely iChallenge-AMD, iChallenge-PM, and G1020. Additionally, we
tested the model's effectiveness on a privately held dataset for SANS provided
by NASA and achieved comparable results against previous architectures.
- Abstract(参考訳): ポータブルで安価な網膜イメージング装置の迅速なアクセシビリティにより、早期の鑑別診断が容易になった。
例えば、色眼底画像撮影は遠隔の村で容易に利用可能であり、年齢関連黄斑変性症(AMD)、緑内障、病理性近視症(PM)などの疾患の特定に役立つ。
一方、国際宇宙ステーションの宇宙飛行士はこのカメラを使って、宇宙飛行に関連する神経眼症候群(SANS)を特定する。
しかし、これらの場所の専門家が利用できないため、より正確な疾患の特定のために、データは都市医療施設(AMDと緑内障)や地上局(SANS)に転送されなければならない。
また、帯域幅の制限が小さいため、画像データを圧縮して2箇所間の転送を行う必要がある。
これに対処するために、長年にわたり様々な超解像アルゴリズムが提案されてきた。
さらに,深層学習の出現に伴い,x2 および x4 圧縮画像は空間情報を失うことなく元の形式に圧縮することができるようになった。
本稿では,swinトランスフォーマを用いたswin-fsrと呼ばれる新しいモデルを提案する。
アーキテクチャは,iChallenge-AMD,iChallenge-PM,G1020という3つの公開データセット上で,47.89,49.00,45.32のピーク信号対雑音比(PSNR)を達成する。
さらに、NASAが提供するSANS用のプライベートデータセットでモデルの有効性を検証し、以前のアーキテクチャと比較した結果を得た。
関連論文リスト
- Temporal and Spatial Super Resolution with Latent Diffusion Model in Medical MRI images [0.0]
スーパーレゾリューション(SR)はコンピュータビジョン、特に医用画像において重要な役割を果たす。
本稿では,Vector Quantized GAN(VQGAN)をベースとしたエンコーダデコーダアーキテクチャを併用したLatent Diffusion Model(LDM)を提案する。
論文 参考訳(メタデータ) (2024-10-29T20:13:00Z) - Hybrid attention structure preserving network for reconstruction of under-sampled OCT images [0.30693357740321775]
我々は,HASPN(Hybrid attention structure Preserving Network)を提案する。
適応的拡張畳み込み型チャネルアテンション(ADCCA)と空間アテンション(ESA)を利用して特徴のチャネルと空間情報をよりよく捉えた。
HASPNは糖尿病黄斑浮腫網膜データセットに適用され、その優れた一般化能が検証された。
論文 参考訳(メタデータ) (2024-06-01T03:07:28Z) - CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers [66.15847237150909]
縦型超音波画像におけるカテーテルのセグメンテーションのための自己教師型ディープラーニングアーキテクチャを提案する。
ネットワークアーキテクチャは、Attention in Attentionメカニズムで構築されたセグメンテーショントランスフォーマであるAiAReSeg上に構築されている。
我々は,シリコンオルタファントムから収集した合成データと画像からなる実験データセット上で,我々のモデルを検証した。
論文 参考訳(メタデータ) (2024-03-21T15:13:36Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - DualStreamFoveaNet: A Dual Stream Fusion Architecture with Anatomical Awareness for Robust Fovea Localization [6.278444803136043]
マルチキュー核融合のためのDualStreamFoveaNet (DSFN) と呼ばれる新しいトランスフォーマーアーキテクチャを提案する。
このアーキテクチャは、網膜と血管の分布を用いた長距離接続とグローバルな特徴をはっきりと組み込んで、堅牢な葉の局在を図っている。
DSFNは、正常な網膜像と疾患のある網膜像の両方においてより堅牢であり、クロスデータセット実験においてキャパシティの一般化がより優れていることを実証する。
論文 参考訳(メタデータ) (2023-02-14T10:40:20Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - OADAT: Experimental and Synthetic Clinical Optoacoustic Data for
Standardized Image Processing [62.993663757843464]
オプトアコースティック(OA)イメージングは、ナノ秒レーザーパルスによる生体組織の励起と、光吸収による熱弾性膨張によって発生する超音波の検出に基づいている。
OAイメージングは、深部組織における豊富な光学コントラストと高分解能の強力な組み合わせを特徴としている。
臨床環境でのOAの幅広い応用を促進するために、異なるタイプの実験的なセットアップと関連する処理手法で生成される標準化データセットは存在しない。
論文 参考訳(メタデータ) (2022-06-17T08:11:26Z) - ROCT-Net: A new ensemble deep convolutional model with improved spatial
resolution learning for detecting common diseases from retinal OCT images [0.0]
本稿では,OCT画像から網膜疾患を検出するために,新たな深層アンサンブル畳み込みニューラルネットワークを提案する。
本モデルは,2つの頑健な畳み込みモデルの学習アーキテクチャを用いて,リッチかつマルチレゾリューションな特徴を生成する。
2つのデータセットに関する実験と、他のよく知られた深層畳み込みニューラルネットワークとの比較により、アーキテクチャが分類精度を最大5%向上できることが証明された。
論文 参考訳(メタデータ) (2022-03-03T17:51:01Z) - Generative Residual Attention Network for Disease Detection [51.60842580044539]
本稿では, 条件付き生成逆学習を用いたX線疾患発生のための新しいアプローチを提案する。
我々は,患者の身元を保存しながら,対象領域に対応する放射線画像を生成する。
次に、ターゲット領域で生成されたX線画像を用いてトレーニングを増強し、検出性能を向上させる。
論文 参考訳(メタデータ) (2021-10-25T14:15:57Z) - Real-Time Glaucoma Detection from Digital Fundus Images using Self-ONNs [22.863901758361692]
緑内障は、視覚画像を脳に伝達する視神経を損傷することで、永久的な視覚障害を引き起こす。
ラベル付きデータの不足により,デジタル眼底画像からの緑内障検出に様々な深層学習モデルが応用されている。
本研究では,眼底画像における緑内障の早期検出のために,コンパクトな自己組織化オペレーショナルニューラルネットワーク(Self-ONN)を提案する。
論文 参考訳(メタデータ) (2021-09-28T10:27:01Z) - An Interpretable Multiple-Instance Approach for the Detection of
referable Diabetic Retinopathy from Fundus Images [72.94446225783697]
基礎画像における参照糖尿病網膜症検出のための機械学習システムを提案する。
画像パッチから局所情報を抽出し,アテンション機構により効率的に組み合わせることで,高い分類精度を実現することができる。
我々は,現在入手可能な網膜画像データセットに対するアプローチを評価し,最先端の性能を示す。
論文 参考訳(メタデータ) (2021-03-02T13:14:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。