論文の概要: Freqformer: Frequency-Domain Transformer for 3-D Reconstruction and Quantification of Human Retinal Vasculature
- arxiv url: http://arxiv.org/abs/2411.11189v2
- Date: Fri, 26 Sep 2025 21:21:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 14:13:47.13061
- Title: Freqformer: Frequency-Domain Transformer for 3-D Reconstruction and Quantification of Human Retinal Vasculature
- Title(参考訳): Freqformer:ヒト網膜血管の3次元再構成と定量化のための周波数領域変換器
- Authors: Lingyun Wang, Bingjie Wang, Jay Chhablani, Jose Alain Sahel, Shaohua Pi,
- Abstract要約: 本稿では,グローバル空間コンテキストをキャプチャするトランスフォーマー層を統合した,デュアルブランチアーキテクチャを備えた新しいトランスフォーマーモデルであるFreqformerを紹介する。
Freqformerは1枚の深度平面OCTA画像を用いて訓練され、音量積分OCTAを基礎的真理として利用した。
Freqformerは既存の畳み込みニューラルネットワークとTransformerベースの手法を大幅に上回り、優れた画像メトリクスを実現した。
- 参考スコア(独自算出の注目度): 3.708884194494243
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Objective: To achieve accurate 3-D reconstruction and quantitative analysis of human retinal vasculature from a single optical coherence tomography angiography (OCTA) scan. Methods: We introduce Freqformer, a novel Transformer-based model featuring a dual-branch architecture that integrates a Transformer layer for capturing global spatial context with a complex-valued frequency-domain module designed for adaptive frequency enhancement. Freqformer was trained using single depth-plane OCTA images, utilizing volumetrically merged OCTA as the ground truth. Performance was evaluated quantitatively through 2-D and 3-D image quality metrics. 2-D networks and their 3-D counterparts were compared to assess the differences between enhancing volume slice by slice and enhancing it by 3-D patches. Furthermore, 3-D quantitative vascular metrics were conducted to quantify human retinal vasculature. Results: Freqformer substantially outperformed existing convolutional neural networks and Transformer-based methods, achieving superior image metrics. Importantly, the enhanced OCTA volumes show strong correlation with the merged volumes on vascular segment count, density, length, and flow index, further underscoring its reliability for quantitative vascular analysis. 3-D counterparts did not yield additional gains in image metrics or downstream 3-D vascular quantification but incurred nearly an order-of-magnitude longer inference time, supporting our 2-D slice-wise enhancement strategy. Additionally, Freqformer showed excellent generalization capability on larger field-of-view scans, surpassing the quality of conventional volumetric merging methods. Conclusion: Freqformer reliably generates high-definition 3-D retinal microvasculature from single-scan OCTA, enabling precise vascular quantification comparable to standard volumetric merging methods.
- Abstract(参考訳): 目的:単一光コヒーレンス断層撮影血管造影(OCTA)スキャンによるヒト網膜血管の正確な3次元再構築と定量的解析を実現する。
方法: 適応周波数拡張のために設計された複素数値周波数領域モジュールとグローバル空間コンテキストをキャプチャするTransformer層を統合するデュアルブランチアーキテクチャを特徴とする新しいTransformerモデルであるFreqformerを紹介する。
Freqformerは1枚の深度平面OCTA画像を用いて訓練され、音量積分OCTAを基礎的真理として利用した。
2次元および3次元画像品質指標を用いて定量的に評価した。
2次元ネットワークとその3次元ネットワークを比較し,スライスによるボリュームスライス向上と3次元パッチによるボリュームスライス向上の相違について検討した。
さらに,ヒト網膜血管の定量化のために3次元定量的血管計測を行った。
結果: Freqformerは既存の畳み込みニューラルネットワークとTransformerベースの手法を大幅に上回り、優れた画像メトリクスを実現した。
また, 拡張OCTAボリュームは, 血管セグメント数, 密度, 長さ, フロー指標の合併量との相関が強く, 定量的な血管分析の信頼性が強調された。
画像の計測値や下流の3D血管の定量化では3D対応は得られなかったが,2次元スライス・エンハンスメント戦略が支持された。
さらに、Freqformerは、従来のボリュームマージ法を超越した、より大きな視野スキャンに対して優れた一般化能力を示した。
結論: Freqformer はシングルスキャンOCTA から高分解能の3次元網膜微小血管を確実に生成し、標準的なボリュームマージ法に匹敵する正確な血管定量化を可能にした。
関連論文リスト
- Implicit Spatiotemporal Bandwidth Enhancement Filter by Sine-activated Deep Learning Model for Fast 3D Photoacoustic Tomography [0.0]
高周波半球トランスデューサを用いた3次元光音響トモグラフィ(3D-PAT)は、ほぼ一方向受信を提供する。
しかし、サンプリングレートが制限されたチャンネル数などの実用的な制約は、画像品質を低下させるスパースと帯域制限センサーをもたらすことが多い。
センサワイドPAラジオ周波数(PARF)データに直接適用した2次元ディープラーニング(DL)手法を再検討する。
具体的には、SPF信号のブロードバンド特性を復元するために、DLモデルにsine-activatedを導入します。
論文 参考訳(メタデータ) (2025-07-28T07:16:32Z) - High Volume Rate 3D Ultrasound Reconstruction with Diffusion Models [14.007660129016852]
三次元超音波は解剖学的構造のリアルタイムな体積可視化を可能にする。
高ボリュームと高画質の両方を達成することは、依然として大きな課題である。
本稿では,拡散モデル(DM)を用いて空間的・時間的分解能の向上を図り,新しい3次元超音波再構成手法を提案する。
論文 参考訳(メタデータ) (2025-05-28T08:14:12Z) - Deep-Motion-Net: GNN-based volumetric organ shape reconstruction from single-view 2D projections [1.8189671456038365]
放射線治療中に3次元臓器形状を再構成できるエンドツーエンドのグラフニューラルネットワークアーキテクチャを提案する。
提案モデルは、患者固有のテンプレートと、任意の投影角度でkV画像から抽出した深い特徴からメッシュ回帰を学習する。
総合的枠組みは, 合成呼吸運動のシナリオを定量的に検討し, 肝癌患者に対するフルスキャンで得られた内処理画像について質的に検討した。
論文 参考訳(メタデータ) (2024-07-09T09:07:18Z) - Diff3Dformer: Leveraging Slice Sequence Diffusion for Enhanced 3D CT Classification with Transformer Networks [5.806035963947936]
拡散型3次元視覚変換器(Diff3Dformer)を提案する。
本手法は, 肺CTの2種類の小さなデータセットに対して, 改良された性能を示す。
論文 参考訳(メタデータ) (2024-06-24T23:23:18Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - AiAReSeg: Catheter Detection and Segmentation in Interventional
Ultrasound using Transformers [75.20925220246689]
血管内手術は、電離放射線を用いてカテーテルと血管を可視化するFluoroscopyの黄金標準を用いて行われる。
本研究では、最先端機械学習トランスフォーマアーキテクチャを応用して、軸干渉超音波画像シーケンス中のカテーテルを検出し、セグメント化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-25T19:34:12Z) - On the Localization of Ultrasound Image Slices within Point Distribution
Models [84.27083443424408]
甲状腺疾患は高分解能超音波(US)で診断されることが多い
縦断追跡は病理甲状腺形態の変化をモニタリングするための重要な診断プロトコルである。
3次元形状表現におけるUS画像の自動スライスローカライズのためのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-01T10:10:46Z) - Fast light-field 3D microscopy with out-of-distribution detection and
adaptation through Conditional Normalizing Flows [16.928404625892625]
リアルタイム3次元蛍光顕微鏡は生物の分析に不可欠である。
そこで我々は,生きた固定化ゼブラフィッシュ神経活動の高速な3次元再構成を行う新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-06-10T10:42:49Z) - Image Reconstruction for Accelerated MR Scan with Faster Fourier
Convolutional Neural Networks [87.87578529398019]
部分走査は、磁気共鳴イメージング(MRI)データ取得を2次元および3次元の両方で加速する一般的な手法である。
本稿では,Faster Fourier Convolution (FasterFC) と呼ばれる新しい畳み込み演算子を提案する。
2次元加速MRI法であるFasterFC-End-to-End-VarNetは、FasterFCを用いて感度マップと再構成品質を改善する。
k空間領域再構成を誘導する単一グループアルゴリズムを用いたFasterFC-based Single-to-group Network (FAS-Net) と呼ばれる3次元加速MRI法
論文 参考訳(メタデータ) (2023-06-05T13:53:57Z) - View-Disentangled Transformer for Brain Lesion Detection [50.4918615815066]
より正確な腫瘍検出のためのMRI特徴抽出のための新しいビューディペンタングル変換器を提案する。
まず, 3次元脳スキャンにおいて, 異なる位置の長距離相関を求める。
第二に、トランスフォーマーはスライス機能のスタックを複数の2Dビューとしてモデル化し、これらの機能をビュー・バイ・ビューとして拡張する。
第三に、提案したトランスモジュールをトランスのバックボーンに展開し、脳病変を取り巻く2D領域を効果的に検出する。
論文 参考訳(メタデータ) (2022-09-20T11:58:23Z) - Deep learning of multi-resolution X-Ray micro-CT images for multi-scale
modelling [0.0]
本研究では3次元拡張深部超解像(EDSR)畳み込みニューラルネットワークを開発し,大規模空間スケールで高分解能データを生成する。
我々は,テキスト解析,セグメンテーション動作,多相流シミュレーション(PNM)を用いてネットワークを検証した。
EDSR生成モデルは、不均一性の存在下での実験挙動を予測するための基礎LRモデルよりも精度が高い。
論文 参考訳(メタデータ) (2021-11-01T21:49:22Z) - Revisiting 3D Context Modeling with Supervised Pre-training for
Universal Lesion Detection in CT Slices [48.85784310158493]
CTスライスにおける普遍的病変検出のための3Dコンテキスト強化2D特徴を効率的に抽出するための修飾擬似3次元特徴ピラミッドネットワーク(MP3D FPN)を提案する。
新たな事前学習手法により,提案したMP3D FPNは,DeepLesionデータセット上での最先端検出性能を実現する。
提案された3Dプリトレーニングウェイトは、他の3D医療画像分析タスクのパフォーマンスを高めるために使用できる。
論文 参考訳(メタデータ) (2020-12-16T07:11:16Z) - 3D Solid Spherical Bispectrum CNNs for Biomedical Texture Analysis [3.579867431007686]
局所回転不変量 (LRI) 演算子は生物医学的テクスチャ解析において大きな可能性を示している。
浅層畳み込みニューラルネットワーク(CNN)に埋め込まれたLRI層の設計におけるスペクトル上の双スペクトルを用いた3次元画像解析の利点について検討する。
論文 参考訳(メタデータ) (2020-04-28T09:01:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。