論文の概要: Universal Wavelet Units in 3D Retinal Layer Segmentation
- arxiv url: http://arxiv.org/abs/2507.16119v1
- Date: Tue, 22 Jul 2025 00:11:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:13.912204
- Title: Universal Wavelet Units in 3D Retinal Layer Segmentation
- Title(参考訳): 3次元網膜層セグメンテーションにおけるユニバーサルウェーブレットユニット
- Authors: An D. Le, Hung Nguyen, Melanie Tran, Jesse Most, Dirk-Uwe G. Bartsch, William R Freeman, Shyamanga Borooah, Truong Q. Nguyen, Cheolhong An,
- Abstract要約: 本稿では,オプティカルコヒーレンス・トモグラフィ(OCT)ボリュームから3次元網膜層セグメンテーションに波長可変ウェーブレット単位(UwUs)を適用した最初の研究について述べる。
我々は3つのウェーブレットベースのダウンサンプリングモジュール、OrthLattUwU、BiorthLattUwU、LS-BiorthLattUwUを運動補正MGU-Netアーキテクチャに統合する。
特にLS-BiorthLattUwUによるDiceスコアの精度向上を図り,ボリューム医用画像における可変ウェーブレットフィルタの有用性を強調した。
- 参考スコア(独自算出の注目度): 10.759998757187866
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents the first study to apply tunable wavelet units (UwUs) for 3D retinal layer segmentation from Optical Coherence Tomography (OCT) volumes. To overcome the limitations of conventional max-pooling, we integrate three wavelet-based downsampling modules, OrthLattUwU, BiorthLattUwU, and LS-BiorthLattUwU, into a motion-corrected MGU-Net architecture. These modules use learnable lattice filter banks to preserve both low- and high-frequency features, enhancing spatial detail and structural consistency. Evaluated on the Jacobs Retina Center (JRC) OCT dataset, our framework shows significant improvement in accuracy and Dice score, particularly with LS-BiorthLattUwU, highlighting the benefits of tunable wavelet filters in volumetric medical image segmentation.
- Abstract(参考訳): 本稿では,光コヒーレンス・トモグラフィ(OCT)ボリュームから3次元網膜層セグメンテーションに波長可変ウェーブレット単位(UwUs)を適用した最初の研究について述べる。
従来の最大サンプリングの限界を克服するために,OrthLattUwU,BiorthLattUwU,LS-BiorthLattUwUの3つのウェーブレットベースのダウンサンプリングモジュールを動作補正MGU-Netアーキテクチャに統合する。
これらのモジュールは学習可能な格子フィルタバンクを使用して低周波特性と高周波特性の両方を保存し、空間的詳細性と構造的整合性を高める。
われわれはJacobs Retina Center (JRC) OCTデータセットを用いて,特にLS-BiorthLattUwUの精度とDiceスコアを大幅に向上させた。
関連論文リスト
- 3DGabSplat: 3D Gabor Splatting for Frequency-adaptive Radiance Field Rendering [50.04967868036964]
3D Gaussian Splatting(3DGS)は、高忠実なノベルビュー合成を維持しながらリアルタイムレンダリングを実現している。
複数方向の3次元周波数応答を持つ新規な3次元ガボルベースプリミティブを組み込んだ3次元ガボルスプレート(3DGabSplat)を提案する。
我々は3D以上の1.35dBRゲインを実現し、同時にプリミティブメモリ消費量を削減した。
論文 参考訳(メタデータ) (2025-08-07T12:49:44Z) - LODGE: Level-of-Detail Large-Scale Gaussian Splatting with Efficient Rendering [68.93333348474988]
メモリ制約デバイス上での3次元ガウススプラッティングのための新しいレベル・オブ・ディーテール(LOD)法を提案する。
カメラ距離に基づいてガウスの最適部分集合を反復的に選択する。
本手法は,屋外(階層型3DGS)と屋内(Zip-NeRF)の両方で最先端の性能を実現する。
論文 参考訳(メタデータ) (2025-05-29T06:50:57Z) - Hyb-KAN ViT: Hybrid Kolmogorov-Arnold Networks Augmented Vision Transformer [0.0]
本研究では、ビジョントランスフォーマー(ViT)におけるマルチアルノルドパーセプトロン(MLP)固有の制限に対処するため、Hybrid Kolmogorov-Arnold Network(KAN)-T(Hyb-KAN ViT)を導入する。
Hyb-KAN ViTはウェーブレットベースのスペクトル分解とスプライン最適化活性化関数を統合する新しいフレームワークである。
論文 参考訳(メタデータ) (2025-05-07T19:13:17Z) - Freqformer: Frequency-Domain Transformer for 3-D Visualization and Quantification of Human Retinal Circulation [0.9487097819140653]
Freqformerはトランスフォーマーベースのアーキテクチャで、単一のスキャンから人間の網膜循環を3Dで高解像度で可視化するように設計されている。
提案手法は,最先端の畳み込みニューラルネットワーク(CNN)およびトランスフォーマーモデルより優れる。
Freqformerは網膜循環の理解と特性を著しく改善し、潜在的な臨床応用を提供する。
論文 参考訳(メタデータ) (2024-11-17T22:38:39Z) - Spectral U-Net: Enhancing Medical Image Segmentation via Spectral Decomposition [14.450329809640422]
本稿ではスペクトル分解に基づく新しい深層学習ネットワークであるSpectral U-Netを紹介する。
我々は、ダウンサンプリングにDual Tree Complex Wavelet Transform (DTCWT) 、アップサンプリングには逆Dual Tree Complex Wavelet Transform (iDTCWT) を利用する。
U-Netアーキテクチャに組み込まれたWave-BlockとiWave-Blockは、ダウンサンプリング時の情報損失を軽減し、アップサンプリング時の詳細再構築を改善することを目的としている。
論文 参考訳(メタデータ) (2024-09-13T22:10:14Z) - PVAFN: Point-Voxel Attention Fusion Network with Multi-Pooling Enhancing for 3D Object Detection [59.355022416218624]
点とボクセルの表現の統合は、LiDARベースの3Dオブジェクト検出においてより一般的になりつつある。
PVAFN(Point-Voxel Attention Fusion Network)と呼ばれる新しい2段3次元物体検出器を提案する。
PVAFNはマルチプール戦略を使用して、マルチスケールとリージョン固有の情報を効果的に統合する。
論文 参考訳(メタデータ) (2024-08-26T19:43:01Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - Frequency Perception Network for Camouflaged Object Detection [51.26386921922031]
周波数領域のセマンティック階層によって駆動される新しい学習可能かつ分離可能な周波数知覚機構を提案する。
ネットワーク全体では、周波数誘導粗い局所化ステージと細部保存の微細局在化ステージを含む2段階モデルを採用している。
提案手法は,既存のモデルと比較して,3つのベンチマークデータセットにおいて競合性能を実現する。
論文 参考訳(メタデータ) (2023-08-17T11:30:46Z) - SwinVFTR: A Novel Volumetric Feature-learning Transformer for 3D OCT Fluid Segmentation [0.23967405016776386]
3D OCT画像の精密な流体分割のためのトランスフォーマアーキテクチャであるSwinVFTRを提案する。
SwinVFTRは、チャネルワイドボリュームサンプリングとシフトウィンドウトランスフォーマーブロックを用いて、流体の局在を改善する。
Spectralis、Cirrus、Topcon OCTデータセットの既存モデルを上回っている。
論文 参考訳(メタデータ) (2023-03-16T11:16:02Z) - PAENet: A Progressive Attention-Enhanced Network for 3D to 2D Retinal
Vessel Segmentation [0.0]
光コヒーレンス・トモグラフィー(OCTA)画像では3次元から2次元の網膜血管セグメンテーションは難しい問題である。
本稿では,多機能表現を抽出するアテンション機構に基づくプログレッシブ・アテンション・エンハンスメント・ネットワーク(PAENet)を提案する。
提案アルゴリズムは,従来の手法と比較して最先端性能を実現する。
論文 参考訳(メタデータ) (2021-08-26T10:27:25Z) - CovSegNet: A Multi Encoder-Decoder Architecture for Improved Lesion
Segmentation of COVID-19 Chest CT Scans [11.946078871080836]
高度に効率的なニューラルネットワークアーキテクチャ、すなわちCovSegNetを利用して、自動化されたCOVID-19病変のセグメンテーションスキームを提案する。
パフォーマンスは3つの公開データセットで達成されており、他の最先端のアプローチよりも大幅に向上している。
論文 参考訳(メタデータ) (2020-12-02T19:26:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。