論文の概要: Pretrained Deep 2.5D Models for Efficient Predictive Modeling from
Retinal OCT
- arxiv url: http://arxiv.org/abs/2307.13865v1
- Date: Tue, 25 Jul 2023 23:46:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-27 14:06:46.827279
- Title: Pretrained Deep 2.5D Models for Efficient Predictive Modeling from
Retinal OCT
- Title(参考訳): 網膜 OCT を用いた高効率予測モデルのための事前訓練深部2.5Dモデル
- Authors: Taha Emre, Marzieh Oghbaie, Arunava Chakravarty, Antoine Rivail,
Sophie Riedl, Julia Mai, Hendrik P.N. Scholl, Sobha Sivaprasad, Daniel
Rueckert, Andrew Lotery, Ursula Schmidt-Erfurth, and Hrvoje Bogunovi\'c
- Abstract要約: 3Dディープラーニングモデルは、病気進行の強力な予測モデルを構築する上で重要な役割を果たす。
本稿では、畳み込みニューラルネットワーク(CNN)、長寿命メモリ(LSTM)、トランスフォーマーを組み合わせた2.5Dアーキテクチャについて検討する。
湿潤加齢関連黄斑変性(AMD)の進行を6ヶ月以内に予測する作業において,建築と関連する事前訓練の有効性を実証した。
- 参考スコア(独自算出の注目度): 7.8641166297532035
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of medical imaging, 3D deep learning models play a crucial role
in building powerful predictive models of disease progression. However, the
size of these models presents significant challenges, both in terms of
computational resources and data requirements. Moreover, achieving high-quality
pretraining of 3D models proves to be even more challenging. To address these
issues, hybrid 2.5D approaches provide an effective solution for utilizing 3D
volumetric data efficiently using 2D models. Combining 2D and 3D techniques
offers a promising avenue for optimizing performance while minimizing memory
requirements. In this paper, we explore 2.5D architectures based on a
combination of convolutional neural networks (CNNs), long short-term memory
(LSTM), and Transformers. In addition, leveraging the benefits of recent
non-contrastive pretraining approaches in 2D, we enhanced the performance and
data efficiency of 2.5D techniques even further. We demonstrate the
effectiveness of architectures and associated pretraining on a task of
predicting progression to wet age-related macular degeneration (AMD) within a
six-month period on two large longitudinal OCT datasets.
- Abstract(参考訳): 医用画像の分野では、3次元深層学習モデルが病気進行の強力な予測モデルを構築する上で重要な役割を果たしている。
しかし、これらのモデルのサイズは計算資源とデータ要求の両方の観点から大きな課題を呈している。
さらに、3Dモデルの高品質な事前訓練を実現することは、さらに困難であることが証明されている。
これらの問題に対処するために、ハイブリッド2.5Dアプローチは、2Dモデルを用いて3次元ボリュームデータを効率的に利用するための効果的なソリューションを提供する。
2D技術と3D技術を組み合わせることで、メモリ要件を最小化しながらパフォーマンスを最適化できる。
本稿では,畳み込みニューラルネットワーク(cnns),long short-term memory(lstm),transformersを組み合わせた2.5dアーキテクチャについて検討する。
さらに,最近の2Dにおける非競合事前学習手法の利点を活用し,2.5D技術の性能とデータ効率をさらに向上させた。
湿潤加齢関連黄斑変性(AMD)の進行を6ヶ月以内に予測する作業において,アーキテクチャの有効性と関連する事前訓練を2つの大長手OCTデータセットで示す。
関連論文リスト
- DeepSet SimCLR: Self-supervised deep sets for improved pathology
representation learning [4.40560654491339]
我々は、これらのデータセットの固有の3D特性を暗黙的にモデル化することで、標準の2D SSLアルゴリズムを改善することを目指している。
強いベースラインモデルの上に構築された2つの変種を提案し、これらの変種は、様々な下流タスクにおいて、しばしばベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-02-23T20:37:59Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - E2ENet: Dynamic Sparse Feature Fusion for Accurate and Efficient 3D
Medical Image Segmentation [36.367368163120794]
E2ENet(Efficient to Efficient Network)と呼ばれる3次元医用画像分割モデルを提案する。
パラメトリックと計算効率の2つの設計が組み込まれている。
さまざまなリソース制約に対して、正確性と効率性のトレードオフを一貫して達成します。
論文 参考訳(メタデータ) (2023-12-07T22:13:37Z) - Interpretable 2D Vision Models for 3D Medical Images [47.75089895500738]
本研究では,3次元画像処理における中間特徴表現を用いた2次元ネットワークの適応手法を提案する。
我々は、ベンチマークとして3D MedMNISTデータセットと、既存の手法に匹敵する数百の高分解能CTまたはMRIスキャンからなる2つの実世界のデータセットを示す。
論文 参考訳(メタデータ) (2023-07-13T08:27:09Z) - Video Pretraining Advances 3D Deep Learning on Chest CT Tasks [63.879848037679224]
大規模自然画像分類データセットの事前学習は、データスカース2D医療タスクのモデル開発に役立っている。
これらの2Dモデルは、3Dコンピュータビジョンベンチマークで3Dモデルに勝っている。
3Dモデルのためのビデオ事前トレーニングにより、より小さなデータセットでより高性能な3D医療タスクを実現することができることを示す。
論文 参考訳(メタデータ) (2023-04-02T14:46:58Z) - Deep Generative Models on 3D Representations: A Survey [81.73385191402419]
生成モデルは、新しいインスタンスを生成することによって観測データの分布を学習することを目的としている。
最近、研究者は焦点を2Dから3Dにシフトし始めた。
3Dデータの表現は、非常に大きな課題をもたらします。
論文 参考訳(メタデータ) (2022-10-27T17:59:50Z) - Advancing 3D Medical Image Analysis with Variable Dimension Transform
based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。
再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。
4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文 参考訳(メタデータ) (2022-01-05T03:11:21Z) - Cascaded deep monocular 3D human pose estimation with evolutionary
training data [76.3478675752847]
深層表現学習は単眼の3次元ポーズ推定において顕著な精度を達成した。
本稿では,大量のトレーニングデータに対してスケーラブルな新しいデータ拡張手法を提案する。
本手法は,先行知識に触発された階層的人体表現と合成に基づいて,未知の3次元人体骨格を合成する。
論文 参考訳(メタデータ) (2020-06-14T03:09:52Z) - Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D
Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。
既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。
結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文 参考訳(メタデータ) (2020-04-07T20:21:18Z) - Attention-Guided Version of 2D UNet for Automatic Brain Tumor
Segmentation [2.371982686172067]
グリオーマは脳腫瘍の中でも最も一般的で攻撃的であり、高い成績で寿命が短くなる。
深層畳み込みニューラルネットワーク(DCNN)は脳腫瘍のセグメンテーションにおいて顕著な性能を発揮している。
しかし, グリオーマの強度や外観に変化があるため, この課題は依然として困難である。
論文 参考訳(メタデータ) (2020-04-04T20:09:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。