論文の概要: OCT Data is All You Need: How Vision Transformers with and without Pre-training Benefit Imaging
- arxiv url: http://arxiv.org/abs/2502.12379v1
- Date: Mon, 17 Feb 2025 23:31:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-19 14:07:49.599442
- Title: OCT Data is All You Need: How Vision Transformers with and without Pre-training Benefit Imaging
- Title(参考訳): OCTデータ(動画)
- Authors: Zihao Han, Philippe De Wilde,
- Abstract要約: 我々は,イメージネットを用いた事前学習がOCT画像分類における視覚変換器(ViT)の性能に与える影響について検討した。
結果として、事前トレーニングは収束を加速し、より小さなデータセットでより良いパフォーマンスを提供する可能性があるが、十分なOCTデータが利用可能であれば、スクラッチからのトレーニングは同等またはそれ以上の精度を達成する可能性があることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Optical Coherence Tomography (OCT) provides high-resolution cross-sectional images useful for diagnosing various diseases, but their distinct characteristics from natural images raise questions about whether large-scale pre-training on datasets like ImageNet is always beneficial. In this paper, we investigate the impact of ImageNet-based pre-training on Vision Transformer (ViT) performance for OCT image classification across different dataset sizes. Our experiments cover four-category retinal pathologies (CNV, DME, Drusen, Normal). Results suggest that while pre-training can accelerate convergence and potentially offer better performance in smaller datasets, training from scratch may achieve comparable or even superior accuracy when sufficient OCT data is available. Our findings highlight the importance of matching domain characteristics in pre-training and call for further study on large-scale OCT-specific pre-training.
- Abstract(参考訳): 光コヒーレンス・トモグラフィ(OCT)は、様々な疾患の診断に有用な高解像度断面画像を提供するが、自然画像と異なる特徴は、ImageNetのようなデータセット上の大規模事前トレーニングが常に有用であるかどうかという疑問を引き起こす。
本稿では,イメージネットを用いた事前学習が,データセットサイズによるOCT画像分類における視覚変換器(ViT)の性能に与える影響について検討する。
本実験は4カテゴリー網膜病理(CNV, DME, Drusen, Normal)について検討した。
結果として、事前トレーニングは収束を加速し、より小さなデータセットでより良いパフォーマンスを提供する可能性があるが、十分なOCTデータが利用可能であれば、スクラッチからのトレーニングは同等またはそれ以上の精度を達成する可能性があることが示唆された。
本研究は, 事前トレーニングにおけるドメイン特性の一致の重要性を強調し, 大規模 OCT 固有の事前トレーニングのさらなる研究を求めるものである。
関連論文リスト
- SegBook: A Simple Baseline and Cookbook for Volumetric Medical Image Segmentation [20.026663367994356]
大量のフルボディCT画像は、強力なモデルを事前訓練する機会を提供する。
これらの事前訓練されたモデルが、下流の様々な医療セグメンテーションタスクに移行できる状況は、まだ不明である。
我々は,全体CT事前訓練モデルの転写能力を評価するために,モダリティ,ターゲット,サンプルサイズが異なる87の公開データセットを収集した。
論文 参考訳(メタデータ) (2024-11-21T19:00:01Z) - Imaging foundation model for universal enhancement of non-ideal measurement CT [23.678515579203694]
NICT(Non-ideal measured compute tomography)は、CT画像の新しい利点として最適な画像標準を犠牲にしている。
画像基準の引き下げにより、画像の質も低下し、臨床受容性が制限された。
画像品質の劣化を最小限のデータコストで橋渡しするマルチスケール統合トランスフォーマーAMP (TAMP) を提案する。
論文 参考訳(メタデータ) (2024-10-02T14:25:02Z) - Enhancing Retinal Disease Classification from OCTA Images via Active Learning Techniques [0.8035416719640156]
高齢のアメリカ人では眼疾患が一般的であり、視力や視力の低下につながることがある。
光コヒーレンス・トモグラフィ・アンギオグラフィー(OCTA)により、臨床医が網膜血管の高品質な画像を取得することができる画像技術の最近の進歩
OCTAは、一般的なOCT画像から得られる構造情報と比較して、詳細な血管画像を提供する。
論文 参考訳(メタデータ) (2024-07-21T23:24:49Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Vision-Language Modelling For Radiological Imaging and Reports In The
Low Data Regime [70.04389979779195]
本稿では,視覚および言語入力を共通空間に埋め込んだ医用視覚言語モデル(VLM)について検討する。
本稿では,新しい画像領域やテキスト領域への汎用事前学習モデルの適用など,低データ性能向上のためのいくつかの候補手法について検討する。
テキスト・ツー・イメージ検索をベンチマークとして,2つの胸部X線および放射線学的報告を用いた可変サイズのトレーニングデータセットを用いて,これらの手法の性能評価を行った。
論文 参考訳(メタデータ) (2023-03-30T18:20:00Z) - Data-Efficient Vision Transformers for Multi-Label Disease
Classification on Chest Radiographs [55.78588835407174]
視覚変換器(ViT)は一般的な画像の分類性能が高いにもかかわらず、このタスクには適用されていない。
ViTは、畳み込みではなくパッチベースの自己アテンションに依存しており、CNNとは対照的に、ローカル接続に関する事前の知識は存在しない。
以上の結果から,ViTとCNNのパフォーマンスはViTの利点に匹敵するものの,DeiTsはトレーニング用に適度に大規模なデータセットが利用可能であれば,前者よりも優れることがわかった。
論文 参考訳(メタデータ) (2022-08-17T09:07:45Z) - SD-LayerNet: Semi-supervised retinal layer segmentation in OCT using
disentangled representation with anatomical priors [4.2663199451998475]
網膜層セグメンテーションタスクに半教師付きパラダイムを導入する。
特に、表面位置回帰をピクセル単位で構造化されたセグメンテーションに変換するために、新しい完全微分可能なアプローチが用いられる。
並行して,ラベル付きデータの限られた量が利用できる場合に,ネットワークトレーニングを改善するための解剖学的事前セットを提案する。
論文 参考訳(メタデータ) (2022-07-01T14:30:59Z) - ROSE: A Retinal OCT-Angiography Vessel Segmentation Dataset and New
Model [41.444917622855606]
OCT-Aセグメンテーションデータセット(ROSE)は229枚のOCT-A画像からなり、中心線レベルまたは画素レベルで血管アノテーションを付加する。
次に,スプリットをベースとしたSCF-Net(Coarse-to-Fine vessel segmentation Network)を提案する。
SCF-Netでは、スプリットベース粗いセグメンテーション(SCS)モジュールを最初に導入し、スプリットベースリファインメント(SRN)モジュールを使用して形状・形状を最適化する。
論文 参考訳(メタデータ) (2020-07-10T06:54:19Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z) - Pathological Retinal Region Segmentation From OCT Images Using Geometric
Relation Based Augmentation [84.7571086566595]
本稿では,幾何学と形状の内在的関係を共同で符号化することで,従来のGANベースの医用画像合成法よりも優れた手法を提案する。
提案手法は,取得手順の異なる画像を有する公開RETOUCHデータセット上で,最先端のセグメンテーション手法より優れている。
論文 参考訳(メタデータ) (2020-03-31T11:50:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。