論文の概要: OCT-SelfNet: A Self-Supervised Framework with Multi-Modal Datasets for
Generalized and Robust Retinal Disease Detection
- arxiv url: http://arxiv.org/abs/2401.12344v1
- Date: Mon, 22 Jan 2024 20:17:14 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-24 17:45:09.595112
- Title: OCT-SelfNet: A Self-Supervised Framework with Multi-Modal Datasets for
Generalized and Robust Retinal Disease Detection
- Title(参考訳): OCT-SelfNet: 汎用およびロバスト網膜疾患検出のための多モードデータセットを用いた自己監視フレームワーク
- Authors: Fatema-E Jannat, Sina Gholami, Minhaj Nur Alam, Hamed Tabkhi
- Abstract要約: 本研究は、眼疾患を検出するための自己教師付き堅牢な機械学習フレームワークであるOCT-SelfNetに貢献する。
本手法は,自己指導型事前学習と教師型微調整を組み合わせた2段階学習手法を用いてこの問題に対処する。
AUC-PR測定では,提案手法は42%を超え,ベースラインに比べて10%以上の性能向上を示した。
- 参考スコア(独自算出の注目度): 2.3349787245442966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the revolutionary impact of AI and the development of locally trained
algorithms, achieving widespread generalized learning from multi-modal data in
medical AI remains a significant challenge. This gap hinders the practical
deployment of scalable medical AI solutions. Addressing this challenge, our
research contributes a self-supervised robust machine learning framework,
OCT-SelfNet, for detecting eye diseases using optical coherence tomography
(OCT) images. In this work, various data sets from various institutions are
combined enabling a more comprehensive range of representation. Our method
addresses the issue using a two-phase training approach that combines
self-supervised pretraining and supervised fine-tuning with a mask autoencoder
based on the SwinV2 backbone by providing a solution for real-world clinical
deployment. Extensive experiments on three datasets with different encoder
backbones, low data settings, unseen data settings, and the effect of
augmentation show that our method outperforms the baseline model, Resnet-50 by
consistently attaining AUC-ROC performance surpassing 77% across all tests,
whereas the baseline model exceeds 54%. Moreover, in terms of the AUC-PR
metric, our proposed method exceeded 42%, showcasing a substantial increase of
at least 10% in performance compared to the baseline, which exceeded only 33%.
This contributes to our understanding of our approach's potential and
emphasizes its usefulness in clinical settings.
- Abstract(参考訳): AIの革命的な影響と、局所的に訓練されたアルゴリズムの開発にもかかわらず、医療AIのマルチモーダルデータから広く一般化された学習を実現することは、依然として大きな課題である。
このギャップは、スケーラブルな医療AIソリューションの実践的な展開を妨げる。
この課題に対処するため,光コヒーレンストモグラフィ(OCT)画像を用いた眼疾患検出のための自己教師付き堅牢な機械学習フレームワークOCT-SelfNetを開発した。
本研究では,様々な機関の各種データセットを組み合わせることで,より包括的な表現が可能となる。
本手法は,SwinV2バックボーンをベースとしたマスクオートエンコーダと,自己指導型プレトレーニングと教師型微調整を組み合わせた2段階のトレーニング手法を用いてこの問題に対処する。
異なるエンコーダのバックボーン、低いデータ設定、見えないデータ設定を持つ3つのデータセットに対する大規模な実験により、我々の手法はベースラインモデル、Resnet-50より優れており、全てのテストでAUC-ROC性能が77%以上、ベースラインモデルは54%以上であることがわかった。
さらに, AUC-PR測定では, 提案手法は42%以上であり, 33%を超えるベースラインに比べて, 少なくとも10%以上の性能向上を示した。
これは我々のアプローチの可能性の理解に寄与し、臨床環境での有用性を強調します。
関連論文リスト
- Multi-OCT-SelfNet: Integrating Self-Supervised Learning with Multi-Source Data Fusion for Enhanced Multi-Class Retinal Disease Classification [2.5091334993691206]
網膜疾患診断のための堅牢なディープラーニングモデルの開発には、トレーニングのためのかなりのデータセットが必要である。
より小さなデータセットで効果的に一般化する能力は、依然として永続的な課題である。
さまざまなデータソースを組み合わせて、パフォーマンスを改善し、新しいデータに一般化しています。
論文 参考訳(メタデータ) (2024-09-17T17:22:35Z) - Unsupervised Training of Neural Cellular Automata on Edge Devices [2.5462695047893025]
携帯電話上でのセルラーオートマタトレーニングを, アクセス可能なX線肺セグメンテーションのために直接実施する。
5つのAndroidデバイスにこれらの高度なモデルをデプロイし、トレーニングする実用性と実現可能性を確認します。
デジタルコピーが入手できず、X線ライトボックスやモニターから画像を撮影しなければならない極端な場合、VWSLはDiceの精度を5-20%向上させる。
論文 参考訳(メタデータ) (2024-07-25T15:21:54Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Sample Less, Learn More: Efficient Action Recognition via Frame Feature
Restoration [59.6021678234829]
本稿では,2つのスパースサンプリングおよび隣接するビデオフレームの中間特徴を復元する新しい手法を提案する。
提案手法の統合により, 一般的な3つのベースラインの効率は50%以上向上し, 認識精度は0.5%低下した。
論文 参考訳(メタデータ) (2023-07-27T13:52:42Z) - LVM-Med: Learning Large-Scale Self-Supervised Vision Models for Medical
Imaging via Second-order Graph Matching [59.01894976615714]
LVM-Medは、大規模医療データセットに基づいてトレーニングされた、最初のディープネットワークファミリーである。
55の公開データセットから約13万の医療画像を収集しました。
LVM-Medは、多くの最先端の教師付き、自己監督型、基礎モデルよりも経験的に優れている。
論文 参考訳(メタデータ) (2023-06-20T22:21:34Z) - Robust and Efficient Medical Imaging with Self-Supervision [80.62711706785834]
医用画像AIの堅牢性とデータ効率を向上させるための統一表現学習戦略であるREMEDISを提案する。
様々な医療画像タスクを研究し, 振り返りデータを用いて3つの現実的な応用シナリオをシミュレートする。
論文 参考訳(メタデータ) (2022-05-19T17:34:18Z) - Advancing COVID-19 Diagnosis with Privacy-Preserving Collaboration in
Artificial Intelligence [79.038671794961]
我々はUCADI(Unified CT-COVID AI Diagnostic Initiative)を立ち上げ、各ホスト機関でAIモデルを分散的にトレーニングし、独立して実行することができる。
本研究は,中国とイギリスに所在する23の病院で採取した3,336例の胸部CT9,573例について検討した。
論文 参考訳(メタデータ) (2021-11-18T00:43:41Z) - Collaborative Federated Learning For Healthcare: Multi-Modal COVID-19
Diagnosis at the Edge [5.258947981618588]
我々は,医療におけるエッジコンピューティングの能力を活用し,臨床ビジュアルデータのインテリジェントな処理の可能性を分析し,評価する。
本研究では,CFL(Clustered federated Learning)の概念を,新型コロナの自動診断に応用した。
2つのベンチマークデータセットの異なる実験セットアップの下で,提案フレームワークの性能を評価する。
論文 参考訳(メタデータ) (2021-01-19T08:40:59Z) - A Comprehensive Study of Data Augmentation Strategies for Prostate
Cancer Detection in Diffusion-weighted MRI using Convolutional Neural
Networks [9.554833667156913]
217例のトレーニングデータセットに,最も頻繁に使用される5つの拡張手法(ランダム回転,水平フリップ,垂直フリップ,ランダム作物,翻訳)を適用した。
前立腺癌検出の精度に及ぼす各方法の影響について検討した。
浅層ネットワークは、回転法により得られる最高の2DスライスベースのAUC0.85で、ディープネットワークを上回った。
論文 参考訳(メタデータ) (2020-06-01T14:31:38Z) - MS-Net: Multi-Site Network for Improving Prostate Segmentation with
Heterogeneous MRI Data [75.73881040581767]
本稿では,ロバスト表現を学習し,前立腺のセグメンテーションを改善するための新しいマルチサイトネットワーク(MS-Net)を提案する。
当社のMS-Netは,すべてのデータセットのパフォーマンスを一貫して改善し,マルチサイト学習における最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2020-02-09T14:11:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。