論文の概要: DinoBloom: A Foundation Model for Generalizable Cell Embeddings in Hematology
- arxiv url: http://arxiv.org/abs/2404.05022v1
- Date: Sun, 7 Apr 2024 17:25:52 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-09 16:12:42.944736
- Title: DinoBloom: A Foundation Model for Generalizable Cell Embeddings in Hematology
- Title(参考訳): DinoBloom:血液学における一般化可能な細胞埋め込みの基礎モデル
- Authors: Valentin Koch, Sophia J. Wagner, Salome Kazeminia, Ece Sancar, Matthias Hehr, Julia Schnabel, Tingying Peng, Carsten Marr,
- Abstract要約: 血液学における単細胞画像の最初の基盤モデルであるDinoBloomを紹介した。
本モデルは末梢血と骨髄のスミアの13種類の多種多様な公開データセットの広範囲な収集に基づいて構築されている。
4つのDinoBloomモデルのファミリーは、幅広い下流アプリケーションに適応することができる。
- 参考スコア(独自算出の注目度): 1.3551232282678036
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In hematology, computational models offer significant potential to improve diagnostic accuracy, streamline workflows, and reduce the tedious work of analyzing single cells in peripheral blood or bone marrow smears. However, clinical adoption of computational models has been hampered by the lack of generalization due to large batch effects, small dataset sizes, and poor performance in transfer learning from natural images. To address these challenges, we introduce DinoBloom, the first foundation model for single cell images in hematology, utilizing a tailored DINOv2 pipeline. Our model is built upon an extensive collection of 13 diverse, publicly available datasets of peripheral blood and bone marrow smears, the most substantial open-source cohort in hematology so far, comprising over 380,000 white blood cell images. To assess its generalization capability, we evaluate it on an external dataset with a challenging domain shift. We show that our model outperforms existing medical and non-medical vision models in (i) linear probing and k-nearest neighbor evaluations for cell-type classification on blood and bone marrow smears and (ii) weakly supervised multiple instance learning for acute myeloid leukemia subtyping by a large margin. A family of four DinoBloom models (small, base, large, and giant) can be adapted for a wide range of downstream applications, be a strong baseline for classification problems, and facilitate the assessment of batch effects in new datasets. All models are available at github.com/marrlab/DinoBloom.
- Abstract(参考訳): 血液学において、計算モデルは、診断精度の向上、ワークフローの効率化、末梢血や骨髄の腫れを単細胞で解析する面倒な作業の軽減に重要な可能性を秘めている。
しかし, 大規模バッチ効果, データセットサイズが小さく, 自然画像からの移動学習性能が低かったため, 一般化の欠如により, 計算モデルの臨床的採用が妨げられている。
これらの課題に対処するために、DinoBloomを紹介した。これは血液学における単一細胞画像の基盤モデルであり、DINOv2パイプラインをカスタマイズしたものである。
本モデルでは, 末梢血および骨髄のスミアについて, 13種類の多種多様なデータセットと, 380,000個の白血球画像からなる, 血液学における最も実質的なオープンソースコーホートを用いて構築した。
一般化能力を評価するため、ドメインシフトの困難な外部データセット上で評価する。
我々のモデルは既存の医用および非医療用視覚モデルよりも優れていることを示す。
一 血液及び骨髄スミアの細胞型分類のためのリニアプローブおよびk-アネレスト近傍の評価
(II)急性骨髄性白血病に対する多症例学習が著明に指導された。
4つのDinoBloomモデル(小型、ベース、大型、巨大)のファミリーは、幅広い下流アプリケーションに適用でき、分類問題の強力なベースラインとなり、新しいデータセットにおけるバッチ効果の評価を容易にする。
全てのモデルはgithub.com/marrlab/DinoBloomで入手できる。
関連論文リスト
- Assessment of Cell Nuclei AI Foundation Models in Kidney Pathology [10.574005822664034]
この研究は、これまでで最大規模の評価であり、我々の知る限り、これまでで最大規模の評価である。
評価モデルのうち,CellViTは腎病理におけるセグメンテーション核の優れた性能を示した。
しかし、どの基礎モデルも完璧ではなく、腎臓病理学の一般的な核分割における性能ギャップは依然として残っている。
論文 参考訳(メタデータ) (2024-08-09T22:34:13Z) - Histopathological Image Classification with Cell Morphology Aware Deep Neural Networks [11.749248917866915]
本稿では,細胞形態を学習し,多数のがんタイプを同定するために事前訓練した新しいDeepCMorphモデルを提案する。
7175例の8736例の診断スライドから抽出した270K以上の組織パッチからなるPan-Cancer TCGAデータセット上で,本モジュールを事前訓練した。
提案手法は, 82%以上の精度で32種類の癌を検出でき, 従来提案されていたすべてのソリューションを4%以上上回る性能を示した。
論文 参考訳(メタデータ) (2024-07-11T16:03:59Z) - Towards a clinically accessible radiology foundation model: open-access and lightweight, with automated evaluation [113.5002649181103]
オープンソースの小型マルチモーダルモデル(SMM)を訓練し、放射線学における未測定臨床ニーズに対する能力ギャップを埋める。
トレーニングのために,697万以上の画像テキストペアからなる大規模なデータセットを組み立てる。
評価のために,GPT-4に基づく実測値CheXpromptを提案する。
LlaVA-Radの推論は高速で、単一のV100 GPU上でプライベート設定で実行できる。
論文 参考訳(メタデータ) (2024-03-12T18:12:02Z) - A Continual Learning Approach for Cross-Domain White Blood Cell
Classification [36.482007703764154]
白血球分類におけるクラスインクリメンタルおよびドメインインクリメンタルシナリオに対するリハーサルに基づく連続学習手法を提案する。
従来のタスクから代表サンプルを選択するために,モデルの予測に基づいてセット選択を用いる。
色,解像度,クラス組成が異なる3つの白血球分類データセットについて,提案手法を徹底的に評価した。
論文 参考訳(メタデータ) (2023-08-24T09:38:54Z) - Deep CNNs for Peripheral Blood Cell Classification [0.0]
我々は、顕微鏡的末梢血細胞画像データセットに基づいて、27の人気の深層畳み込みニューラルネットワークアーキテクチャをベンチマークした。
血液細胞分類のためのImageNetデータセットに事前トレーニングされた最先端画像分類モデルを微調整する。
論文 参考訳(メタデータ) (2021-10-18T17:56:07Z) - Medulloblastoma Tumor Classification using Deep Transfer Learning with
Multi-Scale EfficientNets [63.62764375279861]
本稿では,エンド・ツー・エンドのMB腫瘍分類を提案し,様々な入力サイズとネットワーク次元の一致した移動学習を提案する。
161ケースのデータセットを用いて、より大規模な入力解像度を持つ事前学習されたEfficientNetが、大幅な性能改善をもたらすことを実証した。
論文 参考訳(メタデータ) (2021-09-10T13:07:11Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Many-to-One Distribution Learning and K-Nearest Neighbor Smoothing for
Thoracic Disease Identification [83.6017225363714]
ディープラーニングは、病気の識別性能を改善するための最も強力なコンピュータ支援診断技術となった。
胸部X線撮影では、大規模データの注釈付けには専門的なドメイン知識が必要で、時間を要する。
本論文では、単一モデルにおける疾患同定性能を改善するために、複数対1の分布学習(MODL)とK-nearest neighbor smoothing(KNNS)手法を提案する。
論文 参考訳(メタデータ) (2021-02-26T02:29:30Z) - Single Model Deep Learning on Imbalanced Small Datasets for Skin Lesion
Classification [5.642359877598896]
本稿では,小・不均衡なデータセットに基づく皮膚病変の単一モデル分類のための新しいデータ拡張戦略を提案する。
このデータセット上で、様々なDCNNがトレーニングされ、適度な複雑さを持つモデルがより大きなモデルより優れていることを示す。
修正RandAugmentとMulti-weighted Focal Lossを1つのDCNNモデルで組み合わせることで、ISIC 2018チャレンジテストデータセット上の複数のアンサンブルモデルに匹敵する分類精度を達成した。
論文 参考訳(メタデータ) (2021-02-02T03:48:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Predicting Clinical Diagnosis from Patients Electronic Health Records
Using BERT-based Neural Networks [62.9447303059342]
医療コミュニティにおけるこの問題の重要性を示す。
本稿では,変換器 (BERT) モデルによる2方向表現の分類順序の変更について述べる。
約400万人のユニークな患者訪問からなる、大規模なロシアのEHRデータセットを使用します。
論文 参考訳(メタデータ) (2020-07-15T09:22:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。