論文の概要: RudolfV: A Foundation Model by Pathologists for Pathologists
- arxiv url: http://arxiv.org/abs/2401.04079v3
- Date: Tue, 12 Mar 2024 17:47:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 01:07:25.198634
- Title: RudolfV: A Foundation Model by Pathologists for Pathologists
- Title(参考訳): RudolfV:病理学者のための基礎モデル
- Authors: Jonas Dippel, Barbara Feulner, Tobias Winterhoff, Simon Schallenberg,
Gabriel Dernbach, Andreas Kunft, Stephan Tietz, Timo Milbich, Simon Heinke,
Marie-Lisa Eich, Julika Ribbat-Idel, Rosemarie Krupar, Philipp Jurmeister,
David Horst, Lukas Ruff, Klaus-Robert M\"uller, Frederick Klauschen,
Maximilian Alber
- Abstract要約: 我々は、半自動データキュレーションにより、スライド画像全体のデジタル病理学の基礎モデルの現状を拡大する。
我々は、異なる固定、染色、走査プロトコルからのデータをカバーする12億の画像パッチに対応する133kのスライドをキュレートする。
得られたモデルを公開および内部ベンチマークで評価し、我々の基礎モデルは、桁違いに少ないスライドで訓練されているものの、競合するモデルよりも同等かそれ以上の性能を発揮していることを示す。
- 参考スコア(独自算出の注目度): 6.898349246286343
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Histopathology plays a central role in clinical medicine and biomedical
research. While artificial intelligence shows promising results on many
pathological tasks, generalization and dealing with rare diseases, where
training data is scarce, remains a challenge. Distilling knowledge from
unlabelled data into a foundation model before learning from, potentially
limited, labelled data provides a viable path to address these challenges. In
this work, we extend the state of the art of foundation models for digital
pathology whole slide images by semi-automated data curation and incorporating
pathologist domain knowledge. Specifically, we combine computational and
pathologist domain knowledge (1) to curate a diverse dataset of 133k slides
corresponding to 1.2 billion image patches covering data from different
fixation, staining, and scanning protocols as well as data from different
indications and labs across the EU and US, (2) for grouping semantically
similar slides and tissue patches, and (3) to augment the input images during
training. We evaluate the resulting model on a set of public and internal
benchmarks and show that although our foundation model is trained with an order
of magnitude less slides, it performs on par or better than competing models.
We expect that scaling our approach to more data and larger models will further
increase its performance and capacity to deal with increasingly complex real
world tasks in diagnostics and biomedical research.
- Abstract(参考訳): 病理は臨床医学や生医学研究において中心的な役割を果たす。
人工知能は多くの病理学的タスクで有望な結果を示しているが、トレーニングデータが不足しているまれな疾患の一般化と対処は依然として課題である。
ラベルのないデータからの知識を基礎モデルに蒸留し、潜在的に限定されたラベル付きデータから学ぶことは、これらの課題に対処するための有効な道を提供する。
本稿では,準自動データキュレーションと病理学領域知識の統合により,デジタル病理学の基礎モデルの現状を,スライド画像全体に適用する。
具体的には、計算と病理医のドメイン知識を組み合わせ、異なる固定、染色、走査プロトコルからのデータをカバーした12億の画像パッチに対応する133万のスライドの多様なデータセットと、EUと米国内のさまざまな表示や実験室のデータ、意味論的に類似したスライドや組織パッチをグループ化するための(2)、トレーニング中に入力イメージを拡大する(3)。
その結果得られたモデルを,公開ベンチマークと内部ベンチマークで評価し,基礎モデルは1桁以下のスライドでトレーニングされているものの,競合するモデルと同等以上のパフォーマンスを示す。
より多くのデータとより大きなモデルにアプローチをスケールすることで、診断や生体医学研究においてますます複雑な現実世界のタスクに対処するためのパフォーマンスとキャパシティがさらに高まると期待しています。
関連論文リスト
- Beyond Multiple Instance Learning: Full Resolution All-In-Memory
End-To-End Pathology Slide Modeling [1.1265843363277872]
本稿では,タイルエンコーダとスライドアグリゲータを完全メモリで,エンド・ツー・エンドを高解像度で共同で学習する手法を提案する。
より計算コストが高いが、詳細な定量的検証は、病理基礎モデルの大規模事前学習を約束することを示している。
論文 参考訳(メタデータ) (2024-03-07T19:28:58Z) - Towards a Visual-Language Foundation Model for Computational Pathology [5.72536252929528]
病理組織学(CONCH)におけるコントラスト学習について紹介する。
CONCHは、様々な組織像、生医学的テキスト、タスクに依存しない事前トレーニングのソースを用いて開発された視覚言語基盤モデルである。
13種類の多様なベンチマークで評価され, 画像分類, セグメンテーション, キャプション, テキスト・ツー・イメージ検索, 画像・テキスト検索における最先端のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2023-07-24T16:13:43Z) - MedFMC: A Real-world Dataset and Benchmark For Foundation Model
Adaptation in Medical Image Classification [41.16626194300303]
ファンデーションモデルは、多くの場合、大規模なデータで事前訓練されているが、様々なビジョンや言語アプリケーションのジャンプ開始において、最も成功している。
最近の進歩により、下流タスクにおける基礎モデルの適応は、少数のトレーニングサンプルだけで効率的に行えるようになった。
しかし, 医用画像解析におけるそのような学習パラダイムの適用は, 一般に公開されているデータやベンチマークが不足しているため, 依然として少ない。
論文 参考訳(メタデータ) (2023-06-16T01:46:07Z) - Understanding the Tricks of Deep Learning in Medical Image Segmentation:
Challenges and Future Directions [66.40971096248946]
本稿では,モデル実装の異なるフェーズに対して,MedISegの一連のトリックを収集する。
本稿では,これらの手法の有効性を一貫したベースライン上で実験的に検討する。
私たちはまた、それぞれのコンポーネントがプラグインとプレイの利点を持つ強力なMedISegリポジトリをオープンソースにしました。
論文 参考訳(メタデータ) (2022-09-21T12:30:05Z) - Practical Challenges in Differentially-Private Federated Survival
Analysis of Medical Data [57.19441629270029]
本稿では,ニューラルネットワークの本質的特性を活用し,生存分析モデルの訓練過程を関連づける。
小さな医療データセットと少数のデータセンターの現実的な設定では、このノイズはモデルを収束させるのが難しくなります。
DPFed-post は,私的フェデレート学習方式に後処理の段階を追加する。
論文 参考訳(メタデータ) (2022-02-08T10:03:24Z) - HistoKT: Cross Knowledge Transfer in Computational Pathology [31.14107299224401]
CPath (Computer pathology) におけるよく注釈付けられたデータセットの欠如は、医学画像の分類にディープラーニング技術を適用することを妨げている。
ほとんどのトランスファーラーニング研究はモデル中心のアプローチに従っており、ネットワークパラメータをチューニングして、少数のデータセットでのトランスファー結果を改善する。
論文 参考訳(メタデータ) (2022-01-27T00:34:19Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z) - Federated Learning for Computational Pathology on Gigapixel Whole Slide
Images [4.035591045544291]
計算病理学において,ギガピクセル全体の画像に対するプライバシ保護フェデレーション学習を導入する。
スライドレベルのラベルのみを用いた数千のスライディング画像を用いた2つの異なる診断問題に対するアプローチについて検討した。
論文 参考訳(メタデータ) (2020-09-21T21:56:08Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z) - Semi-supervised Medical Image Classification with Relation-driven
Self-ensembling Model [71.80319052891817]
医用画像分類のための関係駆動型半教師付きフレームワークを提案する。
これは、摂動下で与えられた入力の予測一貫性を促進することでラベルのないデータを利用する。
本手法は,シングルラベルおよびマルチラベル画像分類のシナリオにおいて,最先端の半教師付き学習手法よりも優れる。
論文 参考訳(メタデータ) (2020-05-15T06:57:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。