論文の概要: Can virtual staining for high-throughput screening generalize?
- arxiv url: http://arxiv.org/abs/2407.06979v3
- Date: Mon, 30 Sep 2024 08:51:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:01:52.218887
- Title: Can virtual staining for high-throughput screening generalize?
- Title(参考訳): 高スループットスクリーニングのための仮想染色は一般化できるか?
- Authors: Samuel Tonks, Cuong Nguyen, Steve Hood, Ryan Musso, Ceridwen Hopely, Steve Titus, Minh Doan, Iain Styles, Alexander Krull,
- Abstract要約: 本研究は,HTSで一般的に見られる3種類の細胞型(肺,卵巣,乳房)と2種類の表現型(毒性および非毒性)のデータが仮想染色モデルを効果的に訓練できるかどうかを系統的に検討した。
我々は、ピクセルベース、インスタンスワイド、生物学的機能ベースの各レベルのモデルの一般化能力を評価する。
本研究は,非毒性条件試料を用いた仮想核・細胞質モデルの訓練が毒性条件試料に一般化するだけでなく,すべての評価レベルの性能向上につながることを示唆している。
- 参考スコア(独自算出の注目度): 37.17334991675155
- License:
- Abstract: The large volume and variety of imaging data from high-throughput screening (HTS) in the pharmaceutical industry present an excellent resource for training virtual staining models. However, the potential of models trained under one set of experimental conditions to generalize to other conditions remains underexplored. This study systematically investigates whether data from three cell types (lung, ovarian, and breast) and two phenotypes (toxic and non-toxic conditions) commonly found in HTS can effectively train virtual staining models to generalize across three typical HTS distribution shifts: unseen phenotypes, unseen cell types, and the combination of both. Utilizing a dataset of 772,416 paired bright-field, cytoplasm, nuclei, and DNA-damage stain images, we evaluate the generalization capabilities of models across pixel-based, instance-wise, and biological-feature-based levels. Our findings indicate that training virtual nuclei and cytoplasm models on non-toxic condition samples not only generalizes to toxic condition samples but leads to improved performance across all evaluation levels compared to training on toxic condition samples. Generalization to unseen cell types shows variability depending on the cell type; models trained on ovarian or lung cell samples often perform well under other conditions, while those trained on breast cell samples consistently show poor generalization. Generalization to unseen cell types and phenotypes shows good generalization across all levels of evaluation compared to addressing unseen cell types alone. This study represents the first large-scale, data-centric analysis of the generalization capability of virtual staining models trained on diverse HTS datasets, providing valuable strategies for experimental training data generation.
- Abstract(参考訳): 製薬業界における高スループットスクリーニング(HTS)からの大量の画像データは、仮想染色モデルのトレーニングに優れた資源を提供する。
しかし、ある実験条件の下で訓練されたモデルが他の条件に一般化する可能性については、まだ未解明のままである。
本研究は,HTSに共通する3種類の細胞型(肺,卵巣,乳房)と2種類の表現型(毒性,非毒性)から得られたデータを用いて,仮想染色モデルを効果的に訓練し,3つの典型的なHTS分布シフト – 見えない表現型,見えない細胞型,および両者の組み合わせを一般化するか否かを系統的に検討した。
772,416対の明るさ場、細胞質、核、DNA損傷染色画像のデータセットを用いて、ピクセルベース、インスタンスワイド、生物学的機能ベースのモデルの一般化能力を評価する。
本研究は,非毒性条件試料の仮想核および細胞質モデルのトレーニングが毒性条件試料に一般化するだけでなく,毒性条件試料のトレーニングと比較して,すべての評価レベルにおける性能の向上につながることを示唆している。
卵巣または肺の細胞サンプルで訓練されたモデルは、他の条件下ではよく機能するが、乳房の細胞サンプルで訓練されたモデルは、常に低い一般化を示す。
未確認の細胞型や表現型への一般化は、未確認の細胞型のみに対処するよりも、あらゆるレベルの評価において良好な一般化を示す。
本研究は、多様なHTSデータセットに基づいてトレーニングされた仮想染色モデルの一般化能力に関する、初めて大規模なデータ中心分析を行い、実験的なデータ生成のための貴重な戦略を提供する。
関連論文リスト
- DinoBloom: A Foundation Model for Generalizable Cell Embeddings in Hematology [1.3551232282678036]
血液学における単細胞画像の最初の基盤モデルであるDinoBloomを紹介した。
本モデルは末梢血と骨髄のスミアの13種類の多種多様な公開データセットの広範囲な収集に基づいて構築されている。
4つのDinoBloomモデルのファミリーは、幅広い下流アプリケーションに適応することができる。
論文 参考訳(メタデータ) (2024-04-07T17:25:52Z) - StainDiffuser: MultiTask Dual Diffusion Model for Virtual Staining [1.9029890402585894]
ヘマトキシリンとエオシン(H&E)染色は、疾患の診断や腫瘍再発追跡に最もよく用いられる。
ディープラーニングモデルは、画像から画像への変換(I2I)を重要な研究領域とし、高価な物理的染色プロセスの必要性を減らす。
StainDiffuserは、仮想染色のための新しい二重拡散アーキテクチャであり、限られたトレーニング予算の下で収束する。
論文 参考訳(メタデータ) (2024-03-17T20:47:52Z) - A Continual Learning Approach for Cross-Domain White Blood Cell
Classification [36.482007703764154]
白血球分類におけるクラスインクリメンタルおよびドメインインクリメンタルシナリオに対するリハーサルに基づく連続学習手法を提案する。
従来のタスクから代表サンプルを選択するために,モデルの予測に基づいてセット選択を用いる。
色,解像度,クラス組成が異なる3つの白血球分類データセットについて,提案手法を徹底的に評価した。
論文 参考訳(メタデータ) (2023-08-24T09:38:54Z) - A Conditional Flow Variational Autoencoder for Controllable Synthesis of
Virtual Populations of Anatomy [76.20367415712867]
本稿では,正規化フローを用いた条件付き変分オートエンコーダ(cVAE)を提案する。
2360例の心左心室データを用いた条件流VAEの性能について検討した。
論文 参考訳(メタデータ) (2023-06-26T13:23:52Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Imbalanced Domain Generalization for Robust Single Cell Classification
in Hematological Cytomorphology [3.7007225479462402]
我々は、ドメイン間データの不均衡とドメインシフトに対処して、WBC分類のための堅牢なCNNを訓練する。
提案手法は,既存手法と比較してF1マクロスコアが最適である。
論文 参考訳(メタデータ) (2023-03-14T10:20:31Z) - Interpretable Single-Cell Set Classification with Kernel Mean Embeddings [14.686560033030101]
Kernel Mean Embeddingは、各プロファイルされた生物学的サンプルの細胞景観をエンコードする。
簡単な線形分類器を訓練し、3つのフローおよび質量データセットの最先端の分類精度を実現する。
論文 参考訳(メタデータ) (2022-01-18T21:40:36Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A General Framework for Survival Analysis and Multi-State Modelling [70.31153478610229]
ニューラル常微分方程式を多状態生存モデル推定のためのフレキシブルで一般的な方法として用いる。
また,本モデルでは,サバイバルデータセット上での最先端性能を示すとともに,マルチステート環境での有効性を示す。
論文 参考訳(メタデータ) (2020-06-08T19:24:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。