論文の概要: Compressing Biology: Evaluating the Stable Diffusion VAE for Phenotypic Drug Discovery
- arxiv url: http://arxiv.org/abs/2510.19887v1
- Date: Wed, 22 Oct 2025 16:16:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.521488
- Title: Compressing Biology: Evaluating the Stable Diffusion VAE for Phenotypic Drug Discovery
- Title(参考訳): 圧縮生物学 : フェノタイプ薬剤発見のための安定拡散型VAEの評価
- Authors: Télio Cropsal, Rocío Mercado,
- Abstract要約: セルペイント画像の再構成のためのSDVAE(Stable Diffusion's variational autoencoder)の最初の体系的評価を行った。
SDVAEの再構成は,表現型シグナルを最小限の損失で保存し,顕微鏡での使用をサポートすることが確認された。
本研究は, 顕微鏡データにおける生成モデル評価のための実践的ガイドラインを提供し, 表現型薬物発見における既成モデルの利用を支援する。
- 参考スコア(独自算出の注目度): 0.8594140167290097
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: High-throughput phenotypic screens generate vast microscopy image datasets that push the limits of generative models due to their large dimensionality. Despite the growing popularity of general-purpose models trained on natural images for microscopy data analysis, their suitability in this domain has not been quantitatively demonstrated. We present the first systematic evaluation of Stable Diffusion's variational autoencoder (SD-VAE) for reconstructing Cell Painting images, assessing performance across a large dataset with diverse molecular perturbations and cell types. We find that SD-VAE reconstructions preserve phenotypic signals with minimal loss, supporting its use in microscopy workflows. To benchmark reconstruction quality, we compare pixel-level, embedding-based, latent-space, and retrieval-based metrics for a biologically informed evaluation. We show that general-purpose feature extractors like InceptionV3 match or surpass publicly available bespoke models in retrieval tasks, simplifying future pipelines. Our findings offer practical guidelines for evaluating generative models on microscopy data and support the use of off-the-shelf models in phenotypic drug discovery.
- Abstract(参考訳): 高スループットの表現型スクリーンは、その大きな次元のために生成モデルの限界を押し上げる巨大な顕微鏡画像データセットを生成する。
顕微鏡データ解析のための自然画像で訓練された汎用モデルの普及にもかかわらず、この領域におけるそれらの適合性は定量的に証明されていない。
本稿では, セルペイント画像の再構成のためのSD-VAE (Stable Diffusion's variational autoencoder) を初めて体系的に評価し, 多様な分子摂動と細胞型を有する大規模データセットの性能評価を行った。
SD-VAE再構成は, 最小損失の表現型信号を保存し, 顕微鏡ワークフローでの使用を支援する。
再現性を評価するため, 生体情報を用いた評価のために, 画素レベル, 埋め込みベース, 潜時空間, 検索ベースメトリクスを比較した。
InceptionV3のような汎用的特徴抽出器は,検索タスクにおいて,一般に利用可能なbespokeモデルにマッチするか,あるいは超越しているかを示し,将来のパイプラインを簡素化する。
本研究は, 顕微鏡データにおける生成モデル評価のための実践的ガイドラインを提供し, 表現型薬物発見における既成モデルの利用を支援する。
関連論文リスト
- Deep Learning for Taxol Exposure Analysis: A New Cell Image Dataset and Attention-Based Baseline Model [1.755209318470883]
細胞レベルでの薬剤であるタキソールの効果のモニタリングは臨床評価と生医学研究の両方において重要である。
深層学習のアプローチは、医学的および生物学的画像解析において大きな可能性を秘めている。
現在、タキソール曝露に対する細胞反応の自動形態学的解析のための公開データセットは存在しない。
論文 参考訳(メタデータ) (2025-08-20T01:41:26Z) - Disentangled representations of microscopy images [0.9849635250118911]
本研究は、顕微鏡画像分類のためのモデル解釈可能性を高めるために、DRL法を提案する。
本稿では,合成データから学習した表現の伝達に基づくDRLフレームワークが,この領域における精度と解釈可能性とのトレードオフを良好に実現できることを示す。
論文 参考訳(メタデータ) (2025-06-25T17:44:37Z) - Revisiting Automatic Data Curation for Vision Foundation Models in Digital Pathology [41.34847597178388]
視覚基盤モデル(FM)は、全スライディング画像から抽出された高度に異質なタイルの組織学的特徴を表現することを学ぶ。
タイルレベルでの教師なし自動データキュレーションの可能性について検討し,3億5000万個のタイルを考慮に入れた。
論文 参考訳(メタデータ) (2025-03-24T14:23:48Z) - Revealing Subtle Phenotypes in Small Microscopy Datasets Using Latent Diffusion Models [0.815557531820863]
本稿では,事前学習した潜伏拡散モデルを用いて,微妙な表現型変化を明らかにする手法を提案する。
本研究は, 視覚的特徴と知覚的差異の両方を捉えることで, 表現型変化を効果的に検出できることを示す。
論文 参考訳(メタデータ) (2025-02-12T15:45:19Z) - Dataset Distillation for Histopathology Image Classification [46.04496989951066]
病理画像データセット(Histo-DD)に適した新しいデータセット蒸留アルゴリズムを提案する。
提案アルゴリズムの有効性を総合的に評価し, パッチレベルとスライドレベルの両方の分類タスクにおいて, 組織学的サンプルを生成する。
論文 参考訳(メタデータ) (2024-08-19T05:53:38Z) - Masked Autoencoders for Microscopy are Scalable Learners of Cellular Biology [2.7280901660033643]
本研究は、弱教師付き分類器と自己教師付きマスク付きオートエンコーダ(MAE)のスケーリング特性について検討する。
以上の結果から,ViTをベースとしたMAEは,様々なタスクにおいて弱い教師付き分類器よりも優れており,公的なデータベースから得られた既知の生物学的関係を思い出すと,11.5%の相対的な改善が達成されることがわかった。
我々は、異なる数のチャネルと順序の画像を推論時に入力できる新しいチャネルに依存しないMAEアーキテクチャ(CA-MAE)を開発した。
論文 参考訳(メタデータ) (2024-04-16T02:42:06Z) - DinoBloom: A Foundation Model for Generalizable Cell Embeddings in Hematology [1.3551232282678036]
血液学における単細胞画像の最初の基盤モデルであるDinoBloomを紹介した。
本モデルは末梢血と骨髄のスミアの13種類の多種多様な公開データセットの広範囲な収集に基づいて構築されている。
4つのDinoBloomモデルのファミリーは、幅広い下流アプリケーションに適応することができる。
論文 参考訳(メタデータ) (2024-04-07T17:25:52Z) - Latent Space Energy-based Model for Fine-grained Open Set Recognition [46.0388856095674]
微細なオープンセット認識(FineOSR)は、未知のクラスのイメージを拒絶しながら、微妙な外観の違いを持つクラスに属する画像を認識することを目的としている。
生成モデルの一種として、エネルギーベースモデル(EBM)は、生成的タスクと識別的タスクのハイブリッドモデリングのポテンシャルである。
本稿では,OSRの精密な視覚空間におけるエネルギーに基づく事前分布を用いた低次元潜伏空間について検討する。
論文 参考訳(メタデータ) (2023-09-19T16:00:09Z) - GSURE-Based Diffusion Model Training with Corrupted Data [35.56267114494076]
本稿では, 劣化データのみに基づく生成拡散モデルのための新しいトレーニング手法を提案する。
顔画像と磁気共鳴画像(MRI)の撮影技術について紹介する。
論文 参考訳(メタデータ) (2023-05-22T15:27:20Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。