論文の概要: PhenoBench: A Comprehensive Benchmark for Cell Phenotyping
- arxiv url: http://arxiv.org/abs/2507.03532v2
- Date: Tue, 08 Jul 2025 08:29:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-09 12:20:17.801996
- Title: PhenoBench: A Comprehensive Benchmark for Cell Phenotyping
- Title(参考訳): PhenoBench: 細胞フェノタイピングのための総合ベンチマーク
- Authors: Jerome Luescher, Nora Koreuber, Jannik Franzen, Fabian H. Reith, Claudia Winklmayr, Elias Baumann, Christian M. Schuerch, Dagmar Kainmueller, Josef Lorenz Rumberger,
- Abstract要約: フェノベンチ(PhenoBench)は、ヘマトキシリンとエオシン染色組織像の細胞性形質転換のベンチマークである。
PhenoCellは、多重イメージングを用いて識別された14の粒状細胞を特徴とする新しいデータセットである。
- 参考スコア(独自算出の注目度): 2.3733902580813493
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Digital pathology has seen the advent of a wealth of foundational models (FM), yet to date their performance on cell phenotyping has not been benchmarked in a unified manner. We therefore propose PhenoBench: A comprehensive benchmark for cell phenotyping on Hematoxylin and Eosin (H&E) stained histopathology images. We provide both PhenoCell, a new H&E dataset featuring 14 granular cell types identified by using multiplexed imaging, and ready-to-use fine-tuning and benchmarking code that allows the systematic evaluation of multiple prominent pathology FMs in terms of dense cell phenotype predictions in different generalization scenarios. We perform extensive benchmarking of existing FMs, providing insights into their generalization behavior under technical vs. medical domain shifts. Furthermore, while FMs achieve macro F1 scores > 0.70 on previously established benchmarks such as Lizard and PanNuke, on PhenoCell, we observe scores as low as 0.20. This indicates a much more challenging task not captured by previous benchmarks, establishing PhenoCell as a prime asset for future benchmarking of FMs and supervised models alike. Code and data are available on GitHub.
- Abstract(参考訳): デジタル病理学は、豊富な基礎モデル(FM)の出現を目の当たりにしてきたが、細胞表現学におけるそれらの性能は統一された方法でベンチマークされていない。
そこで我々は,ヘマトキシリンおよびエオシン(H&E)染色組織像に対する細胞表現能の総合的ベンチマークであるPhenoBenchを提案する。
PhenoCellは、多重イメージングを用いて識別された14の粒状細胞型を特徴とする新しいH&Eデータセットであり、様々な一般化シナリオにおける高密度な細胞表現型予測の観点から、複数の顕著なFMを体系的に評価できる準備の整った微調整およびベンチマークコードである。
我々は、既存のFMの広範なベンチマークを行い、医療領域シフトと技術領域シフトの下の一般化行動に関する洞察を提供する。
さらに,PhenoCell の Lizard や PanNuke といった既存のベンチマークでは FM がマクロ F1 スコア > 0.70 を達成する一方,スコアは 0.20 まで低くなる。
これは、以前のベンチマークでは捉えられなかったより困難なタスクを示しており、将来のFMと教師付きモデルのベンチマークのための主要な資産としてPhenoCellを確立している。
コードとデータはGitHubで入手できる。
関連論文リスト
- Benchmarking histopathology foundation models in a multi-center dataset for skin cancer subtyping [1.927195358774599]
大規模なドメイン内データセットの事前トレーニングは、履歴病理基盤モデル(FM)にタスクに依存しないデータ表現を学習する能力を与える。
計算病理学では、スライド全体の自動解析には、スライドのギガピクセルスケールのため、複数のインスタンス学習(MIL)フレームワークが必要である。
本研究は,MIL分類フレームワーク内のパッチレベルの特徴抽出器として,病理組織学的FMを評価するための新しいベンチマークを提案する。
論文 参考訳(メタデータ) (2025-06-23T14:12:16Z) - MIPHEI-ViT: Multiplex Immunofluorescence Prediction from H&E Images using ViT Foundation Models [2.2802322828460864]
我々は、最先端のViT基盤モデルをエンコーダとして統合し、H&E画像からmIF信号を予測するU-NetにインスパイアされたアーキテクチャであるMIPHEIを紹介する。
大腸癌組織から得られた残留H&EおよびmIF画像のORIONデータセットを用いて,本モデルをトレーニングした。
MIPHEIはH&Eだけで正確な細胞型分類を実現しており、Pan-CKは0.88点、CD3eは0.57点、SMAは0.56点、CD68は0.36点、CD20は0.30点である。
論文 参考訳(メタデータ) (2025-05-15T13:42:48Z) - CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - Cell-ontology guided transcriptome foundation model [18.51941953027685]
オープンバイオロジー・バイオメディカルオントロジーファウンデーションの細胞オントロジーグラフにマッピングされた細胞型ラベルを利用して,CellxGeneデータベースから2200万の細胞上でscCelloを事前訓練した。
我々のTFMは、生物学的に重要なタスクにおいて、既存のTFMよりも競合的な一般化と伝達性性能を示す。
論文 参考訳(メタデータ) (2024-08-22T13:15:49Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - UniCell: Universal Cell Nucleus Classification via Prompt Learning [76.11864242047074]
ユニバーサル細胞核分類フレームワーク(UniCell)を提案する。
異なるデータセットドメインから対応する病理画像のカテゴリを均一に予測するために、新しいプロンプト学習機構を採用している。
特に,本フレームワークでは,原子核検出と分類のためのエンドツーエンドアーキテクチャを採用し,フレキシブルな予測ヘッドを用いて様々なデータセットを適応する。
論文 参考訳(メタデータ) (2024-02-20T11:50:27Z) - An evaluation of GPT models for phenotype concept recognition [0.4715973318447338]
臨床表現型および表現型アノテーションのためのGPT(Generative Pre-trained Transformer)モデルの性能について検討した。
その結果、適切な設定で、これらのモデルが芸術的パフォーマンスの状態を達成できることが示されている。
論文 参考訳(メタデータ) (2023-09-29T12:06:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。