論文の概要: Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal
- arxiv url: http://arxiv.org/abs/2602.17532v1
- Date: Thu, 19 Feb 2026 16:43:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-20 15:21:29.217011
- Title: Systematic Evaluation of Single-Cell Foundation Model Interpretability Reveals Attention Captures Co-Expression Rather Than Unique Regulatory Signal
- Title(参考訳): 単一セルモデル解釈可能性の体系的評価
- Authors: Ihor Kendiukhov,
- Abstract要約: 単一セル基礎モデルにおける機械的解釈可能性を評価するための枠組みを提案する。
このフレームワークを scGPT と Geneformer に適用すると、注意パターンが構造化された生体情報を層固有の組織にエンコードしていることが分かる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a systematic evaluation framework - thirty-seven analyses, 153 statistical tests, four cell types, two perturbation modalities - for assessing mechanistic interpretability in single-cell foundation models. Applying this framework to scGPT and Geneformer, we find that attention patterns encode structured biological information with layer-specific organisation - protein-protein interactions in early layers, transcriptional regulation in late layers - but this structure provides no incremental value for perturbation prediction: trivial gene-level baselines outperform both attention and correlation edges (AUROC 0.81-0.88 versus 0.70), pairwise edge scores add zero predictive contribution, and causal ablation of regulatory heads produces no degradation. These findings generalise from K562 to RPE1 cells; the attention-correlation relationship is context-dependent, but gene-level dominance is universal. Cell-State Stratified Interpretability (CSSI) addresses an attention-specific scaling failure, improving GRN recovery up to 1.85x. The framework establishes reusable quality-control standards for the field.
- Abstract(参考訳): 本研究では, 単一セル基礎モデルにおける機械的解釈可能性を評価するための, 系統的評価フレームワークとして, 解析結果(30), 統計的検査153, 細胞タイプ4, 摂動モード2について述べる。
このフレームワークを scGPT と Geneformer に適用すると、アテンションパターンは、構造された生物学的情報を層固有の組織 - 初期層におけるタンパク質とタンパク質の相互作用、後期層における転写調節 - でエンコードしていることが分かるが、この構造は摂動予測にインクリメンタルな価値を与えていない: 自明な遺伝子レベルのベースラインは、注目と相関の双方のエッジ(AUROC 0.81-0.88 vs 0.70)より優れ、対角のエッジスコアは予測的寄与をゼロにし、規制ヘッドの因果的アブレーションは劣化しない。
これらの発見は、K562からRPE1細胞への一般化であり、注意相関関係は文脈依存性であるが、遺伝子レベルでの優位性は普遍的である。
Cell-State Stratified Interpretability (CSSI)は、注意固有のスケーリング障害に対処し、GRNのリカバリを1.85倍に改善する。
このフレームワークは、この分野における再利用可能な品質管理基準を確立する。
関連論文リスト
- Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction [48.80217316452559]
scBIGは、協調した遺伝子プログラムを明示的にモデル化するモジュール誘導予測フレームワークである。
scBIGは、特に目に見えない、摂動的な設定において、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2026-02-03T16:43:40Z) - Automated Identification of Incidentalomas Requiring Follow-Up: A Multi-Anatomy Evaluation of LLM-Based and Supervised Approaches [5.958100741754613]
インシデントアロマの微細な病変レベル検出のために,大規模言語モデル(LLM)を教師付きベースラインと比較した。
そこで我々は,病変タグ付き入力と解剖学的認識を用いた新しい推論手法を導入し,基礎モデル推論を推し進めた。
解剖学的インフォームドGPT-OSS-20bモデルが最も高い性能を示し, 奇形腫陽性マクロF1の0.79。
論文 参考訳(メタデータ) (2025-12-05T08:49:57Z) - CONFIDE: Hallucination Assessment for Reliable Biomolecular Structure Prediction and Design [46.12506067241116]
本稿では,位相的フラストレーションを定量化する自己評価尺度であるCODE(Chain of Diffusion Embeddings)を提案する。
エネルギー的およびトポロジ的視点を組み合わせた統合評価フレームワークであるCONFIDEを提案する。
データ駆動の埋め込みと理論的な洞察を組み合わせることで、CODEとConFIDEは、幅広い生体分子システムで既存の指標より優れています。
論文 参考訳(メタデータ) (2025-11-20T03:38:46Z) - Soft Graph Clustering for single-cell RNA Sequencing Data [15.648907695773701]
シングルセルRNAシークエンシングデータのためのソフトグラフクラスタリングである scSGC を導入する。
scSGCは、非バイナリエッジウェイトにより、細胞間の連続的な類似性をより正確に特徴付けることを目的としている。
クラスタリング精度、セルタイプアノテーション、計算効率において、13の最先端クラスタリングモデルより優れています。
論文 参考訳(メタデータ) (2025-07-14T03:49:12Z) - DISPROTBENCH: A Disorder-Aware, Task-Rich Benchmark for Evaluating Protein Structure Prediction in Realistic Biological Contexts [76.59606029593085]
DisProtBenchは、構造障害および複雑な生物学的条件下でタンパク質構造予測モデル(PSPM)を評価するためのベンチマークである。
DisProtBenchはデータの複雑さ、タスクの多様性、解釈可能性という3つの重要な軸にまたがっている。
その結果,機能的予測障害と相関する低信頼領域を有する障害下でのモデルロバスト性に有意な変動が認められた。
論文 参考訳(メタデータ) (2025-06-18T23:58:22Z) - GRNFormer: A Biologically-Guided Framework for Integrating Gene Regulatory Networks into RNA Foundation Models [39.58414436685698]
マルチオミクスデータから推定されるマルチスケール遺伝子制御ネットワーク(GRN)をRNA基盤モデルトレーニングに統合する新しいフレームワークを提案する。
GRNFormerは、最先端(SoTA)ベースラインに対して一貫した改善を実現している。
論文 参考訳(メタデータ) (2025-03-03T15:56:39Z) - Single-Cell Deep Clustering Method Assisted by Exogenous Gene
Information: A Novel Approach to Identifying Cell Types [50.55583697209676]
我々は,細胞間のトポロジ的特徴を効率的に捉えるために,注目度の高いグラフオートエンコーダを開発した。
クラスタリング過程において,両情報の集合を統合し,細胞と遺伝子の特徴を再構成し,識別的表現を生成する。
本研究は、細胞の特徴と分布に関する知見を高め、疾患の早期診断と治療の基礎となる。
論文 参考訳(メタデータ) (2023-11-28T09:14:55Z) - Learning to diagnose cirrhosis from radiological and histological labels
with joint self and weakly-supervised pretraining strategies [62.840338941861134]
そこで本稿では, 放射線学者が注釈付けした大規模データセットからの転写学習を活用して, 小さい付加データセットで利用できる組織学的スコアを予測することを提案する。
我々は,肝硬変の予測を改善するために,異なる事前訓練法,すなわち弱い指導法と自己指導法を比較した。
この方法は、METAVIRスコアのベースライン分類を上回り、AUCが0.84、バランスの取れた精度が0.75に達する。
論文 参考訳(メタデータ) (2023-02-16T17:06:23Z) - Granger causal inference on DAGs identifies genomic loci regulating
transcription [77.58911272503771]
GrID-Netは、DBG構造化システムにおけるGranger因果推論のためのラタグメッセージパッシングを備えたグラフニューラルネットワークに基づくフレームワークである。
我々の応用は、特定の遺伝子の調節を仲介するゲノム座を同定する単一セルマルチモーダルデータの解析である。
論文 参考訳(メタデータ) (2022-10-18T21:15:10Z) - An Integrated Deep Learning and Dynamic Programming Method for
Predicting Tumor Suppressor Genes, Oncogenes, and Fusion from PDB Structures [0.0]
プロトオンコジーン(ONGO)の変異と腫瘍抑制遺伝子(TSG)の制御機能の欠如は、腫瘍増殖を制御していない一般的なメカニズムである。
計算研究を通じてONGOやTSGに関連する遺伝子機能の可能性を見つけることは、疾患を標的とする薬物の開発に役立てることができる。
本稿では,入力された3dタンパク質構造情報から特徴地図集合を抽出する前処理段階から開始する分類法を提案する。
論文 参考訳(メタデータ) (2021-05-17T18:18:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。