論文の概要: Diversity by Design: Addressing Mode Collapse Improves scRNA-seq Perturbation Modeling on Well-Calibrated Metrics
- arxiv url: http://arxiv.org/abs/2506.22641v1
- Date: Fri, 27 Jun 2025 21:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.497333
- Title: Diversity by Design: Addressing Mode Collapse Improves scRNA-seq Perturbation Modeling on Well-Calibrated Metrics
- Title(参考訳): 設計による多様性: 対応モードの崩壊により、よく校正されたメトリクス上のscRNA-seq摂動モデルが改善される
- Authors: Gabriel M. Mejia, Henry E. Miller, Francis J. A. Leblanc, Bo Wang, Brendan Swain, Lucas Paulo de Lima Camillo,
- Abstract要約: 最近のベンチマークでは、単一セルの摂動応答のモデルは、データセットの平均を単に予測することで、しばしば性能が向上することが示された。
制御参照デルタと非重み付きエラーメトリクスの報酬モードは、制御がバイアスを受けたり、生物学的信号がスパースであったりすると、崩壊する。
高感度のニッチ信号における誤差を計測する全ての摂動に対して、差分式遺伝子(DEG)対応メトリクス、重み付き平均二乗誤差(WMSE)および重み付きデルタ$R2$(R2_w(Delta)$)を導入する。
- 参考スコア(独自算出の注目度): 1.756284691863048
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recent benchmarks reveal that models for single-cell perturbation response are often outperformed by simply predicting the dataset mean. We trace this anomaly to a metric artifact: control-referenced deltas and unweighted error metrics reward mode collapse whenever the control is biased or the biological signal is sparse. Large-scale \textit{in silico} simulations and analysis of two real-world perturbation datasets confirm that shared reference shifts, not genuine biological change, drives high performance in these evaluations. We introduce differentially expressed gene (DEG)-aware metrics, weighted mean-squared error (WMSE) and weighted delta $R^{2}$ ($R^{2}_{w}(\Delta)$) with respect to all perturbations, that measure error in niche signals with high sensitivity. We further introduce negative and positive performance baselines to calibrate these metrics. With these improvements, the mean baseline sinks to null performance while genuine predictors are correctly rewarded. Finally, we show that using WMSE as a loss function reduces mode collapse and improves model performance.
- Abstract(参考訳): 最近のベンチマークでは、単一セルの摂動応答のモデルは、データセットの平均を単に予測することで、しばしば性能が向上することが示された。
制御参照デルタと非重み付きエラーメトリクスの報酬モードは、制御がバイアスを受けたり、生物学的信号がスパースであったりすると、崩壊する。
2つの実世界の摂動データセットの大規模シミュレーションと解析により、実際の生物学的変化ではなく共有参照シフトがこれらの評価において高いパフォーマンスをもたらすことが確認された。
高感度のニッチ信号における誤差を計測する全ての摂動に対して、差分表現された遺伝子(DEG)対応メトリクス、重み付き平均二乗誤差(WMSE)および重み付きデルタ$R^{2}$(R^{2}_{w}(\Delta)$)を導入する。
さらに、これらのメトリクスをキャリブレーションするために、ネガティブかつポジティブなパフォーマンスベースラインを導入します。
これらの改善により、平均ベースラインはnullパフォーマンスにシンクし、真の予測子は正しく報奨される。
最後に,WMSEを損失関数として使用するとモード崩壊が減少し,モデル性能が向上することを示す。
関連論文リスト
- Strengthening Anomaly Awareness [0.0]
我々は、教師なし異常検出の強化を目的とした、異常認識フレームワークの洗練されたバージョンを提案する。
本稿では,2段階のトレーニング戦略を通じて,変分オートエンコーダ(VAE)の最小限の監視を導入する。
論文 参考訳(メタデータ) (2025-04-15T16:52:22Z) - Rao-Blackwell Gradient Estimators for Equivariant Denoising Diffusion [41.50816120270017]
分子やタンパク質の生成のようなドメインでは、物理系はモデルにとって重要な固有の対称性を示す。
学習のばらつきを低減し、確率的に低い分散勾配推定器を提供するフレームワークを提案する。
また,軌道拡散法(Orbit Diffusion)と呼ばれる手法を用いて,損失とサンプリングの手順を取り入れた推定器の実用的実装を提案する。
論文 参考訳(メタデータ) (2025-02-14T03:26:57Z) - Understanding the robustness difference between stochastic gradient
descent and adaptive gradient methods [11.895321856533934]
勾配降下法(SGD)と適応勾配法はディープニューラルネットワークの訓練に広く用いられている。
これらの手法を用いて訓練したモデルの標準一般化性能の差は小さいが、SGDを用いて訓練したモデルは入力摂動下でははるかに頑健であることを示す。
論文 参考訳(メタデータ) (2023-08-13T07:03:22Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - BCD Nets: Scalable Variational Approaches for Bayesian Causal Discovery [97.79015388276483]
構造方程式モデル(SEM)は、有向非巡回グラフ(DAG)を介して表される因果関係を推論する効果的な枠組みである。
近年の進歩により、観測データからDAGの有効最大点推定が可能となった。
線形ガウス SEM を特徴付ける DAG 上の分布を推定するための変分フレームワークである BCD Nets を提案する。
論文 参考訳(メタデータ) (2021-12-06T03:35:21Z) - On the Double Descent of Random Features Models Trained with SGD [78.0918823643911]
勾配降下(SGD)により最適化された高次元におけるランダム特徴(RF)回帰特性について検討する。
本研究では, RF回帰の高精度な非漸近誤差境界を, 定常および適応的なステップサイズSGD設定の下で導出する。
理論的にも経験的にも二重降下現象を観察する。
論文 参考訳(メタデータ) (2021-10-13T17:47:39Z) - Regression Bugs Are In Your Model! Measuring, Reducing and Analyzing
Regressions In NLP Model Updates [68.09049111171862]
この研究は、NLPモデル更新における回帰エラーの定量化、低減、分析に重点を置いている。
回帰フリーモデル更新を制約付き最適化問題に定式化する。
モデルアンサンブルが回帰を減らす方法を実証的に分析します。
論文 参考訳(メタデータ) (2021-05-07T03:33:00Z) - Evaluating Prediction-Time Batch Normalization for Robustness under
Covariate Shift [81.74795324629712]
我々は予測時間バッチ正規化と呼び、共変量シフト時のモデル精度とキャリブレーションを大幅に改善する。
予測時間バッチ正規化は、既存の最先端アプローチに相補的な利点をもたらし、ロバスト性を向上させることを示します。
この手法は、事前トレーニングと併用して使用すると、さまざまな結果が得られるが、より自然なタイプのデータセットシフトでは、パフォーマンスが良くないようだ。
論文 参考訳(メタデータ) (2020-06-19T05:08:43Z) - When Does Preconditioning Help or Hurt Generalization? [74.25170084614098]
本稿では,第1次および第2次手法のテキスト単純バイアスが一般化特性の比較にどのように影響するかを示す。
本稿では、バイアス分散トレードオフを管理するためのいくつかのアプローチと、GDとNGDを補間する可能性について論じる。
論文 参考訳(メタデータ) (2020-06-18T17:57:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。