論文の概要: Simulation-trained conditional normalizing flows for likelihood approximation: a case study in stress regulation kinetics in yeast
- arxiv url: http://arxiv.org/abs/2506.09374v1
- Date: Wed, 11 Jun 2025 03:44:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 06:35:02.314766
- Title: Simulation-trained conditional normalizing flows for likelihood approximation: a case study in stress regulation kinetics in yeast
- Title(参考訳): 確率近似のためのシミュレーション訓練条件正規化流:酵母のストレス調節動態のケーススタディ
- Authors: Pedro Pessoa, Juan Andres Martinez, Vincent Vandenbroucke, Frank Delvigne, Steve Pressé,
- Abstract要約: 顕著な例は、活発に分裂する細胞のスナップショット測定からタンパク質の産生を推定することである。
ここでの課題は、娘細胞間のタンパク質含量を分割的に正規化することで、非指数的に分散した間隔で発生する細胞分裂に由来する。
シミュレーションデータから抽出可能な確率を近似するために、条件付きフロー(確率分布を学習するために設計されたニューラルネットワークモデルのクラス)を用いる。
- 参考スコア(独自算出の注目度): 1.8802008255570535
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Physics-inspired inference often hinges on the ability to construct a likelihood, or the probability of observing a sequence of data given a model. These likelihoods can be directly maximized for parameter estimation, incorporated into Bayesian frameworks, or even used as loss functions in neural networks. Yet, many models, despite being conceptually simple, lack tractable likelihoods. A notable example arises in estimating protein production from snapshot measurements of actively dividing cells. Here, the challenge stems from cell divisions occurring at non-Exponentially distributed intervals with each division stochastically partitioning protein content between daughter cells, making protein counts in any given cell a function of its full division history. Such history dependence precludes a straightforward likelihood based on a (standard Markovian) master equation. Instead, we employ conditional normalizing flows (a class of neural network models designed to learn probability distributions) to approximate otherwise intractable likelihoods from simulated data. As a case study, we examine activation of the \emph{glc3} gene in yeast involved in glycogen synthesis and expressed under nutrient-limiting conditions. We monitor this activity using snapshot fluorescence measurements via flow cytometry, where GFP expression reflects \emph{glc3} promoter activity. A na\"ive analysis of flow cytometry data ignoring cell division suggests many cells are active with low expression. However, fluorescent proteins persist and can be inherited, so cells may appear active from retaining ancestral fluorescence. Explicitly accounting for the (non-Markovian) effects of cell division reveals \emph{glc3} is mostly inactive under stress, showing that while cells occasionally activate it, expression is brief and transient.
- Abstract(参考訳): 物理学に着想を得た推論は、しばしば、モデルに与えられたデータ列を観測する確率や可能性を構築する能力に依存している。
これらの確率はパラメータ推定を直接最大化したり、ベイズフレームワークに組み込んだり、ニューラルネットワークの損失関数として使うこともできる。
しかし、概念的には単純であるにもかかわらず、多くのモデルは難易度を欠いている。
顕著な例は、活発に分裂する細胞のスナップショット測定からタンパク質の産生を推定することである。
ここでの課題は、娘細胞間でタンパク質の内容を確率的に分配し、特定の細胞のタンパク質数をその完全な分裂履歴の関数にする、非指数的に分散された間隔で起こる細胞分裂に由来する。
このような歴史依存は(標準マルコフの)マスター方程式に基づく直近の確率を妨げている。
代わりに、シミュレートされたデータから難解な確率を近似するために、条件付き正規化フロー(確率分布を学習するために設計されたニューラルネットワークモデルのクラス)を用いる。
本研究は,グリコーゲン合成に関わる酵母におけるemph{glc3}遺伝子の活性化と,栄養制限条件下での発現について検討した。
我々はこの活性をフローサイトメトリーによるスナップショット蛍光測定を用いて監視し、GFPの発現は \emph{glc3} プロモーター活性を反映する。
細胞分裂を無視するフローサイトメトリーデータの「Na\」分析は、多くの細胞が低発現で活動していることを示唆している。
しかし、蛍光タンパク質は持続し、遺伝しうるため、細胞は祖先の蛍光を保持することによって活性があるように見える。
細胞分裂の(非マルコフ的な)効果を明示的に説明すると、 \emph{glc3} はストレス下ではほとんど不活性であり、細胞が一時的にそれを活性化する一方で、発現は簡潔で過渡的である。
関連論文リスト
- CellVerse: Do Large Language Models Really Understand Cell Biology? [74.34984441715517]
我々は,4種類のシングルセルマルチオミクスデータを統合する統一言語中心の質問応答ベンチマークであるCellVerseを紹介する。
我々は,CellVerse上で160Mから671Bまでの14のオープンソースおよびクローズドソースLLMの性能を体系的に評価した。
論文 参考訳(メタデータ) (2025-05-09T06:47:23Z) - A scalable gene network model of regulatory dynamics in single cells [88.48246132084441]
本稿では,遺伝子ネットワーク構造を結合微分方程式に組み込んで,遺伝子制御関数をモデル化する機能的学習可能モデルFLeCSを提案する。
FLeCS は (pseudo) 時系列の単一セルデータから, セルの動態を正確に推定する。
論文 参考訳(メタデータ) (2025-03-25T19:19:21Z) - Learning Identifiable Factorized Causal Representations of Cellular Responses [8.730245348529314]
本稿では, 単一細胞摂動データにおける因果構造を明らかにするFCR学習法を提案する。
FCRは、切り離された複数の細胞表現を学習する。
我々は$mathbfz_tx$と$mathbfz_tx$と$mathbfz_tx$のブロック単位の識別可能性を証明する。
論文 参考訳(メタデータ) (2024-10-29T19:05:22Z) - Range, not Independence, Drives Modularity in Biologically Inspired Representations [52.48094670415497]
我々は、生物学的にインスピレーションを受けたネットワークが、ソース変数(ソース)の表現をモジュール化する理論を開発する。
我々は、最適な線形オートエンコーダのニューロンがモジュラー化するかどうかを決定するソースのサンプルに対して、必要かつ十分な条件を導出する。
我々の理論はどんなデータセットにも当てはまり、以前の研究で研究された統計的な独立性よりもはるかに長い。
論文 参考訳(メタデータ) (2024-10-08T17:41:37Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - PhagoStat a scalable and interpretable end to end framework for
efficient quantification of cell phagocytosis in neurodegenerative disease
studies [0.0]
本稿では,食欲活動の定量化と分析を行うためのエンドツーエンド,スケーラブル,汎用的なリアルタイムフレームワークを提案する。
提案するパイプラインでは,大規模なデータセットを処理でき,データ品質検証モジュールも備えている。
我々はこのパイプラインをFTDの微小グリア細胞食細胞解析に応用し,統計的に信頼性の高い結果を得た。
論文 参考訳(メタデータ) (2023-04-26T18:10:35Z) - Curvature-informed multi-task learning for graph networks [56.155331323304]
最先端のグラフニューラルネットワークは、複数の特性を同時に予測しようとする。
この現象の潜在的な説明として、各特性の損失面の曲率が大きく異なり、非効率な学習につながる可能性がある。
論文 参考訳(メタデータ) (2022-08-02T18:18:41Z) - A probabilistic latent variable model for detecting structure in binary
data [0.6767885381740952]
スパースバイナリデータにおけるパターンの雑音や近似的な繰り返しを検出するために,新しい確率的二項潜在変数モデルを導入する。
モデルの能力は、網膜ニューロンから記録された構造を抽出することによって示される。
映画刺激時の網膜神経節細胞に記録されたスパイク応答に本モデルを適用した。
論文 参考訳(メタデータ) (2022-01-26T18:37:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。