論文の概要: Reinforcement Learning for Control of Non-Markovian Cellular Population Dynamics
- arxiv url: http://arxiv.org/abs/2410.08439v1
- Date: Fri, 11 Oct 2024 01:02:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-10-31 03:16:22.984632
- Title: Reinforcement Learning for Control of Non-Markovian Cellular Population Dynamics
- Title(参考訳): 非マルコフ細胞集団動態の制御のための強化学習
- Authors: Josiah C. Kratz, Jacob Adamczyk,
- Abstract要約: 我々は、新しい非マルコフ力学の下で進化する細胞集団を制御するために、情報量戦略の同定に強化学習を適用した。
モデルのない深部RLは、長距離時間力学の存在下でも正確な解を回復し、細胞集団を制御することができる。
- 参考スコア(独自算出の注目度): 1.03590082373586
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many organisms and cell types, from bacteria to cancer cells, exhibit a remarkable ability to adapt to fluctuating environments. Additionally, cells can leverage memory of past environments to better survive previously-encountered stressors. From a control perspective, this adaptability poses significant challenges in driving cell populations toward extinction, and is thus an open question with great clinical significance. In this work, we focus on drug dosing in cell populations exhibiting phenotypic plasticity. For specific dynamical models switching between resistant and susceptible states, exact solutions are known. However, when the underlying system parameters are unknown, and for complex memory-based systems, obtaining the optimal solution is currently intractable. To address this challenge, we apply reinforcement learning (RL) to identify informed dosing strategies to control cell populations evolving under novel non-Markovian dynamics. We find that model-free deep RL is able to recover exact solutions and control cell populations even in the presence of long-range temporal dynamics.
- Abstract(参考訳): 細菌からがん細胞に至るまで、多くの生物や細胞は、変動する環境に適応する顕著な能力を示す。
さらに、細胞は過去の環境の記憶を利用して、以前記録されたストレスを生き残ることができる。
制御の観点からは、この適応性は細胞集団を絶滅へと駆り立てる上で重要な課題となり、臨床上大きな意味を持つオープンな問題となっている。
本研究では,表現型可塑性を示す細胞集団における薬物投与に焦点を当てた。
抵抗状態と感受性状態の間を切り替える特定の力学モデルについては、正確な解が知られている。
しかし、基礎となるシステムパラメータが不明で、複雑なメモリベースのシステムでは、最適解を得るのは難解である。
この課題に対処するために、新しい非マルコフ力学の下で進化する細胞集団を制御するための情報量削減戦略の同定に強化学習(RL)を適用した。
モデルのない深部RLは、長距離時間力学の存在下でも正確な解を回復し、細胞集団を制御することができる。
関連論文リスト
- Online Control in Population Dynamics [32.09385328027713]
オンライン制御のパラダイムに基づく新しいフレームワークを提案する。
まず、進化する個体群を自然にモデル化できる線形力学系の集合を特徴づける。
次に、これらのシステムに対して、ほぼ最適の後悔境界を持つ効率的な勾配ベースの制御を与える。
論文 参考訳(メタデータ) (2024-06-03T21:40:59Z) - HAZARD Challenge: Embodied Decision Making in Dynamically Changing
Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。
このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文 参考訳(メタデータ) (2024-01-23T18:59:43Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - GENOT: Entropic (Gromov) Wasserstein Flow Matching with Applications to Single-Cell Genomics [20.01834405021846]
単細胞ゲノム学は、細胞行動の理解を深め、治療や精密医療の革新を触媒している。
従来の離散的なソルバは、スケーラビリティ、プライバシ、サンプル外推定の問題によって妨げられています。
我々は、OTマップをパラメータ化するニューラルネットワークベースの解法である、ニューラルOTソルバを提案する。
本研究は, 細胞開発研究, 細胞性薬物応答モデリング, 細胞間翻訳への応用を通じて, その汎用性と堅牢性を実証する。
論文 参考訳(メタデータ) (2023-10-13T17:12:04Z) - Predictive Experience Replay for Continual Visual Control and
Forecasting [62.06183102362871]
視覚力学モデリングのための新しい連続学習手法を提案し,その視覚制御と予測における有効性について検討する。
まず,タスク固有のダイナミクスをガウスの混合で学習する混合世界モデルを提案し,その上で,破滅的な忘れを克服するための新たなトレーニング戦略を提案する。
我々のモデルは,DeepMind Control と Meta-World のベンチマークにおいて,既存の連続的学習アルゴリズムと視覚的RLアルゴリズムの単純な組み合わせよりも優れている。
論文 参考訳(メタデータ) (2023-03-12T05:08:03Z) - The scaling of goals via homeostasis: an evolutionary simulation,
experiment and analysis [0.0]
本研究では, 形態形成過程における細胞の集合的知能を, ホメオスタティックプロセスの中心における目標状態をスケールアップすることによって, 行動知能に転換することを提案する。
これらの創発性形態形成因子は、その標的形態学を達成するために応力伝播ダイナミクスの使用を含む、多くの予測された特徴を示す。
本研究では, 進化が最小目標指向行動(ホメオスタティックループ)をどのように高次問題解決剤に拡大するかを, 定量的に把握するための第一歩として提案する。
論文 参考訳(メタデータ) (2022-11-15T21:48:44Z) - Data-driven control of spatiotemporal chaos with reduced-order neural
ODE-based models and reinforcement learning [0.0]
ディープラーニングは、高次元システムの複雑な制御戦略を発見することができ、フロー制御アプリケーションに期待できる。
RLに関連する大きな課題は、ターゲットシステムと繰り返し対話することによって、実質的なトレーニングデータを生成する必要があることだ。
我々は、RLトレーニング中に真のシステムを配置したデータ駆動リダクション・オーダー・モデル(ROM)を用いて、最適なポリシーを効率的に推定する。
ROMベースの制御戦略は真のKSEによく似ており、RLエージェントがKSEシステムの根底にある強制平衡解を発見し、安定化することを強調する。
論文 参考訳(メタデータ) (2022-05-01T23:25:44Z) - Information is Power: Intrinsic Control via Information Capture [110.3143711650806]
我々は,潜時状態空間モデルを用いて推定したエージェントの状態訪問のエントロピーを最小化する,コンパクトで汎用的な学習目的を論じる。
この目的は、不確実性の低減に対応する環境情報収集と、将来の世界状態の予測不可能性の低減に対応する環境制御の両方をエージェントに誘導する。
論文 参考訳(メタデータ) (2021-12-07T18:50:42Z) - Towards self-organized control: Using neural cellular automata to
robustly control a cart-pole agent [62.997667081978825]
我々は、カートポールエージェントを制御するために、ニューラルセルオートマトンを使用する。
我々は、Q値の推定値として出力セルの状態を用いる深層学習を用いてモデルを訓練した。
論文 参考訳(メタデータ) (2021-06-29T10:49:42Z) - Constrained plasticity reserve as a natural way to control frequency and
weights in spiking neural networks [0.0]
細胞動力学は神経細胞が激しいシグナルをフィルターして、ニューロンの発火速度を安定させるのにどのように役立つかを示す。
このようなアプローチは、AIシステムの堅牢性を改善するために、機械学習領域で使用される可能性がある。
論文 参考訳(メタデータ) (2021-03-15T05:22:14Z) - An Optimal Control Approach to Learning in SIDARTHE Epidemic model [67.22168759751541]
本研究では,疫病データから動的コンパートメンタルモデルの時間変化パラメータを学習するための一般的な手法を提案する。
我々はイタリアとフランスの疫病の進化を予報する。
論文 参考訳(メタデータ) (2020-10-28T10:58:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。