論文の概要: Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations
- arxiv url: http://arxiv.org/abs/2303.09056v1
- Date: Thu, 16 Mar 2023 03:13:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:53:32.809921
- Title: Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations
- Title(参考訳): 人工知能を用いた疾患軌跡予測と薬物開発デジタル双生児のための合成多次元分子メディエータ時系列データの生成:考察
- Authors: Gary An and Chase Cockrell
- Abstract要約: 合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
このタイプの合成データを生成する統計的およびデータ中心の機械学習手段の欠如は、要因の組み合わせによるものである。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、仲介者・バイオマーカーに基づくAI予測システムの開発に欠かせない能力である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of synthetic data is recognized as a crucial step in the development
of neural network-based Artificial Intelligence (AI) systems. While the methods
for generating synthetic data for AI applications in other domains have a role
in certain biomedical AI systems, primarily related to image processing, there
is a critical gap in the generation of time series data for AI tasks where it
is necessary to know how the system works. This is most pronounced in the
ability to generate synthetic multi-dimensional molecular time series data
(SMMTSD); this is the type of data that underpins research into biomarkers and
mediator signatures for forecasting various diseases and is an essential
component of the drug development pipeline. We argue the insufficiency of
statistical and data-centric machine learning (ML) means of generating this
type of synthetic data is due to a combination of factors: perpetual data
sparsity due to the Curse of Dimensionality, the inapplicability of the Central
Limit Theorem, and the limits imposed by the Causal Hierarchy Theorem.
Alternatively, we present a rationale for using complex multi-scale
mechanism-based simulation models, constructed and operated on to account for
epistemic incompleteness and the need to provide maximal expansiveness in
concordance with the Principle of Maximal Entropy. These procedures provide for
the generation of SMMTD that minimizes the known shortcomings associated with
neural network AI systems, namely overfitting and lack of generalizability. The
generation of synthetic data that accounts for the identified factors of
multi-dimensional time series data is an essential capability for the
development of mediator-biomarker based AI forecasting systems, and therapeutic
control development and optimization through systems like Drug Development
Digital Twins.
- Abstract(参考訳): 合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
他の領域におけるAIアプリケーションのための合成データを生成する方法は、主に画像処理に関連する特定のバイオメディカルAIシステムにおいて役割を果たすが、システムがどのように機能するかを知る必要があるAIタスクのための時系列データの生成には、重大なギャップがある。
これは合成多次元分子時系列データ(smmtsd)を生成する能力において最も顕著であり、様々な疾患を予測するバイオマーカーやメディエーターシグネチャの研究を支えるデータの一種であり、薬物開発パイプラインの重要な構成要素である。
このタイプの合成データを生成するための統計的およびデータ中心機械学習(ML)手段の欠如は、次元の曲線による永遠のデータ間隔、中央極限定理の適用性、および因果階層定理によって課される制限の2つの要因の組み合わせによるものであると我々は主張する。
あるいは, 複雑なマルチスケール機構に基づくシミュレーションモデルを用いて, エピステミック不完全性や最大エントロピーの原理に従って最大拡張性を提供する必要性を考慮し, 構築・運用する。
これらの手順は、ニューラルネットワークAIシステムに関連する既知の欠点、すなわちオーバーフィットと一般化性の欠如を最小限に抑えるSMMTDの生成を提供する。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、メディエータ・バイオマーカーに基づくAI予測システムの開発に不可欠な機能であり、薬物開発デジタルツインズのようなシステムによる治療制御の開発と最適化である。
関連論文リスト
- Self-learning locally-optimal hypertuning using maximum entropy, and
comparison of machine learning approaches for estimating fatigue life in
composite materials [0.0]
疲労損傷を予測するための最大エントロピーの原理に基づくML近傍近似アルゴリズムを開発した。
予測は、他のMLアルゴリズムと同様、高いレベルの精度を達成する。
論文 参考訳(メタデータ) (2022-10-19T12:20:07Z) - Advancing Reacting Flow Simulations with Data-Driven Models [50.9598607067535]
マルチ物理問題における機械学習ツールの効果的な利用の鍵は、それらを物理モデルとコンピュータモデルに結合することである。
本章では, 燃焼システムにおけるデータ駆動型低次モデリングの適用可能性について概説する。
論文 参考訳(メタデータ) (2022-09-05T16:48:34Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Generating Synthetic Mixed-type Longitudinal Electronic Health Records
for Artificial Intelligent Applications [9.374416143268892]
EHR-M-GAN (Generative Adversarial Network, GAN) は、EHRデータを合成する。
EHR-M-GANは,141,488名の患者を対象とし,3つの公用集中治療単位データベース上で検証した。
論文 参考訳(メタデータ) (2021-12-22T17:17:34Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Automated Biodesign Engineering by Abductive Meta-Interpretive Learning [8.788941848262786]
Abductive Meta-Interpretive Learning($Meta_Abd$)を活用した自動バイオデザインエンジニアリングフレームワークを提案します。
本稿では,Abductive Meta-Interpretive Learning(Meta_Abd$)を活用したバイオデザイン自動工学フレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-17T12:10:26Z) - Artificial Intelligence based Autonomous Molecular Design for Medical
Therapeutic: A Perspective [9.371378627575883]
ドメイン認識機械学習(ML)モデルは、小さな分子治療設計の加速にますます採用されている。
我々は、各コンポーネントによって達成された最新のブレークスルーと、このような自律型AIとMLワークフローをどのように実現できるかを提示する。
論文 参考訳(メタデータ) (2021-02-10T00:43:46Z) - Handling Non-ignorably Missing Features in Electronic Health Records
Data Using Importance-Weighted Autoencoders [8.518166245293703]
本稿では,生体データのランダムなパターンではなく,欠落を柔軟に扱うために,重要度重み付きオートエンコーダ(iwaes)と呼ばれるvaesの新たな拡張を提案する。
提案手法は,組み込みニューラルネットワークを用いて欠落機構をモデル化し,欠落機構の正確な形式を事前に指定する必要をなくした。
論文 参考訳(メタデータ) (2021-01-18T22:53:29Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - A Systematic Approach to Featurization for Cancer Drug Sensitivity
Predictions with Deep Learning [49.86828302591469]
35,000以上のニューラルネットワークモデルをトレーニングし、一般的な成果化技術を駆使しています。
RNA-seqは128以上のサブセットであっても非常に冗長で情報的であることがわかった。
論文 参考訳(メタデータ) (2020-04-30T20:42:17Z) - Learning Dynamic and Personalized Comorbidity Networks from Event Data
using Deep Diffusion Processes [102.02672176520382]
コンコルビンド病は、個人によって異なる複雑な時間的パターンを通じて発生し進行する。
電子的な健康記録では、患者が持つ異なる疾患を観察できるが、それぞれの共死状態の時間的関係を推測できるだけである。
我々は「ダイナミック・コオービディティ・ネットワーク」をモデル化するための深層拡散プロセスを開発する。
論文 参考訳(メタデータ) (2020-01-08T15:47:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。