論文の概要: Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations
- arxiv url: http://arxiv.org/abs/2303.09056v1
- Date: Thu, 16 Mar 2023 03:13:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 16:53:32.809921
- Title: Generating synthetic multi-dimensional molecular-mediator time series
data for artificial intelligence-based disease trajectory forecasting and
drug development digital twins: Considerations
- Title(参考訳): 人工知能を用いた疾患軌跡予測と薬物開発デジタル双生児のための合成多次元分子メディエータ時系列データの生成:考察
- Authors: Gary An and Chase Cockrell
- Abstract要約: 合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
このタイプの合成データを生成する統計的およびデータ中心の機械学習手段の欠如は、要因の組み合わせによるものである。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、仲介者・バイオマーカーに基づくAI予測システムの開発に欠かせない能力である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The use of synthetic data is recognized as a crucial step in the development
of neural network-based Artificial Intelligence (AI) systems. While the methods
for generating synthetic data for AI applications in other domains have a role
in certain biomedical AI systems, primarily related to image processing, there
is a critical gap in the generation of time series data for AI tasks where it
is necessary to know how the system works. This is most pronounced in the
ability to generate synthetic multi-dimensional molecular time series data
(SMMTSD); this is the type of data that underpins research into biomarkers and
mediator signatures for forecasting various diseases and is an essential
component of the drug development pipeline. We argue the insufficiency of
statistical and data-centric machine learning (ML) means of generating this
type of synthetic data is due to a combination of factors: perpetual data
sparsity due to the Curse of Dimensionality, the inapplicability of the Central
Limit Theorem, and the limits imposed by the Causal Hierarchy Theorem.
Alternatively, we present a rationale for using complex multi-scale
mechanism-based simulation models, constructed and operated on to account for
epistemic incompleteness and the need to provide maximal expansiveness in
concordance with the Principle of Maximal Entropy. These procedures provide for
the generation of SMMTD that minimizes the known shortcomings associated with
neural network AI systems, namely overfitting and lack of generalizability. The
generation of synthetic data that accounts for the identified factors of
multi-dimensional time series data is an essential capability for the
development of mediator-biomarker based AI forecasting systems, and therapeutic
control development and optimization through systems like Drug Development
Digital Twins.
- Abstract(参考訳): 合成データの利用は、ニューラルネットワークベースの人工知能(AI)システムの開発における重要なステップとして認識されている。
他の領域におけるAIアプリケーションのための合成データを生成する方法は、主に画像処理に関連する特定のバイオメディカルAIシステムにおいて役割を果たすが、システムがどのように機能するかを知る必要があるAIタスクのための時系列データの生成には、重大なギャップがある。
これは合成多次元分子時系列データ(smmtsd)を生成する能力において最も顕著であり、様々な疾患を予測するバイオマーカーやメディエーターシグネチャの研究を支えるデータの一種であり、薬物開発パイプラインの重要な構成要素である。
このタイプの合成データを生成するための統計的およびデータ中心機械学習(ML)手段の欠如は、次元の曲線による永遠のデータ間隔、中央極限定理の適用性、および因果階層定理によって課される制限の2つの要因の組み合わせによるものであると我々は主張する。
あるいは, 複雑なマルチスケール機構に基づくシミュレーションモデルを用いて, エピステミック不完全性や最大エントロピーの原理に従って最大拡張性を提供する必要性を考慮し, 構築・運用する。
これらの手順は、ニューラルネットワークAIシステムに関連する既知の欠点、すなわちオーバーフィットと一般化性の欠如を最小限に抑えるSMMTDの生成を提供する。
多次元時系列データの特定因子を考慮に入れた合成データの生成は、メディエータ・バイオマーカーに基づくAI予測システムの開発に不可欠な機能であり、薬物開発デジタルツインズのようなシステムによる治療制御の開発と最適化である。
関連論文リスト
- Generation of synthetic gait data: application to multiple sclerosis patients' gait patterns [0.0]
多発性硬化症(Multiple sclerosis, MS)は、若年者における非外傷性障害の主要な原因であり、その頻度は世界中で増加している。
MSにおける歩行障害の変動は、定量的歩行評価のための非侵襲的で敏感で費用対効果の高いツールの開発を必要とする。
eGait運動センサは、股関節回転を表す単位四元数時系列(QTS)を通して人間の歩行を特徴付けるように設計されており、有望なアプローチである。
しかし、臨床研究に典型的な小さなサンプルサイズは、歩行データ解析ツールの安定性に課題をもたらす。
論文 参考訳(メタデータ) (2024-11-15T17:32:01Z) - Causal Representation Learning from Multimodal Biological Observations [57.00712157758845]
我々は,マルチモーダルデータに対するフレキシブルな識別条件の開発を目指している。
我々は、各潜伏成分の識別可能性を保証するとともに、サブスペース識別結果を事前の作業から拡張する。
我々の重要な理論的要素は、異なるモーダル間の因果関係の構造的空間性である。
論文 参考訳(メタデータ) (2024-11-10T16:40:27Z) - Synthesizing Multimodal Electronic Health Records via Predictive Diffusion Models [69.06149482021071]
EHRPDと呼ばれる新しいEHRデータ生成モデルを提案する。
時間間隔推定を組み込んだ拡散モデルである。
我々は2つの公開データセットで実験を行い、忠実さ、プライバシー、実用性の観点からEPHPDを評価する。
論文 参考訳(メタデータ) (2024-06-20T02:20:23Z) - Advancing fNIRS Neuroimaging through Synthetic Data Generation and Machine Learning Applications [0.0]
本研究では,機能的近赤外分光法(fNIRS)の神経イメージングへの統合的アプローチを提案する。
高品質なニューロイメージングデータセットの不足に対処することにより、モンテカルロシミュレーションとパラメトリックヘッドモデルを利用して総合的な合成データセットを生成する。
スケーラブルなデータ生成と処理のためにクラウドベースのインフラストラクチャが確立され、ニューロイメージングデータのアクセシビリティと品質が向上する。
論文 参考訳(メタデータ) (2024-05-18T09:50:19Z) - A Comparative Study of Machine Learning Models Predicting Energetics of Interacting Defects [5.574191640970887]
本稿では,相互作用する欠陥のあるシステムの自由エネルギー変化を予測する3つの方法の比較研究を行う。
その結果,この限られたデータセットであっても,クラスタ展開モデルによって正確なエネルギー予測が達成できることが示唆された。
本研究では,不完全な表面システムに機械学習を適用した予備評価を行う。
論文 参考訳(メタデータ) (2024-03-20T02:15:48Z) - Building Flexible, Scalable, and Machine Learning-ready Multimodal
Oncology Datasets [17.774341783844026]
本研究は、オンコロジーデータシステム(MINDS)のマルチモーダル統合を提案する。
MINDSはフレキシブルでスケーラブルで費用対効果の高いメタデータフレームワークで、公開ソースから異なるデータを効率的に分離する。
MINDSは、マルチモーダルデータを調和させることで、より分析能力の高い研究者を力づけることを目指している。
論文 参考訳(メタデータ) (2023-09-30T15:44:39Z) - The Expressive Leaky Memory Neuron: an Efficient and Expressive Phenomenological Neuron Model Can Solve Long-Horizon Tasks [64.08042492426992]
本稿では,脳皮質ニューロンの生物学的モデルであるExpressive Memory(ELM)ニューロンモデルを紹介する。
ELMニューロンは、上記の入力-出力関係を1万以下のトレーニング可能なパラメータと正確に一致させることができる。
本稿では,Long Range Arena(LRA)データセットなど,時間構造を必要とするタスクで評価する。
論文 参考訳(メタデータ) (2023-06-14T13:34:13Z) - Self-learning locally-optimal hypertuning using maximum entropy, and
comparison of machine learning approaches for estimating fatigue life in
composite materials [0.0]
疲労損傷を予測するための最大エントロピーの原理に基づくML近傍近似アルゴリズムを開発した。
予測は、他のMLアルゴリズムと同様、高いレベルの精度を達成する。
論文 参考訳(メタデータ) (2022-10-19T12:20:07Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - MIRACLE: Causally-Aware Imputation via Learning Missing Data Mechanisms [82.90843777097606]
欠落データに対する因果認識型計算アルゴリズム(MIRACLE)を提案する。
MIRACLEは、欠落発生機構を同時にモデル化することにより、ベースラインの計算を反復的に洗練する。
我々は、MIRACLEが一貫してイミューテーションを改善することができることを示すために、合成および様々な公開データセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2021-11-04T22:38:18Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。