論文の概要: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures
- arxiv url: http://arxiv.org/abs/2305.01475v1
- Date: Mon, 1 May 2023 07:16:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 14:08:04.260725
- Title: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures
- Title(参考訳): 癌にインスパイアされたゲノムマッパーモデルによる、所望のゲノムシグネチャを持つ合成dna配列の生成
- Authors: Teddy Lazebnik, Liron Simon-Keren
- Abstract要約: がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Genome data are crucial in modern medicine, offering significant potential
for diagnosis and treatment. Thanks to technological advancements, many
millions of healthy and diseased genomes have already been sequenced; however,
obtaining the most suitable data for a specific study, and specifically for
validation studies, remains challenging with respect to scale and access.
Therefore, in silico genomics sequence generators have been proposed as a
possible solution. However, the current generators produce inferior data using
mostly shallow (stochastic) connections, detected with limited computational
complexity in the training data. This means they do not take the appropriate
biological relations and constraints, that originally caused the observed
connections, into consideration. To address this issue, we propose
cancer-inspired genomics mapper model (CGMM), that combines genetic algorithm
(GA) and deep learning (DL) methods to tackle this challenge. CGMM mimics
processes that generate genetic variations and mutations to transform readily
available control genomes into genomes with the desired phenotypes. We
demonstrate that CGMM can generate synthetic genomes of selected phenotypes
such as ancestry and cancer that are indistinguishable from real genomes of
such phenotypes, based on unsupervised clustering. Our results show that CGMM
outperforms four current state-of-the-art genomics generators on two different
tasks, suggesting that CGMM will be suitable for a wide range of purposes in
genomic medicine, especially for much-needed validation studies.
- Abstract(参考訳): ゲノムデータは現代医学において不可欠であり、診断と治療に重要な可能性を秘めている。
しかし、特定の研究、特に検証研究に最適なデータを得ることは、スケールとアクセスに関して依然として困難である。
そのため、シリコゲノム配列生成装置は可能な解として提案されている。
しかし、現在のジェネレータは、ほとんど浅い(確率的な)接続を使用して劣ったデータを生成し、トレーニングデータにおいて限られた計算複雑性で検出する。
これは、元々観測されたつながりを引き起こした適切な生物学的関係と制約を考慮に入れないことを意味する。
この問題に対処するために,遺伝子アルゴリズム(GA)と深層学習(DL)を併用したがん誘発ゲノムマッパーモデル(CGMM)を提案する。
CGMMは、遺伝子変異と突然変異を生成する過程を模倣し、容易に利用可能な制御ゲノムを所望の表現型を持つゲノムに変換する。
cgmmは,これらの表現型の実際のゲノムと区別できない祖先や癌などの選択された表現型の合成ゲノムを,教師なしクラスタリングに基づいて生成できることを実証する。
以上の結果から,cgmmは2つの異なる課題において,現在の4つのゲノムジェネレータよりも優れており,特に多用された検証研究において,幅広い目的にcgmmが適していることが示唆された。
関連論文リスト
- Unlocking the Power of Multi-institutional Data: Integrating and
Harmonizing Genomic Data Across Institutions [3.8769921482808116]
共通遺伝子を超えて情報を保存するための統合的特徴を導出するためにブリッジモデルを導入する。
このモデルは、GenIE BPCデータにおいて、6種類のがん種にわたる患者の生存を予測するのに一貫して優れている。
論文 参考訳(メタデータ) (2024-01-30T23:25:05Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Unsupervised ensemble-based phenotyping helps enhance the
discoverability of genes related to heart morphology [57.25098075813054]
我々はUn Phenotype Ensemblesという名の遺伝子発見のための新しいフレームワークを提案する。
教師なしの方法で学習された表現型のセットをプールすることで、冗長だが非常に表現性の高い表現を構築する。
これらの表現型は、(GWAS)を介して分析され、高い自信と安定した関連のみを保持する。
論文 参考訳(メタデータ) (2023-01-07T18:36:44Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Low-Rank Reorganization via Proportional Hazards Non-negative Matrix
Factorization Unveils Survival Associated Gene Clusters [9.773075235189525]
この研究において、Cox比例ハザードの回帰は生存制約を課すことでNMFと統合される。
ヒト癌遺伝子の発現データを用いて、提案手法は癌遺伝子の重要なクラスターを解明することができる。
発見された遺伝子クラスターは、豊富な生物学的含意を反映し、生存に関連するバイオマーカーの同定に役立つ。
論文 参考訳(メタデータ) (2020-08-09T17:59:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z) - A Sparse Graph-Structured Lasso Mixed Model for Genetic Association with
Confounding Correction [28.364820868064893]
本稿では,特徴量からの関連性情報をデータセットに組み込んだグラフ構造化線形混合モデル(sGLMM)を提案する。
提案モデルは他の既存手法よりも優れており,人口構造と共有信号の両方から相関関係をモデル化できることを示す。
また、本モデルで発見されたヒトアルツハイマー病の因果遺伝子変異について検討し、最も重要な遺伝子座のいくつかを正当化する。
論文 参考訳(メタデータ) (2017-11-11T16:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。