論文の概要: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures
- arxiv url: http://arxiv.org/abs/2305.01475v1
- Date: Mon, 1 May 2023 07:16:40 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-03 14:08:04.260725
- Title: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic
DNA Sequences with Desired Genomics Signatures
- Title(参考訳): 癌にインスパイアされたゲノムマッパーモデルによる、所望のゲノムシグネチャを持つ合成dna配列の生成
- Authors: Teddy Lazebnik, Liron Simon-Keren
- Abstract要約: がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。
我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Genome data are crucial in modern medicine, offering significant potential
for diagnosis and treatment. Thanks to technological advancements, many
millions of healthy and diseased genomes have already been sequenced; however,
obtaining the most suitable data for a specific study, and specifically for
validation studies, remains challenging with respect to scale and access.
Therefore, in silico genomics sequence generators have been proposed as a
possible solution. However, the current generators produce inferior data using
mostly shallow (stochastic) connections, detected with limited computational
complexity in the training data. This means they do not take the appropriate
biological relations and constraints, that originally caused the observed
connections, into consideration. To address this issue, we propose
cancer-inspired genomics mapper model (CGMM), that combines genetic algorithm
(GA) and deep learning (DL) methods to tackle this challenge. CGMM mimics
processes that generate genetic variations and mutations to transform readily
available control genomes into genomes with the desired phenotypes. We
demonstrate that CGMM can generate synthetic genomes of selected phenotypes
such as ancestry and cancer that are indistinguishable from real genomes of
such phenotypes, based on unsupervised clustering. Our results show that CGMM
outperforms four current state-of-the-art genomics generators on two different
tasks, suggesting that CGMM will be suitable for a wide range of purposes in
genomic medicine, especially for much-needed validation studies.
- Abstract(参考訳): ゲノムデータは現代医学において不可欠であり、診断と治療に重要な可能性を秘めている。
しかし、特定の研究、特に検証研究に最適なデータを得ることは、スケールとアクセスに関して依然として困難である。
そのため、シリコゲノム配列生成装置は可能な解として提案されている。
しかし、現在のジェネレータは、ほとんど浅い(確率的な)接続を使用して劣ったデータを生成し、トレーニングデータにおいて限られた計算複雑性で検出する。
これは、元々観測されたつながりを引き起こした適切な生物学的関係と制約を考慮に入れないことを意味する。
この問題に対処するために,遺伝子アルゴリズム(GA)と深層学習(DL)を併用したがん誘発ゲノムマッパーモデル(CGMM)を提案する。
CGMMは、遺伝子変異と突然変異を生成する過程を模倣し、容易に利用可能な制御ゲノムを所望の表現型を持つゲノムに変換する。
cgmmは,これらの表現型の実際のゲノムと区別できない祖先や癌などの選択された表現型の合成ゲノムを,教師なしクラスタリングに基づいて生成できることを実証する。
以上の結果から,cgmmは2つの異なる課題において,現在の4つのゲノムジェネレータよりも優れており,特に多用された検証研究において,幅広い目的にcgmmが適していることが示唆された。
関連論文リスト
- Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。
我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文 参考訳(メタデータ) (2024-07-26T15:20:42Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images [7.5123289730388825]
ゲノムインフォームドハイパーアテンションネットワーク(G-HANet)は、トレーニング中にヒストリーゲノム知識を効果的に蒸留することができる。
ネットワークは、クロスモーダル・アソシエーション・ブランチ(CAB)とハイパーアテンション・サバイバル・ブランチ(HSB)から構成される。
論文 参考訳(メタデータ) (2024-03-15T06:20:09Z) - Unlocking the Power of Multi-institutional Data: Integrating and Harmonizing Genomic Data Across Institutions [3.5489676012585236]
共通遺伝子を超えて情報を保存するための統合的特徴を導出するためにブリッジモデルを導入する。
このモデルは、GenIE BPCデータにおいて、6種類のがん種にわたる患者の生存を予測するのに一貫して優れている。
論文 参考訳(メタデータ) (2024-01-30T23:25:05Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Genetic heterogeneity analysis using genetic algorithm and network
science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。
遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。
本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文 参考訳(メタデータ) (2023-08-12T01:28:26Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Multi-modal Self-supervised Pre-training for Regulatory Genome Across
Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。
我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文 参考訳(メタデータ) (2021-10-11T12:48:44Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model
Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。
モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-08T16:34:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。