Fugu-MT 論文翻訳(概要): Cancer-inspired Genomics Mapper Model for the Generation of Synthetic DNA Sequences with Desired Genomics Signatures

論文の概要: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic DNA Sequences with Desired Genomics Signatures

arxiv url: http://arxiv.org/abs/2305.01475v1
Date: Mon, 1 May 2023 07:16:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-05-03 14:08:04.260725
Title: Cancer-inspired Genomics Mapper Model for the Generation of Synthetic DNA Sequences with Desired Genomics Signatures
Title（参考訳）: 癌にインスパイアされたゲノムマッパーモデルによる、所望のゲノムシグネチャを持つ合成dna配列の生成
Authors: Teddy Lazebnik, Liron Simon-Keren
Abstract要約: がんに触発されたゲノムマッパーモデル(CGMM)は、遺伝的アルゴリズム(GA)とディープラーニング(DL)の手法を組み合わせたものである。我々はCGMMが、祖先や癌などの選択された表現型の合成ゲノムを生成できることを実証した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Genome data are crucial in modern medicine, offering significant potential for diagnosis and treatment. Thanks to technological advancements, many millions of healthy and diseased genomes have already been sequenced; however, obtaining the most suitable data for a specific study, and specifically for validation studies, remains challenging with respect to scale and access. Therefore, in silico genomics sequence generators have been proposed as a possible solution. However, the current generators produce inferior data using mostly shallow (stochastic) connections, detected with limited computational complexity in the training data. This means they do not take the appropriate biological relations and constraints, that originally caused the observed connections, into consideration. To address this issue, we propose cancer-inspired genomics mapper model (CGMM), that combines genetic algorithm (GA) and deep learning (DL) methods to tackle this challenge. CGMM mimics processes that generate genetic variations and mutations to transform readily available control genomes into genomes with the desired phenotypes. We demonstrate that CGMM can generate synthetic genomes of selected phenotypes such as ancestry and cancer that are indistinguishable from real genomes of such phenotypes, based on unsupervised clustering. Our results show that CGMM outperforms four current state-of-the-art genomics generators on two different tasks, suggesting that CGMM will be suitable for a wide range of purposes in genomic medicine, especially for much-needed validation studies.
Abstract（参考訳）: ゲノムデータは現代医学において不可欠であり、診断と治療に重要な可能性を秘めている。しかし、特定の研究、特に検証研究に最適なデータを得ることは、スケールとアクセスに関して依然として困難である。そのため、シリコゲノム配列生成装置は可能な解として提案されている。しかし、現在のジェネレータは、ほとんど浅い(確率的な)接続を使用して劣ったデータを生成し、トレーニングデータにおいて限られた計算複雑性で検出する。これは、元々観測されたつながりを引き起こした適切な生物学的関係と制約を考慮に入れないことを意味する。この問題に対処するために,遺伝子アルゴリズム(GA)と深層学習(DL)を併用したがん誘発ゲノムマッパーモデル(CGMM)を提案する。 CGMMは、遺伝子変異と突然変異を生成する過程を模倣し、容易に利用可能な制御ゲノムを所望の表現型を持つゲノムに変換する。 cgmmは,これらの表現型の実際のゲノムと区別できない祖先や癌などの選択された表現型の合成ゲノムを,教師なしクラスタリングに基づいて生成できることを実証する。以上の結果から,cgmmは2つの異なる課題において,現在の4つのゲノムジェネレータよりも優れており,特に多用された検証研究において,幅広い目的にcgmmが適していることが示唆された。

関連論文リスト

GeMM-GAN: A Multimodal Generative Model Conditioned on Histopathology Images and Clinical Descriptions for Gene Expression Profile Generation [0.6608945629704325]
GeMM-GANは, 組織スライドと臨床メタデータに基づいて, 現実的な遺伝子発現プロファイルを合成する新規なジェネレーティブ・アドバイサル・ネットワークである。我々はTCGAデータセットに対する我々のアプローチを評価し、我々のフレームワークが標準生成モデルより優れ、より現実的で機能的に意味のある遺伝子発現プロファイルを生成することを示した。
論文参考訳（メタデータ） (2026-01-21T19:03:54Z)
PathGene: Benchmarking Driver Gene Mutations and Exon Prediction Using Multicenter Lung Cancer Histopathology Image Dataset [3.716599571611912]
肺癌における遺伝子変異、変異サブタイプおよびそれらのエクソンの正確な予測は、パーソナライズされた治療計画と予後評価に重要である。病理組織像と次世代シークエンシングレポートを組み合わせたPathGeneを収集した。このマルチセンターデータセットは、全スライディングイメージをドライバ遺伝子変異状態、突然変異サブタイプ、エキソン、腫瘍突然変異負担(TMB)ステータスにリンクする。
論文参考訳（メタデータ） (2025-05-30T11:51:11Z)
GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文参考訳（メタデータ） (2025-05-06T03:35:24Z)
A Novel Approach to Linking Histology Images with DNA Methylation [8.947503179743167]
異常なメチル化パターンは遺伝子発現を阻害し、がんの発生と関連している。サンプル間のコヒーレントパターンを示す遺伝子群のメチル化状態を予測するために,エンド・ツー・エンドグラフニューラルネットワークを用いた弱教師付き学習フレームワークを提案する。本研究は,遺伝子群について遺伝子セットの富化分析を行い,遺伝子群の大部分が重要な特徴と経路において著しく富化されていることを示す。
論文参考訳（メタデータ） (2025-04-07T18:19:01Z)
GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。 DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文参考訳（メタデータ） (2025-02-11T05:39:49Z)
Interpreting artificial neural networks to detect genome-wide association signals for complex traits [0.0]
複雑な疾患の遺伝的アーキテクチャを調べることは、遺伝的および環境要因の高度にポリジェニックでインタラクティブな景観のために困難である。我々は、シミュレーションと実際のジェノタイプ/フェノタイプデータセットの両方を用いて、複雑な特性を予測するために、人工ニューラルネットワークを訓練した。
論文参考訳（メタデータ） (2024-07-26T15:20:42Z)
Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。 BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。 BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文参考訳（メタデータ） (2024-06-05T06:42:27Z)
VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文参考訳（メタデータ） (2024-05-13T20:15:03Z)
Histo-Genomic Knowledge Distillation For Cancer Prognosis From Histopathology Whole Slide Images [7.5123289730388825]
ゲノムインフォームドハイパーアテンションネットワーク(G-HANet)は、トレーニング中にヒストリーゲノム知識を効果的に蒸留することができる。ネットワークは、クロスモーダル・アソシエーション・ブランチ(CAB)とハイパーアテンション・サバイバル・ブランチ(HSB)から構成される。
論文参考訳（メタデータ） (2024-03-15T06:20:09Z)
Efficient and Scalable Fine-Tune of Language Models for Genome Understanding [49.606093223945734]
textscLanguage prefix ftextscIne-tuning for textscGentextscOmes。 DNA基盤モデルとは異なり、textscLingoは自然言語基盤モデルの文脈的手がかりを戦略的に活用している。 textscLingoはさらに、適応的なランクサンプリング方法により、下流の細調整タスクを数多く許容する。
論文参考訳（メタデータ） (2024-02-12T21:40:45Z)
Unlocking the Power of Multi-institutional Data: Integrating and Harmonizing Genomic Data Across Institutions [3.5489676012585236]
共通遺伝子を超えて情報を保存するための統合的特徴を導出するためにブリッジモデルを導入する。このモデルは、GenIE BPCデータにおいて、6種類のがん種にわたる患者の生存を予測するのに一貫して優れている。
論文参考訳（メタデータ） (2024-01-30T23:25:05Z)
Genetic InfoMax: Exploring Mutual Information Maximization in High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文参考訳（メタデータ） (2023-09-26T03:59:21Z)
Genetic heterogeneity analysis using genetic algorithm and network science [2.6166087473624318]
ゲノムワイド・アソシエーション(GWAS)は、疾患に感受性のある遺伝的変数を同定することができる。遺伝的効果に絡み合った遺伝的変数は、しばしば低い効果サイズを示す。本稿では,FCSNet(Feature Co-Selection Network)という,GWASのための新しい特徴選択機構を提案する。
論文参考訳（メタデータ） (2023-08-12T01:28:26Z)
Machine Learning Methods for Cancer Classification Using Gene Expression Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。遺伝子発現は癌の早期発見において基本的な役割を担っている。本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文参考訳（メタデータ） (2023-01-28T15:03:03Z)
Multi-modal Self-supervised Pre-training for Regulatory Genome Across Cell Types [75.65676405302105]
我々は、GeneBERTと呼ばれる、多モードかつ自己管理的な方法でゲノムデータを事前学習するための、単純かつ効果的なアプローチを提案する。我々はATAC-seqデータセットで1700万のゲノム配列でモデルを事前訓練する。
論文参考訳（メタデータ） (2021-10-11T12:48:44Z)
Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文参考訳（メタデータ） (2020-09-02T02:50:30Z)
The scalable Birth-Death MCMC Algorithm for Mixed Graphical Model Learning with Application to Genomic Data Integration [0.0]
本稿では,異なるタイプのマルチオミックデータを解析するための混合グラフィカルモデルを提案する。モデル選択結果の計算効率と精度の両面で,本手法が優れていることがわかった。
論文参考訳（メタデータ） (2020-05-08T16:34:58Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。