論文の概要: Deep Generative Models for Discrete Genotype Simulation
- arxiv url: http://arxiv.org/abs/2508.09212v1
- Date: Mon, 11 Aug 2025 11:56:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.624443
- Title: Deep Generative Models for Discrete Genotype Simulation
- Title(参考訳): 離散型遺伝子型シミュレーションのための深部生成モデル
- Authors: Sihan Xie, Thierry Tribout, Didier Boichard, Blaise Hanczar, Julien Chiquet, Eric Barrey,
- Abstract要約: 本研究では,非条件と表現型条件の両方でジェノタイプデータを生成することを検討する。
可変オートエンコーダ(VAE)、拡散モデル、GAN(Generative Adversarial Networks)などの一般的な生成モデルを開発し評価した。
以上の結果から,これらのモデルが遺伝的パターンを効果的に捉え,遺伝子型・フェノタイプ関連を保存できることが示唆された。
- 参考スコア(独自算出の注目度): 2.1880699665839396
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative models open new avenues for simulating realistic genomic data while preserving privacy and addressing data accessibility constraints. While previous studies have primarily focused on generating gene expression or haplotype data, this study explores generating genotype data in both unconditioned and phenotype-conditioned settings, which is inherently more challenging due to the discrete nature of genotype data. In this work, we developed and evaluated commonly used generative models, including Variational Autoencoders (VAEs), Diffusion Models, and Generative Adversarial Networks (GANs), and proposed adaptation tailored to discrete genotype data. We conducted extensive experiments on large-scale datasets, including all chromosomes from cow and multiple chromosomes from human. Model performance was assessed using a well-established set of metrics drawn from both deep learning and quantitative genetics literature. Our results show that these models can effectively capture genetic patterns and preserve genotype-phenotype association. Our findings provide a comprehensive comparison of these models and offer practical guidelines for future research in genotype simulation. We have made our code publicly available at https://github.com/SihanXXX/DiscreteGenoGen.
- Abstract(参考訳): 深層生成モデルは、プライバシを保持し、データアクセシビリティ制約に対処しながら、現実的なゲノムデータをシミュレートするための新しい道を開く。
これまでの研究は主に遺伝子発現やハプロタイプデータの生成に重点を置いてきたが、本研究では、非条件と表現型条件の両方で遺伝子型データを生成することを検討する。
本研究では, 可変オートエンコーダ (VAE) や拡散モデル, GAN (Generative Adversarial Networks) などの一般的な生成モデルの開発と評価を行い, 離散型データに適した適応法を提案する。
ウシの染色体とヒトの複数の染色体を含む大規模データセットについて広範な実験を行った。
モデル性能は、深層学習と定量的遺伝学の両方の文献から得られた、確立されたメトリクスセットを用いて評価された。
以上の結果から,これらのモデルが遺伝的パターンを効果的に捉え,遺伝子型・フェノタイプ関連を保存できることが示唆された。
本研究は,これらのモデルを包括的に比較し,今後の遺伝子型シミュレーション研究のための実践的ガイドラインを提供する。
コードをhttps://github.com/SihanXXX/DiscreteGenoGenで公開しました。
関連論文リスト
- Training Flexible Models of Genetic Variant Effects from Functional Annotations using Accelerated Linear Algebra [44.253701408005895]
提案手法は,大規模ニューラルネットワーク予測モデルを用いてオプティマイザを最適化するDeepWASを開発するための手法である。
より多くの機能でトレーニングされたより大きなモデルは、より良い予測をし、病気の予測を改善し、治療対象の識別を改善する可能性がある。
論文 参考訳(メタデータ) (2025-06-24T13:07:45Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Inferring genotype-phenotype maps using attention models [0.21990652930491852]
遺伝子型から表現型を予測することは遺伝学における中心的な課題である。
機械学習の最近の進歩、特に注意に基づくモデルは、有望な代替手段を提供する。
ここでは、注意に基づくモデルを定量的遺伝学に適用する。
論文 参考訳(メタデータ) (2025-04-14T16:32:17Z) - G2PDiffusion: Cross-Species Genotype-to-Phenotype Prediction via Evolutionary Diffusion [108.94237816552024]
本稿では,DNAから形態像を生成する最初の遺伝子型対フェノタイプ拡散モデル(G2PDiffusion)を提案する。
本モデルは,1)保存および共進化パターンを識別するMSA検索エンジン,2)複雑なジェノタイプ-環境相互作用を効果的にモデル化する環境対応MSA条件エンコーダ,3)遺伝子型-フェノタイプ整合性を改善する適応型表現的アライメントモジュールを含む。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - Multi-Modal and Multi-Attribute Generation of Single Cells with CFGen [76.02070962797794]
本研究では、単一セルデータ固有の離散性を保存するフローベースの条件生成モデルであるCellFlow for Generation (CFGen)を紹介する。
CFGenは、全ゲノムマルチモーダル単一セルデータを確実に生成し、重要な生物学的データ特性の回復を改善する。
論文 参考訳(メタデータ) (2024-07-16T14:05:03Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - A Semi-Supervised Generative Adversarial Network for Prediction of
Genetic Disease Outcomes [0.0]
本稿では, 遺伝的な遺伝的データセットを作成するために, gGAN (Generative Adversarial Networks) を導入する。
我々のゴールは、遺伝子プロファイルだけで病気の重篤な形態を発達させる新しい個人の正当性を決定することである。
提案モデルは自己認識型であり、ネットワークがトレーニングされたデータと十分に互換性のある新しい遺伝子プロファイルを決定することができる。
論文 参考訳(メタデータ) (2020-07-02T15:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。