論文の概要: DPCformer: An Interpretable Deep Learning Model for Genomic Prediction in Crops
- arxiv url: http://arxiv.org/abs/2510.08662v1
- Date: Thu, 09 Oct 2025 13:53:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:47.309313
- Title: DPCformer: An Interpretable Deep Learning Model for Genomic Prediction in Crops
- Title(参考訳): DPCformer:作物のゲノム予測のための解釈可能なディープラーニングモデル
- Authors: Pengcheng Deng, Kening Liu, Mengxi Zhou, Mingxi Li, Rui Yang, Chuzhe Cao, Maojun Wang, Zeyu Zhang,
- Abstract要約: ゲノム選択(GS)は、全ゲノム情報を用いて、作物の表現型を予測し、繁殖を加速する。
しかし、従来のGS手法は複雑な特徴や大きなデータセットの予測精度に苦慮している。
複雑な遺伝子型とフェノタイプの関係をモデル化するために,畳み込みニューラルネットワークと自己認識機構を統合したディープラーニングモデルDPCformerを提案する。
- 参考スコア(独自算出の注目度): 9.578611448561992
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Genomic Selection (GS) uses whole-genome information to predict crop phenotypes and accelerate breeding. Traditional GS methods, however, struggle with prediction accuracy for complex traits and large datasets. We propose DPCformer, a deep learning model integrating convolutional neural networks with a self-attention mechanism to model complex genotype-phenotype relationships. We applied DPCformer to 13 traits across five crops (maize, cotton, tomato, rice, chickpea). Our approach uses an 8-dimensional one-hot encoding for SNP data, ordered by chromosome, and employs the PMF algorithm for feature selection. Evaluations show DPCformer outperforms existing methods. In maize datasets, accuracy for traits like days to tasseling and plant height improved by up to 2.92%. For cotton, accuracy gains for fiber traits reached 8.37%. On small-sample tomato data, the Pearson Correlation Coefficient for a key trait increased by up to 57.35%. In chickpea, the yield correlation was boosted by 16.62%. DPCformer demonstrates superior accuracy, robustness in small-sample scenarios, and enhanced interpretability, providing a powerful tool for precision breeding and addressing global food security challenges.
- Abstract(参考訳): ゲノム選択(GS)は、全ゲノム情報を用いて、作物の表現型を予測し、繁殖を加速する。
しかし、従来のGS手法は複雑な特徴や大きなデータセットの予測精度に苦慮している。
複雑な遺伝子型とフェノタイプの関係をモデル化するために,畳み込みニューラルネットワークと自己認識機構を統合したディープラーニングモデルDPCformerを提案する。
DPCformerを5つの作物(トウモロコシ、綿、トマト、米、ニワトリ)の13形質に適用した。
提案手法では,SNPデータに対する8次元ワンホット符号化を染色体順に使用し,特徴選択にPMFアルゴリズムを用いる。
DPCformerは既存の手法よりも優れている。
トウモロコシのデータセットでは、房までの日数や植物の高さといった特性の精度が2.92%向上した。
綿の繊維特性の精度は8.37%に達した。
小サンプルトマトのデータでは、鍵形質のピアソン相関係数が57.35%まで増加した。
ニワトリでは、収率相関が16.62%向上した。
DPCformerは、小さめのシナリオにおいて優れた精度、堅牢性、解釈可能性の向上を示し、グローバルな食料安全保障上の課題を正確に育むための強力なツールを提供する。
関連論文リスト
- Efficient Federated Learning with Heterogeneous Data and Adaptive Dropout [62.73150122809138]
Federated Learning(FL)は、複数のエッジデバイスを使用したグローバルモデルの協調トレーニングを可能にする、有望な分散機械学習アプローチである。
動的不均一モデルアグリゲーション(FedDH)と適応ドロップアウト(FedAD)の2つの新しい手法を備えたFedDHAD FLフレームワークを提案する。
これら2つの手法を組み合わせることで、FedDHADは精度(最大6.7%)、効率(最大2.02倍高速)、コスト(最大15.0%小型)で最先端のソリューションを大幅に上回っている。
論文 参考訳(メタデータ) (2025-07-14T16:19:00Z) - Training Flexible Models of Genetic Variant Effects from Functional Annotations using Accelerated Linear Algebra [44.253701408005895]
提案手法は,大規模ニューラルネットワーク予測モデルを用いてオプティマイザを最適化するDeepWASを開発するための手法である。
より多くの機能でトレーニングされたより大きなモデルは、より良い予測をし、病気の予測を改善し、治療対象の識別を改善する可能性がある。
論文 参考訳(メタデータ) (2025-06-24T13:07:45Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - Hybrid Deep Convolutional Neural Networks Combined with Autoencoders And Augmented Data To Predict The Look-Up Table 2006 [2.082445711353476]
本研究では、自己エンコーダとデータ拡張技術により強化されたハイブリッドディープ畳み込みニューラルネットワーク(DCNN)モデルの開発について検討する。
オリジナルの入力機能を3つの異なるオートエンコーダ構成で拡張することにより、モデルの予測能力は大幅に改善された。
論文 参考訳(メタデータ) (2024-08-26T20:45:07Z) - LSTM Autoencoder-based Deep Neural Networks for Barley Genotype-to-Phenotype Prediction [16.99449054451577]
そこで本研究では,オオムギの開花時期と収量推定のために,オオムギの遺伝子型からフェノタイプへの予測のためのLSTMオートエンコーダを用いた新しいモデルを提案する。
我々のモデルは、複雑な高次元農業データセットを扱う可能性を示す他のベースライン手法よりも優れていた。
論文 参考訳(メタデータ) (2024-07-21T16:07:43Z) - The effect of data augmentation and 3D-CNN depth on Alzheimer's Disease
detection [51.697248252191265]
この研究は、データハンドリング、実験設計、モデル評価に関するベストプラクティスを要約し、厳密に観察する。
我々は、アルツハイマー病(AD)の検出に焦点を当て、医療における課題のパラダイム的な例として機能する。
このフレームワークでは,3つの異なるデータ拡張戦略と5つの異なる3D CNNアーキテクチャを考慮し,予測15モデルを訓練する。
論文 参考訳(メタデータ) (2023-09-13T10:40:41Z) - Survival Prediction of Children Undergoing Hematopoietic Stem Cell
Transplantation Using Different Machine Learning Classifiers by Performing
Chi-squared Test and Hyper-parameter Optimization: A Retrospective Analysis [4.067706269490143]
効率的な生存率分類モデルが包括的に提示される。
欠落した値を入力し、ダミー変数符号化を用いてデータを変換し、チ二乗特徴選択を用いて59個の特徴から11個の最も相関した特徴にデータセットを圧縮することにより、合成データセットを生成する。
この点に関しては、決定木(Decision Tree)、ランダムフォレスト(Random Forest)、ロジスティック回帰(Logistic Regression)、K-Nearest Neighbors(K-Nearest Neighbors)、グラディエントブースティング(Gradient Boosting)、Ada Boost(Ada Boost)、XG Boost(XG Boost)など、いくつかの教師付きML手法が訓練された。
論文 参考訳(メタデータ) (2022-01-22T08:01:22Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - i6mA-CNN: a convolution based computational approach towards
identification of DNA N6-methyladenine sites in rice genome [1.9723060056911002]
イネゲノム中の6mA部位を同定できる畳み込みニューラルネットワークツールi6mA-CNNを開発した。
以上の結果から,本手法は植物種に関係なく,植物ゲノム上の6mA部位の同定能力を一般化できることが示唆された。
論文 参考訳(メタデータ) (2020-07-20T20:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。