論文の概要: Whole-Genome Phenotype Prediction with Machine Learning: Open Problems in Bacterial Genomics
- arxiv url: http://arxiv.org/abs/2502.07749v1
- Date: Tue, 11 Feb 2025 18:25:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:05:58.036749
- Title: Whole-Genome Phenotype Prediction with Machine Learning: Open Problems in Bacterial Genomics
- Title(参考訳): 機械学習による全ゲノムフェノタイプ予測:細菌ゲノム学におけるオープン問題
- Authors: Tamsin James, Ben Williamson, Peter Tino, Nicole Wheeler,
- Abstract要約: 細菌の全ゲノムデータセットから表現型予測を取り巻く問題を設定し,因果関係の学習に拡張した。
我々は、この性質のデータセットに直面した場合、マシンの意思決定の信頼性に影響を与える課題について議論する。
- 参考スコア(独自算出の注目度): 0.8437187555622164
- License:
- Abstract: How can we identify causal genetic mechanisms that govern bacterial traits? Initial efforts entrusting machine learning models to handle the task of predicting phenotype from genotype return high accuracy scores. However, attempts to extract any meaning from the predictive models are found to be corrupted by falsely identified "causal" features. Relying solely on pattern recognition and correlations is unreliable, significantly so in bacterial genomics settings where high-dimensionality and spurious associations are the norm. Though it is not yet clear whether we can overcome this hurdle, significant efforts are being made towards discovering potential high-risk bacterial genetic variants. In view of this, we set up open problems surrounding phenotype prediction from bacterial whole-genome datasets and extending those to learning causal effects, and discuss challenges that impact the reliability of a machine's decision-making when faced with datasets of this nature.
- Abstract(参考訳): 細菌の形質を管理する因果遺伝機構をどうやって特定できるのか?
遺伝子型から表現型を予測するタスクを機械学習モデルに委ねる最初の取り組みは、高い精度のスコアを返す。
しかし、予測モデルから何らかの意味を抽出しようとする試みは、誤って特定された「因果関係」の特徴によって損なわれることが判明した。
パターン認識と相関にのみ依存することは、高次元性や急激な関連が標準である細菌ゲノム設定において、非常に信頼できない。
このハードルを克服できるかどうかはまだ明らかになっていないが、リスクの高い細菌の遺伝的変異を発見するための重要な取り組みが進行中である。
そこで本研究では,細菌の全ゲノムデータセットからの表現型予測を取り巻くオープンな問題と,因果関係の学習への拡張と,この性質のデータセットに直面すると,マシンの意思決定の信頼性に影響を及ぼす課題について議論した。
関連論文リスト
- G2PDiffusion: Genotype-to-Phenotype Prediction with Diffusion Models [108.94237816552024]
本稿では,G2PDiffusionについて紹介する。G2PDiffusionは,複数の種にまたがる遺伝子型からフェノタイプへの拡散モデルである。
我々は,形態的表現型を種間で表現するために画像を使用し,条件付き画像生成として表現型予測を再定義する。
論文 参考訳(メタデータ) (2025-02-07T06:16:31Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。
我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文 参考訳(メタデータ) (2024-05-09T09:34:51Z) - Using Pre-training and Interaction Modeling for ancestry-specific disease prediction in UK Biobank [69.90493129893112]
近年のゲノムワイド・アソシエーション(GWAS)研究は、複雑な形質の遺伝的基盤を明らかにしているが、非ヨーロッパ系個体の低発現を示している。
そこで本研究では,マルチオミクスデータを用いて,多様な祖先間での疾患予測を改善することができるかを評価する。
論文 参考訳(メタデータ) (2024-04-26T16:39:50Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Predicting loss-of-function impact of genetic mutations: a machine
learning approach [0.0]
本稿では,遺伝子変異の属性に基づいて機械学習モデルを学習し,LoFtoolスコアを予測することを目的とする。
これらの属性には、染色体上の突然変異の位置、アミノ酸の変化、変異によって引き起こされるコドンの変化が含まれていた。
モデルは, 平均2乗誤差, 平均2乗誤差, 平均2乗誤差, 平均絶対誤差, 説明分散の5倍のクロスバリデード平均を用いて評価した。
論文 参考訳(メタデータ) (2024-01-26T19:27:38Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - Genetic prediction of quantitative traits: a machine learner's guide
focused on height [0.0]
本稿では,機械学習コミュニティにおけるアートモデルの現状と関連する微妙さについて概観する。
heightを連続評価された表現型の例として使用し、ベンチマークデータセット、共同創設者、機能選択、一般的なメトリクスを紹介します。
論文 参考訳(メタデータ) (2023-10-06T05:43:50Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Handling highly correlated genes in prediction analysis of genomic
studies [0.0]
遺伝子間の高い相関は、多系統問題のような技術的な問題を導入し、信頼性の低い予測モデルをもたらす。
本稿では,高相関遺伝子をグループとして扱うグループ化アルゴリズムを提案する。
まず、遺伝子群の共通パターンを用いることで、条件変化下での予測をより堅牢で信頼性の高いものにする。
論文 参考訳(メタデータ) (2020-07-05T22:14:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。