論文の概要: Human Limits in Machine Learning: Prediction of Plant Phenotypes Using
Soil Microbiome Data
- arxiv url: http://arxiv.org/abs/2306.11157v2
- Date: Sat, 17 Feb 2024 03:03:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-21 06:34:36.362323
- Title: Human Limits in Machine Learning: Prediction of Plant Phenotypes Using
Soil Microbiome Data
- Title(参考訳): 機械学習における人間の限界:土壌マイクロバイオームデータによる植物表現型予測
- Authors: Rosa Aghdam, Xudong Tang, Shan Shan, Richard Lankau, Claudia
Sol\'is-Lemus
- Abstract要約: 我々は,土壌と生物表現型との関係を理解するために,機械学習モデルの予測可能性について,初めて深く研究した。
土壌物理化学的特性や微生物集団密度などの環境特性をモデルに組み込んだ場合, 予測精度が向上することを示す。
- 参考スコア(独自算出の注目度): 0.2812395851874055
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The preservation of soil health is a critical challenge in the 21st century
due to its significant impact on agriculture, human health, and biodiversity.
We provide the first deep investigation of the predictive potential of machine
learning models to understand the connections between soil and biological
phenotypes. We investigate an integrative framework performing accurate machine
learning-based prediction of plant phenotypes from biological, chemical, and
physical properties of the soil via two models: random forest and Bayesian
neural network. We show that prediction is improved when incorporating
environmental features like soil physicochemical properties and microbial
population density into the models, in addition to the microbiome information.
Exploring various data preprocessing strategies confirms the significant impact
of human decisions on predictive performance. We show that the naive total sum
scaling normalization that is commonly used in microbiome research is not the
optimal strategy to maximize predictive power. Also, we find that accurately
defined labels are more important than normalization, taxonomic level or model
characteristics. In cases where humans are unable to classify samples
accurately, machine learning model performance is limited. Lastly, we provide
domain scientists via a full model selection decision tree to identify the
human choices that optimize model prediction power. Our work is accompanied by
open source reproducible scripts
(https://github.com/solislemuslab/soil-microbiome-nn) for maximum outreach
among the microbiome research community.
- Abstract(参考訳): 土壌の健康の保全は、農業、人間の健康、生物多様性に大きな影響を与えるため、21世紀の重要な課題である。
土壌と生物学的表現型との関係を理解するために,機械学習モデルの予測可能性に関する最初の深い調査を行った。
本研究では, ランダム林とベイズニューラルネットワークの2つのモデルを用いて, 土壌の生物学的, 化学的, 物理的特性から, 植物の表現型を正確に予測する統合的枠組みについて検討した。
微生物情報に加え, 土壌物理化学的特性や微生物集団密度などの環境特性をモデルに組み込むことにより, 予測が向上することを示す。
さまざまなデータ前処理戦略の探索は、人間の決定が予測性能に与える影響を裏付ける。
マイクロバイオーム研究で一般的に用いられるnaive total sum scaling normalizationは,予測力の最大化のための最適戦略ではないことを示す。
また, 正規化, 分類学レベル, モデル特性よりも, 正確に定義されたラベルの方が重要であることがわかった。
人間がサンプルを正確に分類できない場合、機械学習モデルの性能は限られる。
最後に、モデル予測能力を最適化する人間の選択を特定するために、完全なモデル選択決定ツリーを通じてドメイン科学者を提供する。
我々の研究には、微生物研究コミュニティの最大のアウトリーチのためのオープンソース再現可能なスクリプト(https://github.com/solislemuslab/soil-microbiome-nn)が伴っている。
関連論文リスト
- Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Causal machine learning for single-cell genomics [94.28105176231739]
単細胞ゲノミクスへの機械学習技術の応用とその課題について論じる。
まず, 単一細胞生物学における現在の因果的アプローチの基盤となるモデルについて述べる。
次に、単一セルデータへの因果的アプローチの適用におけるオープンな問題を特定する。
論文 参考訳(メタデータ) (2023-10-23T13:35:24Z) - A Deep Neural Network -- Mechanistic Hybrid Model to Predict
Pharmacokinetics in Rat [0.0]
本研究では, 先に開発したハイブリッドモデルを改良する。
口腔全露出の中央値は2.85から2.35に減少し,静脈内投与は1.95から1.62に低下した。
純粋な機械学習モデルとは対照的に、我々のモデルはトレーニングされていない新しいエンドポイントを予測することができる。
論文 参考訳(メタデータ) (2023-10-13T15:01:55Z) - Ecosystem-level Analysis of Deployed Machine Learning Reveals
Homogeneous Outcomes [76.07093761206377]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。
デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。
これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文 参考訳(メタデータ) (2023-07-12T01:11:52Z) - Application of data engineering approaches to address challenges in
microbiome data for optimal medical decision-making [0.0]
この研究は、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である可能性がある。
この研究で使用されたプロトタイプは、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である。
論文 参考訳(メタデータ) (2023-06-30T05:36:39Z) - An Artificial Intelligence-based model for cell killing prediction:
development, validation and explainability analysis of the ANAKIN model [0.0]
ANAKINは、放射線誘導細胞KIlliNg予測のための人工iNtelligence bAsedモデルである。
そこで, ANAKINはイオンの広い範囲と多くの細胞株に対して, 関連生物学的エンドポイントを正確に予測する方法を示す。
論文 参考訳(メタデータ) (2023-01-19T20:00:49Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Adaptive Transfer Learning for Plant Phenotyping [33.28898554551106]
植物表現の表現における現代の機械学習モデルの知識伝達可能性について検討する。
植物フェノタイピングにおける注釈付きサンプル数に影響を及ぼす従来の機械学習モデルの性能について
ニューラルネットワークに基づく伝達学習モデルは植物の表現型化の性能を向上させるか?
論文 参考訳(メタデータ) (2022-01-14T00:40:40Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Mycorrhiza: Genotype Assignment usingPhylogenetic Networks [2.286041284499166]
遺伝子型代入問題に対する機械学習手法であるMycorrhizaを紹介する。
提案アルゴリズムは系統ネットワークを用いて,標本間の進化的関係を符号化する特徴を設計する。
Mycorrhizaは、大きな平均固定指数(FST)を持つデータセットやハーディ・ワインバーグ平衡からの偏差で特に顕著な利得を得る。
論文 参考訳(メタデータ) (2020-10-14T02:36:27Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。