Fugu-MT 論文翻訳(概要): Human Limits in Machine Learning: Prediction of Plant Phenotypes Using Soil Microbiome Data

論文の概要: Human Limits in Machine Learning: Prediction of Plant Phenotypes Using Soil Microbiome Data

arxiv url: http://arxiv.org/abs/2306.11157v2
Date: Sat, 17 Feb 2024 03:03:59 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-21 06:34:36.362323
Title: Human Limits in Machine Learning: Prediction of Plant Phenotypes Using Soil Microbiome Data
Title（参考訳）: 機械学習における人間の限界:土壌マイクロバイオームデータによる植物表現型予測
Authors: Rosa Aghdam, Xudong Tang, Shan Shan, Richard Lankau, Claudia Sol\'is-Lemus
Abstract要約: 我々は,土壌と生物表現型との関係を理解するために,機械学習モデルの予測可能性について,初めて深く研究した。土壌物理化学的特性や微生物集団密度などの環境特性をモデルに組み込んだ場合, 予測精度が向上することを示す。
参考スコア（独自算出の注目度）: 0.2812395851874055
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The preservation of soil health is a critical challenge in the 21st century due to its significant impact on agriculture, human health, and biodiversity. We provide the first deep investigation of the predictive potential of machine learning models to understand the connections between soil and biological phenotypes. We investigate an integrative framework performing accurate machine learning-based prediction of plant phenotypes from biological, chemical, and physical properties of the soil via two models: random forest and Bayesian neural network. We show that prediction is improved when incorporating environmental features like soil physicochemical properties and microbial population density into the models, in addition to the microbiome information. Exploring various data preprocessing strategies confirms the significant impact of human decisions on predictive performance. We show that the naive total sum scaling normalization that is commonly used in microbiome research is not the optimal strategy to maximize predictive power. Also, we find that accurately defined labels are more important than normalization, taxonomic level or model characteristics. In cases where humans are unable to classify samples accurately, machine learning model performance is limited. Lastly, we provide domain scientists via a full model selection decision tree to identify the human choices that optimize model prediction power. Our work is accompanied by open source reproducible scripts (https://github.com/solislemuslab/soil-microbiome-nn) for maximum outreach among the microbiome research community.
Abstract（参考訳）: 土壌の健康の保全は、農業、人間の健康、生物多様性に大きな影響を与えるため、21世紀の重要な課題である。土壌と生物学的表現型との関係を理解するために,機械学習モデルの予測可能性に関する最初の深い調査を行った。本研究では, ランダム林とベイズニューラルネットワークの2つのモデルを用いて, 土壌の生物学的, 化学的, 物理的特性から, 植物の表現型を正確に予測する統合的枠組みについて検討した。微生物情報に加え, 土壌物理化学的特性や微生物集団密度などの環境特性をモデルに組み込むことにより, 予測が向上することを示す。さまざまなデータ前処理戦略の探索は、人間の決定が予測性能に与える影響を裏付ける。マイクロバイオーム研究で一般的に用いられるnaive total sum scaling normalizationは,予測力の最大化のための最適戦略ではないことを示す。また, 正規化, 分類学レベル, モデル特性よりも, 正確に定義されたラベルの方が重要であることがわかった。人間がサンプルを正確に分類できない場合、機械学習モデルの性能は限られる。最後に、モデル予測能力を最適化する人間の選択を特定するために、完全なモデル選択決定ツリーを通じてドメイン科学者を提供する。我々の研究には、微生物研究コミュニティの最大のアウトリーチのためのオープンソース再現可能なスクリプト(https://github.com/solislemuslab/soil-microbiome-nn)が伴っている。

関連論文リスト

Investigating the Impact of Histopathological Foundation Models on Regressive Prediction of Homologous Recombination Deficiency [52.50039435394964]
回帰に基づくタスクの基礎モデルを体系的に評価する。我々は5つの最先端基礎モデルを用いて、スライド画像全体(WSI)からパッチレベルの特徴を抽出する。乳房、子宮内膜、肺がんコホートにまたがるこれらの抽出された特徴に基づいて、連続したRDDスコアを予測するモデルが訓練されている。
論文参考訳（メタデータ） (2026-01-29T14:06:50Z)
Calibrating Biophysical Models for Grape Phenology Prediction via Multi-Task Learning [5.796482272333648]
本稿では,マルチタスク学習と繰り返しニューラルネットワークを組み合わせたハイブリッドモデリング手法を提案する。生物物理モデルのパラメータを予測するためにマルチタスク学習を用いることで,生物構造を保ちながら品種間の共有学習を可能にする。
論文参考訳（メタデータ） (2025-08-05T20:36:11Z)
Whole-Genome Phenotype Prediction with Machine Learning: Open Problems in Bacterial Genomics [0.8437187555622164]
細菌の全ゲノムデータセットから表現型予測を取り巻く問題を設定し,因果関係の学習に拡張した。我々は、この性質のデータセットに直面した場合、マシンの意思決定の信頼性に影響を与える課題について議論する。
論文参考訳（メタデータ） (2025-02-11T18:25:14Z)
Causal Representation Learning from Multimodal Biomedical Observations [57.00712157758845]
バイオメディカルデータセットの理解を容易にするために,マルチモーダルデータに対するフレキシブルな識別条件と原理的手法を開発した。主要な理論的貢献は、モジュラリティ間の因果関係の構造的空間性である。実世界のヒト表現型データセットの結果は、確立された生物医学研究と一致している。
論文参考訳（メタデータ） (2024-11-10T16:40:27Z)
Stacked ensemble\-based mutagenicity prediction model using multiple modalities with graph attention network [0.9736758288065405]
変異原性は、様々なネガティブな結果をもたらす遺伝子変異と関連しているため、懸念される。本研究では,新しいアンサンブルに基づく変異原性予測モデルを提案する。
論文参考訳（メタデータ） (2024-09-03T09:14:21Z)
Meta Flow Matching: Integrating Vector Fields on the Wasserstein Manifold [83.18058549195855]
自然科学における複数の過程は、確率密度のワッサーシュタイン多様体上のベクトル場として表さなければならない。特に、疾患の発生とその治療反応が患者固有の細胞の微小環境に依存するパーソナライズド医療において重要である。本稿では,これらのベクトル場をワッサーシュタイン多様体上で積分するメタフローマッチング(Meta Flow Matching, MFM)を提案する。
論文参考訳（メタデータ） (2024-08-26T20:05:31Z)
BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。 BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。 6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文参考訳（メタデータ） (2024-05-27T19:57:17Z)
Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文参考訳（メタデータ） (2024-05-27T13:26:34Z)
Whole Genome Transformer for Gene Interaction Effects in Microbiome Habitat Specificity [3.972930262155919]
本研究では、遺伝子ベクター化のための既存の大規模モデルを利用して、微生物ゲノム配列全体から生息地特異性を予測する枠組みを提案する。我々は、異なる生息地から得られた高品質のマイクロバイオームゲノムの大規模なデータセット上で、我々のアプローチを訓練し、検証する。
論文参考訳（メタデータ） (2024-05-09T09:34:51Z)
Seeing Unseen: Discover Novel Biomedical Concepts via Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文参考訳（メタデータ） (2024-03-02T00:56:05Z)
Ecosystem-level Analysis of Deployed Machine Learning Reveals Homogeneous Outcomes [72.13373216644021]
本研究では,機械学習の社会的影響を,特定の文脈に展開されるモデルの集合を考慮し検討する。デプロイされた機械学習はシステム障害を起こしやすいため、利用可能なすべてのモデルに排他的に誤分類されているユーザもいます。これらの例は、エコシステムレベルの分析が、機械学習の社会的影響を特徴づける独自の強みを持っていることを示している。
論文参考訳（メタデータ） (2023-07-12T01:11:52Z)
Application of data engineering approaches to address challenges in microbiome data for optimal medical decision-making [0.0]
この研究は、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である可能性がある。この研究で使用されたプロトタイプは、マイクロバイオームのデータセットに固有の問題に対処し、パーソナライズされた医療を提供するのに非常に有益である。
論文参考訳（メタデータ） (2023-06-30T05:36:39Z)
Adaptive Transfer Learning for Plant Phenotyping [33.28898554551106]
植物表現の表現における現代の機械学習モデルの知識伝達可能性について検討する。植物フェノタイピングにおける注釈付きサンプル数に影響を及ぼす従来の機械学習モデルの性能についてニューラルネットワークに基づく伝達学習モデルは植物の表現型化の性能を向上させるか?
論文参考訳（メタデータ） (2022-01-14T00:40:40Z)
Data-Driven Logistic Regression Ensembles With Applications in Genomics [0.0]
本稿では,正規化とアンサンブルのアイデアを組み合わせた高次元二項分類問題に対する新しいアプローチを提案する。がん,多発性硬化症,乾皮症などの共通疾患を含むいくつかの医学的データセットを用いて,バイオマーカーの予測精度と同定の点で,本手法の優れた性能を実証した。
論文参考訳（メタデータ） (2021-02-17T05:57:26Z)
Towards an Automatic Analysis of CHO-K1 Suspension Growth in Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文参考訳（メタデータ） (2020-10-20T08:36:51Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。