論文の概要: Predicting Chemical Hazard across Taxa through Machine Learning
- arxiv url: http://arxiv.org/abs/2110.03688v1
- Date: Thu, 7 Oct 2021 15:33:58 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-11 16:25:34.685744
- Title: Predicting Chemical Hazard across Taxa through Machine Learning
- Title(参考訳): 機械学習による分類学的ハザード予測
- Authors: Jimeng Wu, Simone D'Ambrosi, Lorenz Ammann, Julita Stadnicka-Michalak,
Kristin Schirmer, Marco Baity-Jesi
- Abstract要約: 分類学と実験装置の関連性を分析し,それらを考慮に入れれば,分類性能の大幅な向上が期待できることを示す。
我々は、一般的な機械学習モデル(K-nearest neighbors、ランダムフォレスト、ディープニューラルネットワーク)と、最近提案されたリード・アクロス構造活動関係(RASAR)モデルを用いています。
- 参考スコア(独自算出の注目度): 0.3262230127283452
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We apply machine learning methods to predict chemical hazards focusing on
fish acute toxicity across taxa. We analyze the relevance of taxonomy and
experimental setup, and show that taking them into account can lead to
considerable improvements in the classification performance. We quantify the
gain obtained by introducing the taxonomic and experimental information,
compared to classifying based on chemical information alone. We use our
approach with standard machine learning models (K-nearest neighbors, random
forests and deep neural networks), as well as the recently proposed Read-Across
Structure Activity Relationship (RASAR) models, which were very successful in
predicting chemical hazards to mammals based on chemical similarity. We are
able to obtain accuracies of over 0.93 on datasets where, due to noise in the
data, the maximum achievable accuracy is expected to be below 0.95, which
results in an effective accuracy of 0.98. The best performances are obtained by
random forests and RASAR models. We analyze metrics to compare our results with
animal test reproducibility, and despite most of our models 'outperform animal
test reproducibility' as measured through recently proposed metrics, we show
that the comparison between machine learning performance and animal test
reproducibility should be addressed with particular care. While we focus on
fish mortality, our approach, provided that the right data is available, is
valid for any combination of chemicals, effects and taxa.
- Abstract(参考訳): 魚の急性毒性に焦点をあてた化学物質害予測に機械学習を適用した。
分類学と実験的な設定の関連性を分析し,それらを考慮に入れると分類性能が大幅に向上することを示す。
分類学および実験情報の導入により得られた利得を化学情報のみに基づく分類と比較して定量化する。
我々は、化学類似性に基づいて哺乳類に対する化学的危険を予測するのに非常に成功した標準的な機械学習モデル(K-nearest neighbors、ランダムフォレスト、ディープニューラルネットワーク)と、最近提案されたリード・アクロス構造活動関係(RASAR)モデルを用いています。
データセット上で0.93以上の精度を得ることができ、データ中のノイズのため、達成可能な最大精度は0.95以下と予測され、有効精度は0.98となる。
最高のパフォーマンスはランダム森林とRASARモデルによって得られる。
我々は,実験結果と動物実験再現性を比較し,最近提案した指標から得られた「動物実験再現性に優れる」モデルがほとんどであるにもかかわらず,機械学習性能と動物実験再現性の比較は,特定のケアで扱うべきであることを示す。
魚の死亡率に焦点を当てているが、適切なデータが利用可能であれば、化学物質、効果、分類のあらゆる組み合わせに有効である。
関連論文リスト
- Smoke and Mirrors in Causal Downstream Tasks [59.90654397037007]
本稿では, 治療効果推定の因果推論タスクについて検討し, 高次元観察において利害関係が記録されている。
最先端の視覚バックボーンから微調整した6つの480モデルを比較し、サンプリングとモデリングの選択が因果推定の精度に大きく影響することを発見した。
以上の結果から,今後のベンチマークでは,下流の科学的問題,特に因果的な問題について慎重に検討すべきであることが示唆された。
論文 参考訳(メタデータ) (2024-05-27T13:26:34Z) - Harmful algal bloom forecasting. A comparison between stream and batch
learning [0.7067443325368975]
有害なアルガルブルーム(HAB)は公衆衛生と貝類産業にリスクをもたらす。
本研究では,有毒なジノフラゲレートの細胞数を予測する機械学習ワークフローを開発した。
モデルDoMEは最も効果的で解釈可能な予測器として登場し、他のアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2024-02-20T15:01:11Z) - Hybrid Machine Learning techniques in the management of harmful algal
blooms impact [0.7864304771129751]
軟体動物栽培はハーモフル藻類(HAB)の影響を受けうる
HABは高濃度の藻のエピソードであり、人間の消費に有害である可能性がある。
人的消費のリスクを避けるため、毒性が検出されると収穫が禁止される。
論文 参考訳(メタデータ) (2024-02-14T15:59:22Z) - Producing Plankton Classifiers that are Robust to Dataset Shift [1.716364772047407]
ZooLakeデータセットを10日間の独立デプロイから手動でアノテートしたイメージと統合し、OOD(Out-Of-Dataset)のパフォーマンスをベンチマークします。
分類に悪影響を及ぼすOOD画像において,新たなデータの分類において潜在的な落とし穴を識別するプリエンプティブアセスメント手法を提案する。
BEiTビジョントランスのアンサンブルは,OODロバスト性,幾何アンサンブル,回転型テストタイムアンサンブルに対応し,BEsTモデルと呼ばれる最もロバストなモデルとなっている。
論文 参考訳(メタデータ) (2024-01-25T15:47:18Z) - Comparative Analysis of Epileptic Seizure Prediction: Exploring Diverse
Pre-Processing Techniques and Machine Learning Models [0.0]
脳波データを用いたてんかん発作予測のための5つの機械学習モデルの比較分析を行った。
本分析の結果は,各モデルの性能を精度で示すものである。
ETモデルは99.29%の精度で最高の性能を示した。
論文 参考訳(メタデータ) (2023-08-06T08:50:08Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Extracting Chemical-Protein Interactions via Calibrated Deep Neural
Network and Self-training [0.8376091455761261]
データ不確実性を推定し、信頼性を向上させるため、ディープラーニングモデルに"校正"技術が適用されている。
本研究では, 化学物質-タンパク質相互作用を抽出するために, 不確実性情報とキャリブレーション手法を取り入れたDNNベースの手法を提案する。
我々の手法は,従来の手法よりも高い校正能力を維持しつつ,Biocreative VI ChemProtタスクに関して最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2020-11-04T10:14:31Z) - Machine learning for causal inference: on the use of cross-fit
estimators [77.34726150561087]
より優れた統計特性を得るために、二重ローバストなクロスフィット推定器が提案されている。
平均因果効果(ACE)に対する複数の推定器の性能評価のためのシミュレーション研究を行った。
機械学習で使用する場合、二重確率のクロスフィット推定器は、バイアス、分散、信頼区間のカバレッジで他のすべての推定器よりも大幅に優れていた。
論文 参考訳(メタデータ) (2020-04-21T23:09:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。