論文の概要: Evaluating machine learning models for predicting pesticides toxicity to honey bees
- arxiv url: http://arxiv.org/abs/2503.24305v3
- Date: Thu, 10 Apr 2025 09:38:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-11 12:22:46.857574
- Title: Evaluating machine learning models for predicting pesticides toxicity to honey bees
- Title(参考訳): ミツバチに対する農薬毒性予測のための機械学習モデルの評価
- Authors: Jakub Adamczyk, Jakub Poziemski, Pawel Siedlecki,
- Abstract要約: ApisToxは、ミツバチに対する化学毒性を実験的に検証した最も包括的なデータセットである。
分子指紋,グラフカーネル,グラフニューラルネットワークなど,さまざまな機械学習アプローチを用いてApisToxを評価する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Small molecules play a critical role in the biomedical, environmental, and agrochemical domains, each with distinct physicochemical requirements and success criteria. Although biomedical research benefits from extensive datasets and established benchmarks, agrochemical data remain scarce, particularly with respect to species-specific toxicity. This work focuses on ApisTox, the most comprehensive dataset of experimentally validated chemical toxicity to the honey bee (Apis mellifera), an ecologically vital pollinator. We evaluate ApisTox using a diverse suite of machine learning approaches, including molecular fingerprints, graph kernels, and graph neural networks, as well as pretrained models. Comparative analysis with medicinal datasets from the MoleculeNet benchmark reveals that ApisTox represents a distinct chemical space. Performance degradation on non-medicinal datasets, such as ApisTox, demonstrates their limited generalizability of current state-of-the-art algorithms trained solely on biomedical data. Our study highlights the need for more diverse datasets and for targeted model development geared toward the agrochemical domain.
- Abstract(参考訳): 小分子は、それぞれ異なる物理化学的要求と成功基準を持つ、生物医学、環境学、農業化学領域において重要な役割を担っている。
生物医学的な研究は広範なデータセットや確立されたベンチマークから恩恵を受けるが、農薬のデータは、特に種特異的な毒性に関してほとんど残っていない。
この研究は、ミツバチ(Apis mellifera)に対する化学毒性を実験的に検証した最も包括的なデータセットであるApisToxに焦点を当てている。
ApisToxの評価には,分子指紋,グラフカーネル,グラフニューラルネットワーク,事前学習モデルなど,さまざまな機械学習アプローチが使用されている。
MoleculeNetベンチマークの医学的データセットとの比較分析により、ApisToxは別個の化学空間を表すことが明らかとなった。
ApisToxのような非メディカルデータセットのパフォーマンス劣化は、バイオメディカルデータのみに基づいてトレーニングされた現在の最先端アルゴリズムの限定的な一般化性を示している。
本研究は,アグロケミカル領域を対象にした,より多様なデータセットとターゲットモデル開発の必要性を強調した。
関連論文リスト
- ScholarChemQA: Unveiling the Power of Language Models in Chemical Research Question Answering [54.80411755871931]
質問回答(QA)は、言語モデルの推論と知識の深さを効果的に評価する。
化学QAは、複雑な化学情報を理解しやすい形式に効果的に翻訳することで、教育と研究の両方において重要な役割を担っている。
このデータセットは、不均衡なデータ分散や、潜在的に有用である可能性のあるかなりの量の未ラベルデータを含む、典型的な現実世界の課題を反映している。
収集したデータを完全に活用して,化学的な問題に効果的に答えるQAMatchモデルを提案する。
論文 参考訳(メタデータ) (2024-07-24T01:46:55Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - ApisTox: a new benchmark dataset for the classification of small molecules toxicity on honey bees [0.0]
ApisToxはミツバチに対する殺虫剤の毒性に焦点を当てた包括的データセットである
このデータセットはECOTOXやPPDBといった既存のソースのデータを組み合わせて活用する。
ApisToxは、アグロケミカル化合物の分子特性予測法をベンチマークするためのユニークな資源を提供する。
論文 参考訳(メタデータ) (2024-04-24T20:35:17Z) - Benchmarking Toxic Molecule Classification using Graph Neural Networks
and Few Shot Learning [0.0]
従来のグラフ畳み込みネットワーク(GCN)は、限られたデータとクラス不均衡を伴う課題に直面している。
グラフ等化ネットワーク,マルチヘッドアテンション,およびグラフ上の大規模アドバイザリ拡張を個別に活用する。
我々はFew-Shot Learningを導入し、限られた注釈付きサンプルを用いてモデルの一般化を改善する。
論文 参考訳(メタデータ) (2023-11-22T16:07:32Z) - MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。
すべての候補原子と結合をノードとして扱い、それらをグラフ化する。
グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文 参考訳(メタデータ) (2023-08-23T16:16:11Z) - Human Limits in Machine Learning: Prediction of Plant Phenotypes Using
Soil Microbiome Data [0.2812395851874055]
我々は,土壌と生物表現型との関係を理解するために,機械学習モデルの予測可能性について,初めて深く研究した。
土壌物理化学的特性や微生物集団密度などの環境特性をモデルに組み込んだ場合, 予測精度が向上することを示す。
論文 参考訳(メタデータ) (2023-06-19T20:52:37Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - A Distant Supervision Corpus for Extracting Biomedical Relationships
Between Chemicals, Diseases and Genes [35.372588846754645]
ChemDisGeneは、マルチクラスマルチラベル文書レベルのバイオメディカル関係抽出モデルのトレーニングと評価のための新しいデータセットである。
我々のデータセットには、化学物質、疾患、遺伝子への言及をラベル付けした80万のバイオメディカル研究が含まれている。
論文 参考訳(メタデータ) (2022-04-13T18:02:05Z) - Unassisted Noise Reduction of Chemical Reaction Data Sets [59.127921057012564]
本稿では,データセットから化学的に間違ったエントリを除去するための,機械学習に基づく無支援アプローチを提案する。
その結果,クリーン化およびバランスの取れたデータセットでトレーニングしたモデルの予測精度が向上した。
論文 参考訳(メタデータ) (2021-02-02T09:34:34Z) - Towards an Automatic Analysis of CHO-K1 Suspension Growth in
Microfluidic Single-cell Cultivation [63.94623495501023]
我々は、人間の力で抽象化されたニューラルネットワークをデータレベルで注入できる新しい機械学習アーキテクチャを提案する。
具体的には、自然データと合成データに基づいて生成モデルを同時に訓練し、細胞数などの対象変数を確実に推定できる共有表現を学習する。
論文 参考訳(メタデータ) (2020-10-20T08:36:51Z) - Graph Neural Networks for the Prediction of Substrate-Specific Organic
Reaction Conditions [79.45090959869124]
有機化学反応をモデル化するために,グラフニューラルネットワーク(GNN)を用いた系統的研究を行った。
実験試薬と条件の識別に関わる分類タスクに対して、7つの異なるGNNアーキテクチャを評価した。
論文 参考訳(メタデータ) (2020-07-08T17:21:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。