論文の概要: Auto-ADMET: An Effective and Interpretable AutoML Method for Chemical ADMET Property Prediction
- arxiv url: http://arxiv.org/abs/2502.16378v1
- Date: Sat, 22 Feb 2025 22:54:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-25 15:56:11.566078
- Title: Auto-ADMET: An Effective and Interpretable AutoML Method for Chemical ADMET Property Prediction
- Title(参考訳): Auto-ADMET:化学ADMET特性予測のための有効かつ解釈可能なAutoML法
- Authors: Alex G. C. de Sá, David B. Ascher,
- Abstract要約: 本研究は、化学ADMET特性予測のための解釈可能な進化型AutoML法であるAuto-ADMETを紹介する。
3つの代替手法に対して同等またはより良い予測性能を達成する。
ベイジアンネットワークモデルを用いたAuto-ADMETの進化過程は、探索手順の整形とAutoMLのパフォーマンスの原因の解釈を補助する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Machine learning (ML) has been playing important roles in drug discovery in the past years by providing (pre-)screening tools for prioritising chemical compounds to pass through wet lab experiments. One of the main ML tasks in drug discovery is to build quantitative structure-activity relationship (QSAR) models, associating the molecular structure of chemical compounds with an activity or property. These properties -- including absorption, distribution, metabolism, excretion and toxicity (ADMET) -- are essential to model compound behaviour, activity and interactions in the organism. Although several methods exist, the majority of them do not provide an appropriate model's personalisation, yielding to bias and lack of generalisation to new data since the chemical space usually shifts from application to application. This fact leads to low predictive performance when completely new data is being tested by the model. The area of Automated Machine Learning (AutoML) emerged aiming to solve this issue, outputting tailored ML algorithms to the data at hand. Although an important task, AutoML has not been practically used to assist cheminformatics and computational chemistry researchers often, with just a few works related to the field. To address these challenges, this work introduces Auto-ADMET, an interpretable evolutionary-based AutoML method for chemical ADMET property prediction. Auto-ADMET employs a Grammar-based Genetic Programming (GGP) method with a Bayesian Network Model to achieve comparable or better predictive performance against three alternative methods -- standard GGP method, pkCSM and XGBOOST model -- on 12 benchmark chemical ADMET property prediction datasets. The use of a Bayesian Network model on Auto-ADMET's evolutionary process assisted in both shaping the search procedure and interpreting the causes of its AutoML performance.
- Abstract(参考訳): 機械学習(ML)は、湿った実験室を通り抜けるために化学物質を優先する(前)スクリーニングツールを提供することで、薬物発見においてここ数年重要な役割を担っている。
薬物発見におけるMLの主な課題の1つは、量的構造-活性関係(QSAR)モデルを構築し、化学化合物の分子構造と活性や性質を関連付けることである。
吸収、分布、代謝、排ガス、毒性(ADMET)を含むこれらの性質は、有機体の化合物の挙動、活動、相互作用のモデル化に不可欠である。
いくつかの方法が存在するが、その大半は適切なモデルのパーソナライズを提供しておらず、通常は化学空間が適用から適用へと移行するので、バイアスや一般化の欠如が新しいデータに繋がる。
この事実は、モデルによって完全に新しいデータがテストされている場合、予測性能を低下させる。
Automated Machine Learning (AutoML) の領域はこの問題の解決を目的として登場し、データにカスタマイズされたMLアルゴリズムを出力した。
重要なタスクであるが、AutoMLは化学情報学や計算化学研究者を支援するために実際に使われていない。
これらの課題に対処するために、化学ADMET特性予測のための解釈可能な進化型AutoML法であるAuto-ADMETを導入する。
Auto-ADMETは、標準GGPメソッド、pkCSM、XGBOOSTモデルという3つの代替手法に対して、12のベンチマーク化学ADMETプロパティ予測データセットに対して同等またはより良い予測性能を達成するために、ベイジアンネットワークモデルとグラマーベースの遺伝的プログラミング(GGP)手法を使用している。
ベイジアンネットワークモデルを用いたAuto-ADMETの進化的プロセスは、探索手順の整形とAutoMLのパフォーマンスの原因の解釈を補助する。
関連論文リスト
- AutoML-Agent: A Multi-Agent LLM Framework for Full-Pipeline AutoML [56.565200973244146]
自動機械学習(Automated Machine Learning, ML)は、開発パイプライン内のタスクを自動化することによって、AI開発を加速する。
近年の作業では,そのような負担を軽減するために,大規模言語モデル(LLM)の利用が始まっている。
本稿では,フルパイプのAutoMLに適した新しいマルチエージェントフレームワークであるAutoML-Agentを提案する。
論文 参考訳(メタデータ) (2024-10-03T20:01:09Z) - Towards Evolutionary-based Automated Machine Learning for Small Molecule Pharmacokinetic Prediction [0.0]
小分子の性質は、医薬品開発の初期段階において不可欠である。
既存のメソッドにはパーソナライゼーションがなく、手作業によるMLアルゴリズムやパイプラインに依存している。
分子特性の予測に特化して設計された進化型自動ML法(AutoML)を提案する。
論文 参考訳(メタデータ) (2024-08-01T09:46:06Z) - AutoAct: Automatic Agent Learning from Scratch for QA via Self-Planning [54.47116888545878]
AutoActはQAのための自動エージェント学習フレームワークである。
大規模アノテートデータやクローズドソースモデルからの合成計画軌道は依存していない。
論文 参考訳(メタデータ) (2024-01-10T16:57:24Z) - Benchmarking Automated Machine Learning Methods for Price Forecasting
Applications [58.720142291102135]
自動機械学習(AutoML)ソリューションで手作業で作成したMLパイプラインを置換する可能性を示す。
CRISP-DMプロセスに基づいて,手動MLパイプラインを機械学習と非機械学習に分割した。
本稿では、価格予測の産業利用事例として、ドメイン知識とAutoMLを組み合わせることで、ML専門家への依存が弱まることを示す。
論文 参考訳(メタデータ) (2023-04-28T10:27:38Z) - AutoEn: An AutoML method based on ensembles of predefined Machine
Learning pipelines for supervised Traffic Forecasting [1.6242924916178283]
交通予測(TF)は、将来の交通状況を予測することで交通渋滞を緩和する能力により、関連性が高まっている。
TFは、モデル選択問題(MSP)として知られる機械学習パラダイムに大きな課題を提起する。
事前に定義されたMLパイプラインの集合からマルチクラス化アンサンブルを自動生成する,シンプルで効率的な手法であるAutoEnを紹介する。
論文 参考訳(メタデータ) (2023-03-19T18:37:18Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- a combined
machine learning and molecular modeling method [2.8381402107366034]
我々は、リード最適化ワークフローを自動化する機械学習と分子モデリングを組み合わせたアプローチを提案する。
本手法は, 薬剤の有効性向上に有効な, ホットスポットの新規なヒントを提供する。
論文 参考訳(メタデータ) (2020-11-27T15:41:00Z) - Evolution of Scikit-Learn Pipelines with Dynamic Structured Grammatical
Evolution [1.5224436211478214]
本稿では、動的構造文法進化(DSGE)をScikit-Learn分類パイプラインの進化に適応させる新しい文法ベースのフレームワークについて述べる。
実験結果は、AutoML-DSGEを他の文法ベースのAutoMLフレームワークであるResilient ClassificationPipeline Evolution (RECIPE)と比較することを含む。
論文 参考訳(メタデータ) (2020-04-01T09:31:34Z) - Predicting drug properties with parameter-free machine learning:
Pareto-Optimal Embedded Modeling (POEM) [0.13854111346209866]
POEMは、最適化を必要とせず、信頼性の高い予測モデルを生成するために開発された非パラメトリックな教師付きMLアルゴリズムである。
我々は、業界標準のMLアルゴリズムと比較してPOEMをベンチマークし、17の分類タスクにまたがって結果を公表する。
論文 参考訳(メタデータ) (2020-02-11T17:20:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。