論文の概要: Explaining Chemical Toxicity using Missing Features
- arxiv url: http://arxiv.org/abs/2009.12199v1
- Date: Wed, 23 Sep 2020 23:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-15 16:40:11.987498
- Title: Explaining Chemical Toxicity using Missing Features
- Title(参考訳): 欠落特徴を用いた化学毒性の解明
- Authors: Kar Wai Lim, Bhanushee Sharma, Payel Das, Vijil Chenthamarakshan,
Jonathan S. Dordick
- Abstract要約: 機械学習を用いた化学毒性予測は、反復的な動物実験とヒト試験を減らし、コストと時間を節約するために、医薬品開発において重要である。
計算毒性学モデルの予測は機械的に説明可能であることが強く推奨されている。
本稿では,最近開発されたコントラスト的説明法 (CEM) を適用し,なぜ化学物質や分子が有毒であるか否かの理由を説明する。
- 参考スコア(独自算出の注目度): 12.659531194569078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Chemical toxicity prediction using machine learning is important in drug
development to reduce repeated animal and human testing, thus saving cost and
time. It is highly recommended that the predictions of computational toxicology
models are mechanistically explainable. Current state of the art machine
learning classifiers are based on deep neural networks, which tend to be
complex and harder to interpret. In this paper, we apply a recently developed
method named contrastive explanations method (CEM) to explain why a chemical or
molecule is predicted to be toxic or not. In contrast to popular methods that
provide explanations based on what features are present in the molecule, the
CEM provides additional explanation on what features are missing from the
molecule that is crucial for the prediction, known as the pertinent negative.
The CEM does this by optimizing for the minimum perturbation to the model using
a projected fast iterative shrinkage-thresholding algorithm (FISTA). We
verified that the explanation from CEM matches known toxicophores and findings
from other work.
- Abstract(参考訳): 機械学習を用いた化学物質毒性の予測は、繰り返し動物や人間の検査を減らすために、薬物開発において重要であり、コストと時間を節約する。
計算毒性モデルの予測は機械的に説明可能であることが強く推奨されている。
最先端の機械学習分類器の現在の状態は、複雑で解釈が難しいディープニューラルネットワークに基づいている。
本稿では,最近開発されたコントラスト的説明法 (CEM) を適用し,なぜ化学物質や分子が有毒であるか否かの理由を説明する。
分子にどのような特徴が存在するかに基づいた説明を提供する一般的な方法とは対照的に、cemは、関連する負として知られる予測に不可欠な分子から何が欠けているかに関する追加の説明を提供する。
CEMは、予測された高速反復収縮保持アルゴリズム(FISTA)を用いて、最小摂動をモデルに最適化する。
我々はCEMによる説明が既知の毒素と他の研究の知見と一致していることを確認した。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Balancing Molecular Information and Empirical Data in the Prediction of Physico-Chemical Properties [8.649679686652648]
本稿では,分子記述子と表現学習を組み合わせた一般的な手法を提案する。
提案したハイブリッドモデルは,グラフニューラルネットワークを用いた化学構造情報を利用する。
構造に基づく予測が信頼できない場合を自動的に検出し、表現学習に基づく予測によって修正する。
論文 参考訳(メタデータ) (2024-06-12T10:51:00Z) - A Mechanistic Understanding of Alignment Algorithms: A Case Study on DPO
and Toxicity [33.235015978211315]
本稿では、一般的なアルゴリズム、直接選好最適化(DPO)、および毒性を減少させるメカニズムについて検討する。
具体的には,まず,事前学習した言語モデルであるGPT2-mediumにおいて毒性がどのように表現され,引き起こされるかを検討する。
得られたモデルが有毒な出力を回避しているかを調べ、事前学習から得られた能力は排除されず、むしろ回避される。
論文 参考訳(メタデータ) (2024-01-03T20:26:15Z) - Mitigating Molecular Aggregation in Drug Discovery with Predictive
Insights from Explainable AI [1.0499611180329804]
分子凝集の原因の理解の欠如は、凝集分子を検出するための予測ツールの開発に困難をもたらす。
本稿では, 凝集分子と非凝集分子のデータセットを識別する分子特性と, 分子凝集を予測する機械学習アプローチについて検討する。
提案手法では,解析可能なグラフニューラルネットワークとファクトファクトを使用して,アグリゲーションを確実に予測し,説明し,将来のスクリーニングのための追加の洞察と設計ルールを提供する。
論文 参考訳(メタデータ) (2023-06-03T22:30:45Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - MolCPT: Molecule Continuous Prompt Tuning to Generalize Molecular
Representation Learning [77.31492888819935]
分子表現学習のための「プリトレイン,プロンプト,ファインチューン」という新しいパラダイム,分子連続プロンプトチューニング(MolCPT)を提案する。
MolCPTは、事前訓練されたモデルを使用して、スタンドアロンの入力を表現的なプロンプトに投影するモチーフプロンプト関数を定義する。
いくつかのベンチマークデータセットの実験により、MollCPTは分子特性予測のために学習済みのGNNを効率的に一般化することが示された。
論文 参考訳(メタデータ) (2022-12-20T19:32:30Z) - CX-ToM: Counterfactual Explanations with Theory-of-Mind for Enhancing
Human Trust in Image Recognition Models [84.32751938563426]
我々は、深層畳み込みニューラルネットワーク(CNN)による決定を説明するための、新しい説明可能なAI(XAI)フレームワークを提案する。
単発応答として説明を生成するXAIの現在の手法とは対照的に,我々は反復的な通信プロセスとして説明を行う。
本フレームワークは,機械の心と人間の心の相違を媒介し,対話における説明文のシーケンスを生成する。
論文 参考訳(メタデータ) (2021-09-03T09:46:20Z) - MEG: Generating Molecular Counterfactual Explanations for Deep Graph
Networks [11.291571222801027]
本稿では, 分子特性予測 t の文脈における深層グラフネットワークの説明可能性に取り組むための新しいアプローチを提案する。
我々は, 構造的類似度が高く, 予測特性の異なる(有意)化合物の形で, 特定の予測に対する情報的反実的説明を生成する。
モデルが非ML専門家に分子の近傍に焦点を絞った学習モデルに関する重要な洞察を伝達する方法を示す結果について議論する。
論文 参考訳(メタデータ) (2021-04-16T12:17:19Z) - Learning Graph Models for Retrosynthesis Prediction [90.15523831087269]
再合成予測は有機合成の基本的な問題である。
本稿では,前駆体分子のグラフトポロジーが化学反応中にほとんど変化しないという考え方を生かしたグラフベースのアプローチを提案する。
提案モデルでは,テンプレートフリーおよび半テンプレートベースの手法よりも高い5,3.7%の精度でトップ1の精度を実現している。
論文 参考訳(メタデータ) (2020-06-12T09:40:42Z) - Predicting drug properties with parameter-free machine learning:
Pareto-Optimal Embedded Modeling (POEM) [0.13854111346209866]
POEMは、最適化を必要とせず、信頼性の高い予測モデルを生成するために開発された非パラメトリックな教師付きMLアルゴリズムである。
我々は、業界標準のMLアルゴリズムと比較してPOEMをベンチマークし、17の分類タスクにまたがって結果を公表する。
論文 参考訳(メタデータ) (2020-02-11T17:20:28Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。