論文の概要: Enhancing Chemical Explainability Through Counterfactual Masking
- arxiv url: http://arxiv.org/abs/2508.18561v1
- Date: Mon, 25 Aug 2025 23:41:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.626619
- Title: Enhancing Chemical Explainability Through Counterfactual Masking
- Title(参考訳): 偽マスキングによる化学説明可能性の強化
- Authors: Łukasz Janisiów, Marek Kochańczyk, Bartosz Zieliński, Tomasz Danel,
- Abstract要約: マスクされたサブストラクチャを化学的に合理的な断片に置き換えるフレームワークである反ファクトファクトマスキングを提案する。
我々のアプローチは、説明可能性と分子設計のギャップを埋め、化学における説明可能な機械学習への原則的で生成的な経路を提供する。
- 参考スコア(独自算出の注目度): 1.1024591739346294
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecular property prediction is a crucial task that guides the design of new compounds, including drugs and materials. While explainable artificial intelligence methods aim to scrutinize model predictions by identifying influential molecular substructures, many existing approaches rely on masking strategies that remove either atoms or atom-level features to assess importance via fidelity metrics. These methods, however, often fail to adhere to the underlying molecular distribution and thus yield unintuitive explanations. In this work, we propose counterfactual masking, a novel framework that replaces masked substructures with chemically reasonable fragments sampled from generative models trained to complete molecular graphs. Rather than evaluating masked predictions against implausible zeroed-out baselines, we assess them relative to counterfactual molecules drawn from the data distribution. Our method offers two key benefits: (1) molecular realism underpinning robust and distribution-consistent explanations, and (2) meaningful counterfactuals that directly indicate how structural modifications may affect predicted properties. We demonstrate that counterfactual masking is well-suited for benchmarking model explainers and yields more actionable insights across multiple datasets and property prediction tasks. Our approach bridges the gap between explainability and molecular design, offering a principled and generative path toward explainable machine learning in chemistry.
- Abstract(参考訳): 分子特性予測は、薬物や物質を含む新しい化合物の設計を導く重要な課題である。
説明可能な人工知能手法は、影響力のある分子のサブ構造を特定することによってモデル予測を精査することを目的としているが、既存の多くのアプローチは、原子または原子レベルの特徴を除去し、忠実度測定によって重要度を評価するマスキング戦略に依存している。
しかしながら、これらの方法はしばしば基礎となる分子分布に固執せず、非直観的な説明をもたらす。
本研究では,分子グラフの完成のために訓練された生成モデルから採取した化学的に合理的な断片にマスクされたサブ構造を置き換える新しいフレームワークである反ファクトファクトマスキングを提案する。
データ分布から引き出された反事実分子と比較して,マスク付き予測を不確定なゼロアウトベースラインに対して評価する。
提案手法は,(1) 構造変化が予測特性にどのように影響するかを直接示す意味のある反事実,という2つの重要な利点を提供する。
モデル説明器のベンチマークにはカウンターファクトマスキングが適しており、複数のデータセットやプロパティ予測タスクにまたがってより実用的な洞察が得られることを実証する。
我々のアプローチは、説明可能性と分子設計のギャップを埋め、化学における説明可能な機械学習への原則的で生成的な経路を提供する。
関連論文リスト
- $\text{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。
実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-08-12T05:46:47Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Explainable Molecular Property Prediction: Aligning Chemical Concepts with Predictions via Language Models [26.838674632817877]
言語モデルに基づく分子特性予測のためのフレームワークを開発し,これをLamoleと呼ぶ。
文字列ベースの分子表現 -- Group SELFIES -- を入力トークンとして、事前にトレーニングし、Lamoleを微調整します。
我々はLamoleが同等の分類精度を達成でき、説明精度を最大14.3%向上させることができることを示した。
論文 参考訳(メタデータ) (2024-05-25T03:27:04Z) - Contrastive Dual-Interaction Graph Neural Network for Molecular Property Prediction [0.0]
本稿では,分子特性予測のための自己教師付きグラフニューラルネットワークフレームワークであるDIG-Molを紹介する。
DIG-Molは2つの相互接続ネットワークと運動量蒸留ネットワークを統合し、分子特性を効率的に改善する。
我々は,様々な分子特性予測タスクにおける広範囲な実験的評価により,DIG-Molの最先端性能を確立した。
論文 参考訳(メタデータ) (2024-05-04T10:09:27Z) - Atomic and Subgraph-aware Bilateral Aggregation for Molecular
Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。
ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。
本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文 参考訳(メタデータ) (2023-05-22T00:56:00Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Flexible dual-branched message passing neural network for quantum
mechanical property prediction with molecular conformation [16.08677447593939]
メッセージパッシングフレームワークに基づく分子特性予測のための二重分岐ニューラルネットワークを提案する。
本モデルでは,様々なスケールで異種分子の特徴を学習し,予測対象に応じて柔軟に学習する。
論文 参考訳(メタデータ) (2021-06-14T10:00:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。