論文の概要: Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?
- arxiv url: http://arxiv.org/abs/2506.10912v1
- Date: Thu, 12 Jun 2025 17:25:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-13 15:37:22.864189
- Title: Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification?
- Title(参考訳): 分子の破壊:MLLMは構造レベル分子の解毒の準備が整っているか?
- Authors: Fei Lin, Ziyang Gong, Cong Wang, Yonglin Tian, Tengchao Zhang, Xue Yang, Gen Luo, Fei-Yue Wang,
- Abstract要約: ToxiMolは、分子毒性の修復に焦点を当てた汎用マルチモーダル言語モデル(MLLM)のための最初のベンチマークタスクである。
11の一次課題と560の有毒な分子を包含し, 多様な機構と粒度にまたがる標準データセットを構築した。
- 参考スコア(独自算出の注目度): 19.700175505235876
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Toxicity remains a leading cause of early-stage drug development failure. Despite advances in molecular design and property prediction, the task of molecular toxicity repair - generating structurally valid molecular alternatives with reduced toxicity - has not yet been systematically defined or benchmarked. To fill this gap, we introduce ToxiMol, the first benchmark task for general-purpose Multimodal Large Language Models (MLLMs) focused on molecular toxicity repair. We construct a standardized dataset covering 11 primary tasks and 560 representative toxic molecules spanning diverse mechanisms and granularities. We design a prompt annotation pipeline with mechanism-aware and task-adaptive capabilities, informed by expert toxicological knowledge. In parallel, we propose an automated evaluation framework, ToxiEval, which integrates toxicity endpoint prediction, synthetic accessibility, drug-likeness, and structural similarity into a high-throughput evaluation chain for repair success. We systematically assess nearly 30 mainstream general-purpose MLLMs and design multiple ablation studies to analyze key factors such as evaluation criteria, candidate diversity, and failure attribution. Experimental results show that although current MLLMs still face significant challenges on this task, they begin to demonstrate promising capabilities in toxicity understanding, semantic constraint adherence, and structure-aware molecule editing.
- Abstract(参考訳): 毒性は、まだ初期段階の薬物開発失敗の主要な原因である。
分子設計と特性予測の進歩にもかかわらず、分子毒性修復(毒性を低減した構造的に有効な分子代替物を生成する)の課題はまだ体系的に定義されておらず、ベンチマークも行われていない。
このギャップを埋めるために,分子毒性修復に焦点を当てた汎用マルチモーダル言語モデル(MLLM)の最初のベンチマークタスクであるToxiMolを紹介した。
11の一次課題と560の有毒な分子を包含し, 多様な機構と粒度にまたがる標準データセットを構築した。
我々は、専門家の毒性学知識から情報を得た、メカニズム認識とタスク適応機能を備えたプロンプトアノテーションパイプラインを設計する。
並行して、毒性の終端予測、合成アクセシビリティ、薬物類似性、構造的類似性を高スループット評価チェーンに統合し、修復を成功させる自動評価フレームワークToxiEvalを提案する。
本研究では,30近いMLLMを体系的に評価し,評価基準,候補多様性,障害帰属といった重要な要因を分析するために,複数のアブレーション研究を設計する。
実験の結果、現在のMLLMは依然としてこの課題に直面するが、毒性の理解、意味的制約の固着、構造を意識した分子編集における有望な能力を実証し始めた。
関連論文リスト
- Beyond Chemical QA: Evaluating LLM's Chemical Reasoning with Modular Chemical Operations [43.623140005091535]
我々は、分子構造理解を算術に着想を得た演算でブリッジする推論フレームワークであるChemCoTBenchを紹介する。
ChemCoTBenchは、化学的問題解決を透明でステップバイステップの推論に形式化する。
分子特性最適化と化学反応予測という2つの高影響タスクのモデルを評価する。
論文 参考訳(メタデータ) (2025-05-27T15:15:44Z) - Intelligent System for Automated Molecular Patent Infringement Assessment [38.48937966447085]
PatentFinderは、特許侵害のための小さな分子を正確かつ包括的に評価できる、新しいマルチエージェントおよびツール強化インテリジェンスシステムである。
PatentFinderは、特許請求と分子構造を協調的に分析する5つの特殊エージェントを備えている。
PatentFinderは、詳細かつ解釈可能な特許侵害報告を自律的に生成し、精度の向上と解釈可能性の向上を示す。
論文 参考訳(メタデータ) (2024-12-10T12:14:38Z) - Smirk: An Atomically Complete Tokenizer for Molecular Foundation Models [0.0]
既存のモデルは、分子空間のごく一部しか捉えない閉語彙トークン化器によって制約される。
我々は,n-gram言語モデルを低コストなプロキシとして導入し,分子特性予測のための18のRoBERTa型エンコーダの訓練と微調整により,それらの有効性を検証する。
我々は、OpenSMILES仕様を網羅した2つの新しいトークンー、SmirkとSmirk-GPEを提案する。
論文 参考訳(メタデータ) (2024-09-19T02:36:04Z) - Uncovering the Mechanism of Hepatotoxiciy of PFAS Targeting L-FABP Using GCN and Computational Modeling [1.6249398255272316]
ペルフルオロアルキル(PFAS)とポリフルオロアルキル(PFAS)は環境汚染物質であり、毒性や生物蓄積に問題がある。
本研究では, 半教師付きグラフ畳み込みネットワーク(GCN)と分子ディスクリプタと指紋を組み合わせることにより, PFAS毒性の予測モデルを作成する。
論文 参考訳(メタデータ) (2024-09-16T15:13:39Z) - Detoxifying Large Language Models via Knowledge Editing [57.0669577257301]
本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。
我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。
いくつかの知識編集手法を用いて実験を行い、知識編集がLLMを解毒する可能性を示し、汎用性能に限られた影響を与えていることを示す。
論文 参考訳(メタデータ) (2024-03-21T15:18:30Z) - Toxicity Detection in Drug Candidates using Simplified Molecular-Input
Line-Entry System [0.0]
新しい薬物候補の毒性の分析の必要性とそれを行うための要件は、科学者の考慮を求めています。
本稿では,Long short term memory (LSTM) に基づくモデルを構築するためのパラメータとして,SMILES(simple Molecular Input Line-Entry System)を提案する。
論文 参考訳(メタデータ) (2021-01-21T07:02:21Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。