論文の概要: MolDeTox: Evaluating Language Model's Stepwise Fragment Editing for Molecular Detoxification
- arxiv url: http://arxiv.org/abs/2605.12181v1
- Date: Tue, 12 May 2026 14:24:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 21:48:56.921339
- Title: MolDeTox: Evaluating Language Model's Stepwise Fragment Editing for Molecular Detoxification
- Title(参考訳): MolDeTox: 分子デトキシ化のための言語モデルの段階的フラグメント編集の評価
- Authors: Jueon Park, Wonjune Jang, Jiwoo Lee, Yein Park, Jaewoo Kang,
- Abstract要約: 大規模言語モデル(LLM)とビジョン言語モデル(VLM)は、最近、有望な機能を示している。
MolDeToxは分子デトキシ化のための新しいベンチマークである。
- 参考スコア(独自算出の注目度): 17.99639229055483
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large Language Models (LLMs) and Vision Language Models (VLMs) have recently shown promising capabilities in various scientific domain. In particular, these advances have opened new opportunities in drug discovery, where the ability to understand and modify molecular structures is critical for optimizing drug properties such as efficacy and toxicity. However, existing models and benchmarks often overlook toxicity-related challenges, focusing primarily on general property optimization without adequately addressing safety concerns. In addition, even existing toxicity repair benchmarks suffer from limited data diversity, low structural validity of generated molecules, and heavy reliance on proxy models for toxicity assessment. To address these limitations, we propose MolDeTox, a novel benchmark for molecular detoxification, designed to enable fine-grained and reliable evaluation of toxicity-aware molecular optimization across stepwise tasks. We evaluate a wide range of general-purpose LLMs and VLMs under diverse settings, and demonstrate that understanding and generating molecules at the fragment-level improves structural validity and enhances the quality of generated molecules. Moreover, through detailed task-level performance analysis, MolDeTox provides an interpretable benchmark that enables a deeper understanding of the detoxification process. Our dataset is available at : https://huggingface.co/datasets/MolDeTox/MolDeTox
- Abstract(参考訳): 大規模言語モデル (LLM) と視覚言語モデル (VLM) は、最近、様々な科学領域で有望な能力を示している。
特に、これらの進歩は、分子構造を理解し、修正する能力が、有効性や毒性などの薬物特性を最適化するために重要である薬物発見の新しい機会を開いた。
しかし、既存のモデルやベンチマークはしばしば毒性に関連する問題を見落とし、安全上の問題に適切に対処することなく、主に一般財産の最適化に焦点を当てている。
さらに、既存の毒性修復ベンチマークでさえ、限られたデータ多様性、生成分子の構造的妥当性の低いこと、毒性評価のためのプロキシモデルに大きく依存している。
これらの制約に対処するため,段階的タスク間の毒性を意識した分子最適化のきめ細やかで信頼性の高い評価を可能にするため,分子デトキシ化のための新しいベンチマークである MolDeTox を提案する。
多様な環境下で汎用LLMとVLMを多岐にわたって評価し, フラグメントレベルでの分子の理解と生成が構造的妥当性を向上し, 生成分子の品質を向上させることを示す。
さらに、タスクレベルの詳細なパフォーマンス分析を通じて、MoldDeToxは、解毒プロセスのより深い理解を可能にする解釈可能なベンチマークを提供する。
私たちのデータセットはhttps://huggingface.co/datasets/MolDeTox/MolDeToxで利用可能です。
関連論文リスト
- Task-Specific Sparse Feature Masks for Molecular Toxicity Prediction with Chemical Language Models [5.563119267291969]
本稿では,精度と解釈可能性の両立を図るために,新しいマルチタスク学習(MTL)フレームワークを提案する。
我々のアーキテクチャは、共通化学言語モデルとタスク固有のアテンションモジュールを統合している。
これらのモジュールにL1のスパーシリティのペナルティを課すことにより、このフレームワークは個々の毒性エンドポイントに対して最小限の塩分分子フラグメントに焦点を絞ることに制約される。
論文 参考訳(メタデータ) (2025-12-12T09:41:04Z) - VALID-Mol: a Systematic Framework for Validated LLM-Assisted Molecular Design [0.0]
VALID-Molは、化学検証とLCM駆動分子設計を統合する包括的なフレームワークである。
本手法は, 組織的迅速最適化, 自動化学検証, ドメイン適応微調整を合成し, 合成可能な分子の生成を確実にする。
論文 参考訳(メタデータ) (2025-06-29T17:17:04Z) - Breaking Bad Molecules: Are MLLMs Ready for Structure-Level Molecular Detoxification? [19.700175505235876]
ToxiMolは、分子毒性の修復に焦点を当てた汎用マルチモーダル言語モデル(MLLM)のための最初のベンチマークタスクである。
11の一次課題と560の有毒な分子を包含し, 多様な機構と粒度にまたがる標準データセットを構築した。
論文 参考訳(メタデータ) (2025-06-12T17:25:53Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Detoxifying Large Language Models via Knowledge Editing [57.0669577257301]
本稿では,Large Language Models (LLM) のデトックス化のための知識編集手法について検討する。
我々は、強力な攻撃プロンプトを持つ9つの安全でないカテゴリをカバーするベンチマーク、SafeEditを構築した。
いくつかの知識編集手法を用いて実験を行い、知識編集がLLMを解毒する可能性を示し、汎用性能に限られた影響を与えていることを示す。
論文 参考訳(メタデータ) (2024-03-21T15:18:30Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。