論文の概要: ChemFixer: Correcting Invalid Molecules to Unlock Previously Unseen Chemical Space
- arxiv url: http://arxiv.org/abs/2511.13758v1
- Date: Fri, 14 Nov 2025 07:25:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 16:23:52.684881
- Title: ChemFixer: Correcting Invalid Molecules to Unlock Previously Unseen Chemical Space
- Title(参考訳): ChemFixer:未確認の分子をアンロックする
- Authors: Jun-Hyoung Park, Ho-Jun Song, Seong-Whan Lee,
- Abstract要約: 無効分子を有効な分子に補正するフレームワークであるChemFixerを提案する。
ChemFixerはトランスフォーマーアーキテクチャ上に構築されており、マスク技術を使って事前トレーニングされ、大規模なデータセットで微調整されている。
元の出力の化学的および生物学的分布特性を効果的に保ちながら、分子の妥当性を改善した。
- 参考スコア(独自算出の注目度): 45.88028371034407
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning-based molecular generation models have shown great potential in efficiently exploring vast chemical spaces by generating potential drug candidates with desired properties. However, these models often produce chemically invalid molecules, which limits the usable scope of the learned chemical space and poses significant challenges for practical applications. To address this issue, we propose ChemFixer, a framework designed to correct invalid molecules into valid ones. ChemFixer is built on a transformer architecture, pre-trained using masking techniques, and fine-tuned on a large-scale dataset of valid/invalid molecular pairs that we constructed. Through comprehensive evaluations across diverse generative models, ChemFixer improved molecular validity while effectively preserving the chemical and biological distributional properties of the original outputs. This indicates that ChemFixer can recover molecules that could not be previously generated, thereby expanding the diversity of potential drug candidates. Furthermore, ChemFixer was effectively applied to a drug-target interaction (DTI) prediction task using limited data, improving the validity of generated ligands and discovering promising ligand-protein pairs. These results suggest that ChemFixer is not only effective in data-limited scenarios, but also extensible to a wide range of downstream tasks. Taken together, ChemFixer shows promise as a practical tool for various stages of deep learning-based drug discovery, enhancing molecular validity and expanding accessible chemical space.
- Abstract(参考訳): 深層学習に基づく分子生成モデルは、望まれる性質を持つ潜在的薬物候補を生成することによって、広大な化学空間を効率的に探索する大きな可能性を示している。
しかし、これらのモデルはしばしば化学的に無効な分子を生成し、これは学習された化学空間の使用範囲を制限し、実用上重要な課題を提起する。
この問題に対処するために,無効分子を有効な分子に補正するフレームワークであるChemFixerを提案する。
ChemFixerはトランスフォーマーアーキテクチャ上に構築されており、マスク技術を用いて事前トレーニングを行い、私たちが構築した有効/無効な分子対の大規模データセットに微調整されている。
様々な生成モデルにわたる包括的な評価を通じて、ChemFixerは、元の出力の化学的および生物学的分布特性を効果的に保ちながら、分子の妥当性を改善した。
これは、ChemFixerが以前に生成できなかった分子を回収し、潜在的な薬物候補の多様性を拡大できることを示している。
さらに,ChemFixerは,限られたデータを用いた薬物-標的相互作用(DTI)予測タスクに効果的に適用され,生成リガンドの有効性が向上し,有望なリガンド-タンパク質対が発見された。
これらの結果は、ChemFixerがデータ制限シナリオだけでなく、幅広いダウンストリームタスクに拡張可能であることを示唆している。
ChemFixerは、深層学習に基づく薬物発見の様々な段階の実践的なツールとして、分子の妥当性を高め、アクセス可能な化学物質空間を拡大する。
関連論文リスト
- GraphXForm: Graph transformer for computer-aided molecular design [73.1842164721868]
既存の化合物を事前訓練したデコーダのみのグラフトランスフォーマアーキテクチャであるGraphXFormを提案する。
種々の薬物設計タスクで評価し、最先端の分子設計手法と比較して優れた客観的スコアを示す。
論文 参考訳(メタデータ) (2024-11-03T19:45:15Z) - DrugLLM: Open Large Language Model for Few-shot Molecule Generation [20.680942401843772]
DrugLLMは、過去の修飾に基づいて次の分子を予測することで、薬物発見における分子の修飾方法を学ぶ。
計算実験では、限られた例に基づいて期待された特性を持つ新しい分子を生成することができる。
論文 参考訳(メタデータ) (2024-05-07T09:18:13Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - Exploring Chemical Space with Score-based Out-of-distribution Generation [57.15855198512551]
生成微分方程式(SDE)にアウト・オブ・ディストリビューション制御を組み込んだスコアベース拡散方式を提案する。
いくつかの新しい分子は現実世界の薬物の基本的な要件を満たしていないため、MOODは特性予測器からの勾配を利用して条件付き生成を行う。
我々はMOODがトレーニング分布を超えて化学空間を探索できることを実験的に検証し、既存の方法で見いだされた分子、そして元のトレーニングプールの上位0.01%までも生成できることを実証した。
論文 参考訳(メタデータ) (2022-06-06T06:17:11Z) - Chemical-Reaction-Aware Molecule Representation Learning [88.79052749877334]
本稿では,化学反応を用いて分子表現の学習を支援することを提案する。
本手法は,1) 埋め込み空間を適切に整理し, 2) 分子埋め込みの一般化能力を向上させるために有効であることが証明された。
実験結果から,本手法は様々なダウンストリームタスクにおける最先端性能を実現することが示された。
論文 参考訳(メタデータ) (2021-09-21T00:08:43Z) - 3DMolNet: A Generative Network for Molecular Structures [5.446536331020099]
固定サイズや組成に制限されない分子構造を効率的に生成するための新しい手法を提案する。
本モデルは,分子の翻訳・回転・置換不変低次元表現を学習する変分オートエンコーダに基づく。
新たに生成した分子の組成的および構造的妥当性は、量子化学法によって確認されている。
論文 参考訳(メタデータ) (2020-10-08T13:04:36Z) - End-to-End Differentiable Molecular Mechanics Force Field Construction [0.5269923665485903]
化学環境を知覚するためにグラフニューラルネットワークを用いる別のアプローチを提案する。
プロセス全体がモジュール化されており、モデルパラメータに関してエンドツーエンドの差別化が可能である。
本手法は, 従来の原子型を再現するだけでなく, 既存の分子力学力場を正確に再現し, 拡張することができることを示す。
論文 参考訳(メタデータ) (2020-10-02T20:59:46Z) - Reinforcement Learning for Molecular Design Guided by Quantum Mechanics [10.112779201155005]
分子設計のための新しいRL式を座標で提示し、構築可能な分子のクラスを拡張した。
我々の報酬関数は、高速量子化学法で近似したエネルギーのような基本的な物理的性質に基づいている。
本実験では, 翻訳および回転不変状態-作用空間で作業することで, エージェントがスクラッチからこれらの課題を効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-02-18T16:43:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。