論文の概要: GP-MoLFormer-Sim: Test Time Molecular Optimization through Contextual Similarity Guidance
- arxiv url: http://arxiv.org/abs/2506.05628v1
- Date: Thu, 05 Jun 2025 23:09:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.259475
- Title: GP-MoLFormer-Sim: Test Time Molecular Optimization through Contextual Similarity Guidance
- Title(参考訳): GP-MoLFormer-Sim:文脈類似性誘導によるテスト時間分子最適化
- Authors: Jiri Navratil, Jarret Ross, Payel Das, Youssef Mroueh, Samuel C Hoffman, Vijil Chenthamarakshan, Brian Belgodere,
- Abstract要約: 標的分子と類似性を保ちながら分子を設計する能力は、薬物発見、化学設計、生物学における様々な応用に不可欠である。
本稿では,生成化学言語モデル(CLM)を用いた分子空間からの効率的な学習・サンプリング法を紹介する。
本手法は,CLM自体から得られた文脈表現を利用して分子類似性を推定し,CLMの自己回帰サンプリング戦略を調整する。
- 参考スコア(独自算出の注目度): 29.578666490023057
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to design molecules while preserving similarity to a target molecule and/or property is crucial for various applications in drug discovery, chemical design, and biology. We introduce in this paper an efficient training-free method for navigating and sampling from the molecular space with a generative Chemical Language Model (CLM), while using the molecular similarity to the target as a guide. Our method leverages the contextual representations learned from the CLM itself to estimate the molecular similarity, which is then used to adjust the autoregressive sampling strategy of the CLM. At each step of the decoding process, the method tracks the distance of the current generations from the target and updates the logits to encourage the preservation of similarity in generations. We implement the method using a recently proposed $\sim$47M parameter SMILES-based CLM, GP-MoLFormer, and therefore refer to the method as GP-MoLFormer-Sim, which enables a test-time update of the deep generative policy to reflect the contextual similarity to a set of guide molecules. The method is further integrated into a genetic algorithm (GA) and tested on a set of standard molecular optimization benchmarks involving property optimization, molecular rediscovery, and structure-based drug design. Results show that, GP-MoLFormer-Sim, combined with GA (GP-MoLFormer-Sim+GA) outperforms existing training-free baseline methods, when the oracle remains black-box. The findings in this work are a step forward in understanding and guiding the generative mechanisms of CLMs.
- Abstract(参考訳): 標的分子と類似性を保ちながら分子を設計する能力は、薬物発見、化学設計、生物学における様々な応用に不可欠である。
本稿では,生成化学言語モデル(CLM)を用いて分子空間から分子空間をナビゲートし,サンプリングするための効率的なトレーニングフリー手法について紹介する。
本手法は,CLM自体から得られた文脈表現を利用して分子類似性を推定し,CLMの自己回帰サンプリング戦略を調整する。
復号処理の各ステップでは、ターゲットから現在の世代の距離を追跡し、ログを更新して、世代間の類似性の保存を促進する。
我々は最近提案した$\sim$47MパラメータSMILESベースのCLM, GP-MoLFormerを用いて実装し, GP-MoLFormer-Simと呼ぶ。
この方法は、遺伝的アルゴリズム(GA)にさらに統合され、プロパティ最適化、分子の再発見、構造に基づく薬物設計を含む一連の標準分子最適化ベンチマークでテストされる。
その結果,GP-MoLFormer-SimをGA(GP-MoLFormer-Sim+GA)と組み合わせることで,オラクルがブラックボックスのままである場合,既存のトレーニング不要のベースライン法より優れていることがわかった。
この研究の成果は、CLMの生成機構を理解し、導くための一歩である。
関連論文リスト
- Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction [24.18678055892153]
多くの化学応用において、基底状態のコンフォメーション予測が重要である。
本稿では,エネルギーに基づくシミュレーションと学習に基づく戦略を橋渡しする,新しい効果的手法を提案する。
我々の手法は一貫して最先端の競争相手を上回っている。
論文 参考訳(メタデータ) (2024-10-13T10:48:22Z) - Quantum-inspired Reinforcement Learning for Synthesizable Drug Design [20.00111975801053]
本稿では, 量子インスパイアされた擬似アニール型ニューラルネットワークを用いた強化学習手法を用いて, 化学構造の離散空間をインテリジェントにナビゲートする手法を提案する。
具体的には、ポリシーニューラルネットワークを用いた決定論的REINFORCEアルゴリズムを用いて、状態遷移と局所探索を誘導する遷移確率を出力する。
提案手法は10Kのクエリ予算を持つPMOベンチマークフレームワークを用いて評価する。
論文 参考訳(メタデータ) (2024-09-13T20:43:16Z) - Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。
マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。
示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文 参考訳(メタデータ) (2024-07-26T21:10:50Z) - MolTC: Towards Molecular Relational Modeling In Language Models [28.960416816491392]
分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-06T07:51:56Z) - Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。
本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。
分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。