論文の概要: GP-MoLFormer-Sim: Test Time Molecular Optimization through Contextual Similarity Guidance
- arxiv url: http://arxiv.org/abs/2506.05628v1
- Date: Thu, 05 Jun 2025 23:09:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-09 17:28:43.259475
- Title: GP-MoLFormer-Sim: Test Time Molecular Optimization through Contextual Similarity Guidance
- Title(参考訳): GP-MoLFormer-Sim:文脈類似性誘導によるテスト時間分子最適化
- Authors: Jiri Navratil, Jarret Ross, Payel Das, Youssef Mroueh, Samuel C Hoffman, Vijil Chenthamarakshan, Brian Belgodere,
- Abstract要約: 標的分子と類似性を保ちながら分子を設計する能力は、薬物発見、化学設計、生物学における様々な応用に不可欠である。
本稿では,生成化学言語モデル(CLM)を用いた分子空間からの効率的な学習・サンプリング法を紹介する。
本手法は,CLM自体から得られた文脈表現を利用して分子類似性を推定し,CLMの自己回帰サンプリング戦略を調整する。
- 参考スコア(独自算出の注目度): 29.578666490023057
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The ability to design molecules while preserving similarity to a target molecule and/or property is crucial for various applications in drug discovery, chemical design, and biology. We introduce in this paper an efficient training-free method for navigating and sampling from the molecular space with a generative Chemical Language Model (CLM), while using the molecular similarity to the target as a guide. Our method leverages the contextual representations learned from the CLM itself to estimate the molecular similarity, which is then used to adjust the autoregressive sampling strategy of the CLM. At each step of the decoding process, the method tracks the distance of the current generations from the target and updates the logits to encourage the preservation of similarity in generations. We implement the method using a recently proposed $\sim$47M parameter SMILES-based CLM, GP-MoLFormer, and therefore refer to the method as GP-MoLFormer-Sim, which enables a test-time update of the deep generative policy to reflect the contextual similarity to a set of guide molecules. The method is further integrated into a genetic algorithm (GA) and tested on a set of standard molecular optimization benchmarks involving property optimization, molecular rediscovery, and structure-based drug design. Results show that, GP-MoLFormer-Sim, combined with GA (GP-MoLFormer-Sim+GA) outperforms existing training-free baseline methods, when the oracle remains black-box. The findings in this work are a step forward in understanding and guiding the generative mechanisms of CLMs.
- Abstract(参考訳): 標的分子と類似性を保ちながら分子を設計する能力は、薬物発見、化学設計、生物学における様々な応用に不可欠である。
本稿では,生成化学言語モデル(CLM)を用いて分子空間から分子空間をナビゲートし,サンプリングするための効率的なトレーニングフリー手法について紹介する。
本手法は,CLM自体から得られた文脈表現を利用して分子類似性を推定し,CLMの自己回帰サンプリング戦略を調整する。
復号処理の各ステップでは、ターゲットから現在の世代の距離を追跡し、ログを更新して、世代間の類似性の保存を促進する。
我々は最近提案した$\sim$47MパラメータSMILESベースのCLM, GP-MoLFormerを用いて実装し, GP-MoLFormer-Simと呼ぶ。
この方法は、遺伝的アルゴリズム(GA)にさらに統合され、プロパティ最適化、分子の再発見、構造に基づく薬物設計を含む一連の標準分子最適化ベンチマークでテストされる。
その結果,GP-MoLFormer-SimをGA(GP-MoLFormer-Sim+GA)と組み合わせることで,オラクルがブラックボックスのままである場合,既存のトレーニング不要のベースライン法より優れていることがわかった。
この研究の成果は、CLMの生成機構を理解し、導くための一歩である。
関連論文リスト
- DrugR: Optimizing Molecular Drugs through LLM-based Explicit Reasoning [24.70952870676648]
DrugRは、明示的で段階的な薬理学的推論を最適化プロセスに導入する、大きな言語モデルである。
提案手法は, ドメイン固有の事前学習, 逆データ工学による微調整, 自己バランス型多粒性強化学習を統合した。
実験結果から、Dr.Rは構造的類似性や標的結合親和性を損なうことなく、複数の特性を包括的に拡張できることが示された。
論文 参考訳(メタデータ) (2026-02-09T02:26:25Z) - Multi-Constrained Evolutionary Molecular Design Framework: An Interpretable Drug Design Method Combining Rule-Based Evolution and Molecular Crossover [11.76474263237491]
MCEMOL (Multi-Constrained Evolutionary Molecular Design Framework) は、規則に基づく進化と分子クロスオーバーを統合する分子最適化手法である。
大規模なデータセットと広範なトレーニングを必要とするディープラーニングとは異なり、我々のアルゴリズムは計算オーバーヘッドの少ない最小の開始分子から効率的に進化する。
実験の結果、MCEMOLはその進化機構を通じて透明な設計経路を提供し、有効で多様な標的に適合する分子を生成することが示された。
論文 参考訳(メタデータ) (2026-01-15T06:37:07Z) - MolGuidance: Advanced Guidance Strategies for Conditional Molecular Generation with Flow Matching [6.649784863468093]
条件分子生成の主な目的は、化学的妥当性の確保、生成分子と目的特性の整合、発見のための効率的なサンプリングを可能にすることである。
コンピュータビジョンの最近の進歩は、生成モデルのための様々な新しいガイダンス戦略を導入した。
我々は,SE(3)-同変フローマッチングプロセス上に構築された先行分子生成フレームワークに最先端のガイダンス手法を統合する。
論文 参考訳(メタデータ) (2025-12-13T06:05:09Z) - Breaking the Modality Barrier: Generative Modeling for Accurate Molecule Retrieval from Mass Spectra [60.08608779794957]
本稿では,ジェネレーティブ言語モデルに基づく検索フレームワークであるGLMRを提案する。
検索前の段階では、比較学習に基づくモデルでは、上位候補分子を入力質量スペクトルの文脈的先行として識別する。
生成検索段階において、これらの候補分子は入力質量スペクトルと統合され、精製された分子構造を生成するための生成モデルが導かれる。
論文 参考訳(メタデータ) (2025-11-09T07:25:53Z) - Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - Conditional Synthesis of 3D Molecules with Time Correction Sampler [58.0834973489875]
Time-Aware Conditional Synthesis (TACS) は拡散モデルにおける条件生成の新しい手法である。
適応的に制御されたプラグアンドプレイの"オンライン"ガイダンスを拡散モデルに統合し、サンプルを所望の特性に向けて駆動する。
論文 参考訳(メタデータ) (2024-11-01T12:59:25Z) - Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [20.250683535089617]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
物理的、化学的に詳細なセマンティクスを特異的な分子表現と融合することにより、TransDLMは様々な情報ソースを効果的に統合し、正確な最適化を導く。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - WGFormer: An SE(3)-Transformer Driven by Wasserstein Gradient Flows for Molecular Ground-State Conformation Prediction [24.18678055892153]
多くの化学応用において、基底状態のコンフォメーション予測が重要である。
本稿では,エネルギーに基づくシミュレーションと学習に基づく戦略を橋渡しする,新しい効果的手法を提案する。
我々の手法は一貫して最先端の競争相手を上回っている。
論文 参考訳(メタデータ) (2024-10-13T10:48:22Z) - Quantum-inspired Reinforcement Learning for Synthesizable Drug Design [20.00111975801053]
本稿では, 量子インスパイアされた擬似アニール型ニューラルネットワークを用いた強化学習手法を用いて, 化学構造の離散空間をインテリジェントにナビゲートする手法を提案する。
具体的には、ポリシーニューラルネットワークを用いた決定論的REINFORCEアルゴリズムを用いて、状態遷移と局所探索を誘導する遷移確率を出力する。
提案手法は10Kのクエリ予算を持つPMOベンチマークフレームワークを用いて評価する。
論文 参考訳(メタデータ) (2024-09-13T20:43:16Z) - Many-Shot In-Context Learning for Molecular Inverse Design [56.65345962071059]
大規模言語モデル(LLM)は、数ショットのインコンテキスト学習(ICL)において、優れたパフォーマンスを示している。
マルチショットICLで利用可能な実験データの不足を克服する,新しい半教師付き学習手法を開発した。
示すように、この新しい手法は、既存の分子設計のためのICL法を大幅に改善し、科学者にとってアクセスしやすく、使いやすくする。
論文 参考訳(メタデータ) (2024-07-26T21:10:50Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - MolTC: Towards Molecular Relational Modeling In Language Models [28.960416816491392]
分子間相互作用予測のための新しい枠組みとして,分子間相互作用予測法(分子間相互作用予測法)を提案する。
我々の実験は4000,000以上の分子対を含む様々なデータセットで実施され、現在のGNNおよびLLMベースラインよりも優れていることを示した。
論文 参考訳(メタデータ) (2024-02-06T07:51:56Z) - Empowering Molecule Discovery for Molecule-Caption Translation with Large Language Models: A ChatGPT Perspective [53.300288393173204]
大規模言語モデル(LLM)は、様々なクロスモーダルタスクにおいて顕著なパフォーマンスを示している。
本研究では,分子カプセル翻訳のためのインコンテキストFew-Shot Molecule Learningパラダイムを提案する。
分子理解とテキストベースの分子生成を含む分子キャプション翻訳におけるMollReGPTの有効性を評価する。
論文 参考訳(メタデータ) (2023-06-11T08:16:25Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - Improving Small Molecule Generation using Mutual Information Machine [0.0]
MolMIMは、小さな分子の薬物発見のための確率論的オートエンコーダである。
有効性, 特異性, 新規性の観点から, MolMIM の優れた世代を実証した。
次に,CMA-ES, ナイーブなブラックボックスと勾配自由探索アルゴリズムを, プロパティ誘導分子最適化のタスクとして, MolMIM の潜在空間上で利用する。
論文 参考訳(メタデータ) (2022-08-18T18:32:48Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。