論文の概要: Hierarchical Structure-Property Alignment for Data-Efficient Molecular Generation and Editing
- arxiv url: http://arxiv.org/abs/2511.08080v1
- Date: Wed, 12 Nov 2025 01:38:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-12 20:17:03.632313
- Title: Hierarchical Structure-Property Alignment for Data-Efficient Molecular Generation and Editing
- Title(参考訳): データ効率の良い分子生成と編集のための階層構造アライメント
- Authors: Ziyu Fan, Zhijian Huang, Yahan Li, Xiaowen Hu, Siyuan Shen, Yunliang Wang, Zeyu Zhong, Shuhong Liu, Shuning Yang, Shangqian Wu, Min Wu, Lei Deng,
- Abstract要約: HSPAGは階層構造とプロパティのアライメントを特徴とするデータ効率のフレームワークである。
補助変分自動エンコーダを用いて,足場クラスタリングとハードサンプルを用いて代表サンプルを選択する。
実験により、HSPAGは微細な構造-プロパティ関係を捕捉し、複数の特性制約の下で制御可能な生成をサポートすることが示された。
- 参考スコア(独自算出の注目度): 14.308978798996472
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Property-constrained molecular generation and editing are crucial in AI-driven drug discovery but remain hindered by two factors: (i) capturing the complex relationships between molecular structures and multiple properties remains challenging, and (ii) the narrow coverage and incomplete annotations of molecular properties weaken the effectiveness of property-based models. To tackle these limitations, we propose HSPAG, a data-efficient framework featuring hierarchical structure-property alignment. By treating SMILES and molecular properties as complementary modalities, the model learns their relationships at atom, substructure, and whole-molecule levels. Moreover, we select representative samples through scaffold clustering and hard samples via an auxiliary variational auto-encoder (VAE), substantially reducing the required pre-training data. In addition, we incorporate a property relevance-aware masking mechanism and diversified perturbation strategies to enhance generation quality under sparse annotations. Experiments demonstrate that HSPAG captures fine-grained structure-property relationships and supports controllable generation under multiple property constraints. Two real-world case studies further validate the editing capabilities of HSPAG.
- Abstract(参考訳): 性質に制約のある分子生成と編集は、AIによる薬物発見には不可欠だが、2つの要因によって妨げられている。
(i)分子構造と多重性質の複雑な関係を捉えることは依然として困難であり、
(II) 分子特性の狭いカバレッジと不完全アノテーションは、特性ベースモデルの有効性を弱める。
これらの制約に対処するため、階層構造-プロパティアライメントを特徴とするデータ効率の高いフレームワークであるHSPAGを提案する。
SMILESと分子特性を相補的なモダリティとして扱うことにより、モデルは原子、サブ構造、分子全体のレベルでそれらの関係を学習する。
さらに,補助変分自動エンコーダ (VAE) を用いて, 足場クラスタリングとハードサンプルを用いて代表サンプルを選択し, 必要な事前学習データを大幅に削減する。
さらに,プロパティ関連性を考慮したマスキング機構と多様な摂動戦略を導入し,スパースアノテーションによる生成品質の向上を図る。
実験により、HSPAGは微細な構造-プロパティ関係を捕捉し、複数の特性制約の下で制御可能な生成をサポートすることが示された。
2つの実世界のケーススタディは、HSPAGの編集能力をさらに検証している。
関連論文リスト
- Aligned Manifold Property and Topology Point Clouds for Learning Molecular Properties [55.2480439325792]
この研究は、局所量子由来のスカラー場とカスタムトポロジカルディスクリプタを組み合わせた分子表面表現であるAMPTCRを導入する。
分子量については、AMPTCRが物理的に意味のあるデータをコードし、検証R2は0.87であることを確認した。
細菌抑制タスクでは、AMPTCRは大腸菌阻害値の分類と直接回帰の両方を可能にする。
論文 参考訳(メタデータ) (2025-07-22T04:35:50Z) - Adaptive Substructure-Aware Expert Model for Molecular Property Prediction [5.087741013479207]
グラフニューラルネットワーク(GNN)は分子を分子グラフとしてモデル化することで有望な結果を示す。
既存の方法は、しばしば異なるサブストラクチャーの分子特性への様々な貢献を見落としている。
分子特性予測にMixture-of-Experts(MoE)アプローチを利用する新しいGNNベースのフレームワークであるPhil-Molを提案する。
論文 参考訳(メタデータ) (2025-04-08T09:25:03Z) - Learning Disentangled Equivariant Representation for Explicitly Controllable 3D Molecule Generation [29.905705361297578]
テキスト特異的制御による3Dドラッグ様分子の条件生成
本稿では,E(3)-同変ワッサースタインオートエンコーダを提案し,生成モデルの潜伏空間を分子特性と3次元分子の構造的文脈の2つの相違点に分解する。
論文 参考訳(メタデータ) (2024-12-19T17:33:56Z) - Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction [2.344198904343022]
HiPMは階層的に誘導される分子表現学習フレームワークである。
私たちのフレームワークは、分子表現(MRE)とタスク認識プロンプタ(TAP)の2つのコアコンポーネントで構成されています。
論文 参考訳(メタデータ) (2024-05-29T03:10:21Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Multi-objective Deep Data Generation with Correlated Property Control [23.99970130388449]
本稿では,非絡み付き潜在ベクトルによる意味論と特性の相関を復元する,新しい深層生成フレームワークを提案する。
我々の生成モデルは,多目的最適化フレームワークの下で,特性の相関と矛盾を扱いながら,興味のある特性を保存します。
論文 参考訳(メタデータ) (2022-10-01T00:35:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。