論文の概要: TextOmics-Guided Diffusion for Hit-like Molecular Generation
- arxiv url: http://arxiv.org/abs/2507.09982v1
- Date: Mon, 14 Jul 2025 06:56:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:24.457714
- Title: TextOmics-Guided Diffusion for Hit-like Molecular Generation
- Title(参考訳): ヒッチライクな分子生成のためのテクスチュミクス誘導拡散
- Authors: Hang Yuan, Chen Li, Wenjun Ma, Yuncheng Jiang,
- Abstract要約: 治療効果を有するヒッチ様分子生成は、標的特異的な薬物発見に不可欠である。
我々は、オミクス表現と分子テキスト記述の1対1対応性を確立する先駆的なベンチマークであるTextOmicsを紹介する。
ToDiは、生物学的に関連があり、化学的に有効なヒッチ様分子を生成するために、オミクス表現と分子テクスチャ記述を共同で条件付けした生成フレームワークである。
- 参考スコア(独自算出の注目度): 11.308365776402226
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Hit-like molecular generation with therapeutic potential is essential for target-specific drug discovery. However, the field lacks heterogeneous data and unified frameworks for integrating diverse molecular representations. To bridge this gap, we introduce TextOmics, a pioneering benchmark that establishes one-to-one correspondences between omics expressions and molecular textual descriptions. TextOmics provides a heterogeneous dataset that facilitates molecular generation through representations alignment. Built upon this foundation, we propose ToDi, a generative framework that jointly conditions on omics expressions and molecular textual descriptions to produce biologically relevant, chemically valid, hit-like molecules. ToDi leverages two encoders (OmicsEn and TextEn) to capture multi-level biological and semantic associations, and develops conditional diffusion (DiffGen) for controllable generation. Extensive experiments confirm the effectiveness of TextOmics and demonstrate ToDi outperforms existing state-of-the-art approaches, while also showcasing remarkable potential in zero-shot therapeutic molecular generation. Sources are available at: https://github.com/hala-ToDi.
- Abstract(参考訳): 治療効果を有するヒッチ様分子生成は、標的特異的な薬物発見に不可欠である。
しかし、この分野には多様な分子表現を統合するための不均一なデータと統一されたフレームワークが欠けている。
このギャップを埋めるために、オミクス表現と分子テクスチャ記述の1対1対応性を確立する先駆的なベンチマークであるTextOmicsを導入する。
TextOmicsは、表現アライメントを通じて分子生成を容易にする異種データセットを提供する。
この基礎の上に構築されたToDiは、生物学的に関連があり、化学的に有効なヒッチライクな分子を生成するために、オミクス表現と分子テクスチャ記述を共同で条件付けした生成フレームワークである。
ToDiは2つのエンコーダ(OmicsEnとTextEn)を利用して、多レベルの生物学的およびセマンティックな関連をキャプチャし、制御可能な生成のための条件拡散(DiffGen)を開発する。
大規模な実験によりTextOmicsの有効性が確認され、ToDiは既存の最先端のアプローチよりも優れており、ゼロショット治療分子生成の著しい可能性を示している。
ソースは、https://github.com/hala-ToDi.comで公開されている。
関連論文リスト
- Mol-CADiff: Causality-Aware Autoregressive Diffusion for Molecule Generation [13.401822039640297]
Mol-CADiffは、テキスト条件の分子生成に因果的注意機構を用いる、新しい拡散ベースのフレームワークである。
提案手法はテキストプロンプトと分子構造との因果関係を明示的にモデル化し,既存の手法の限界を克服する。
我々の実験は、モル-CADiffが多種多様で新規で化学的に有効な分子を生成する上で、最先端の手法より優れていることを実証した。
論文 参考訳(メタデータ) (2025-03-07T15:10:37Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - Text-guided Diffusion Model for 3D Molecule Generation [26.09786612721824]
本研究では,3次元拡散モデルを用いたテキスト誘導型小型分子生成手法であるTextSMOGを紹介する。
この方法は、テキスト条件を用いて分子生成を誘導し、安定性と多様性を両立させる。
実験結果から,テキスト記述から情報を取得し,活用するためのTextSMOGの有効性が示された。
論文 参考訳(メタデータ) (2024-10-04T10:23:20Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された新しいモデルである。
我々は、13のタスクのうち11のタスクで最先端のパフォーマンスを達成するMoleculeNetデータセット上で、FARMを評価した。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - LDMol: A Text-to-Molecule Diffusion Model with Structurally Informative Latent Space Surpasses AR Models [55.5427001668863]
テキスト条件付き分子生成のための遅延拡散モデル LDMol を提案する。
実験の結果, LDMolはテキストから分子生成ベンチマークにおいて, 既存の自己回帰ベースラインよりも優れていた。
我々は,LDMolを分子間検索やテキスト誘導分子編集などの下流タスクに適用できることを示す。
論文 参考訳(メタデータ) (2024-05-28T04:59:13Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Translation between Molecules and Natural Language [43.518805086280466]
本稿では,未ラベルの自然言語テキストや分子文字列の事前学習のための自己教師型学習フレームワークを提案する。
$textbfMolT5$は、分子キャプションやテキストベースのdenovo分子生成など、従来の視覚言語タスクの新しい、有用な、挑戦的なアナログを可能にする。
論文 参考訳(メタデータ) (2022-04-25T17:48:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。