論文の概要: Bridging the Gap Between Molecule and Textual Descriptions via Substructure-aware Alignment
- arxiv url: http://arxiv.org/abs/2510.26157v1
- Date: Thu, 30 Oct 2025 05:36:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-31 16:05:09.671974
- Title: Bridging the Gap Between Molecule and Textual Descriptions via Substructure-aware Alignment
- Title(参考訳): 構造認識アライメントによる分子とテクスチャ記述のギャップを埋める
- Authors: Hyuntae Park, Yeachan Kim, SangKeun Lee,
- Abstract要約: MolBridgeは、サブ構造認識アライメントに基づく新しい分子文学習フレームワークである。
MolBridgeは,様々な分子ベンチマークにおいて,微細な対応を効果的に捉え,最先端のベースラインより優れていることを示す。
- 参考スコア(独自算出の注目度): 15.230372857449282
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Molecule and text representation learning has gained increasing interest due to its potential for enhancing the understanding of chemical information. However, existing models often struggle to capture subtle differences between molecules and their descriptions, as they lack the ability to learn fine-grained alignments between molecular substructures and chemical phrases. To address this limitation, we introduce MolBridge, a novel molecule-text learning framework based on substructure-aware alignments. Specifically, we augment the original molecule-description pairs with additional alignment signals derived from molecular substructures and chemical phrases. To effectively learn from these enriched alignments, MolBridge employs substructure-aware contrastive learning, coupled with a self-refinement mechanism that filters out noisy alignment signals. Experimental results show that MolBridge effectively captures fine-grained correspondences and outperforms state-of-the-art baselines on a wide range of molecular benchmarks, highlighting the significance of substructure-aware alignment in molecule-text learning.
- Abstract(参考訳): 分子とテキスト表現学習は、化学情報の理解を深める可能性から、関心が高まっている。
しかし、既存のモデルは分子とそれらの記述の微妙な違いを捉えるのに苦労することが多く、それらは分子のサブ構造と化学的なフレーズの微妙なアライメントを学習する能力に欠ける。
この制限に対処するために,サブ構造認識アライメントに基づく分子文学習フレームワークであるMolBridgeを紹介する。
具体的には,分子サブストラクチャと化学フレーズから得られるアライメント信号を追加して,元の分子記述ペアを増強する。
これらのリッチなアライメントから効果的に学習するために、MolBridgeは、低構造対応のコントラスト学習と、ノイズの多いアライメント信号をフィルタリングする自己抑制機構を併用する。
実験結果から,分子文学習におけるサブストラクチャー・アライメントの重要性を浮き彫りにすることにより,モルブリッジは微細な対応を効果的に把握し,最先端のベースラインを幅広い分子ベンチマークで上回ることを示す。
関連論文リスト
- Mol-CADiff: Causality-Aware Autoregressive Diffusion for Molecule Generation [13.401822039640297]
Mol-CADiffは、テキスト条件の分子生成に因果的注意機構を用いる、新しい拡散ベースのフレームワークである。
提案手法はテキストプロンプトと分子構造との因果関係を明示的にモデル化し,既存の手法の限界を克服する。
我々の実験は、モル-CADiffが多種多様で新規で化学的に有効な分子を生成する上で、最先端の手法より優れていることを実証した。
論文 参考訳(メタデータ) (2025-03-07T15:10:37Z) - Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [52.84455878597969]
Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。
分子理解を改善するために,分子エンコーダの相補的な情報を統合するモジュールを提案する。
論文 参考訳(メタデータ) (2025-02-19T05:49:10Z) - Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。
KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。
この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文 参考訳(メタデータ) (2025-02-17T11:53:58Z) - Structural Reasoning Improves Molecular Understanding of LLM [18.532188836688928]
大規模言語モデル (LLM) は分子構造情報を用いた推論に依然として苦戦していることを示す。
本稿では,分子構造を推論のためにスケッチする手法を提案する。
対象分子が未知あるいは未知のシナリオのための2つのフレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-08T01:49:48Z) - Multi-channel learning for integrating structural hierarchies into context-dependent molecular representation [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Fragment-based Sequential Translation for Molecular Optimization [23.152338167332374]
本稿では,分子断片を用いた分子生成のためのフレキシブルな編集パラダイムを提案する。
我々は変分オートエンコーダを用いて分子断片をコヒーレント潜在空間に符号化する。
そして、分子を編集して複雑な化学特性空間を探索する語彙として利用します。
論文 参考訳(メタデータ) (2021-10-26T21:20:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。