論文の概要: Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction
- arxiv url: http://arxiv.org/abs/2405.18724v1
- Date: Wed, 29 May 2024 03:10:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-30 21:04:06.759744
- Title: Adapting Differential Molecular Representation with Hierarchical Prompts for Multi-label Property Prediction
- Title(参考訳): 多ラベル特性予測のための階層型プロンプトを用いた微分分子表現の適応
- Authors: Linjia Kang, Songhua Zhou, Shuyan Fang, Shichao Liu, Wen Zhang,
- Abstract要約: 分子表現学習フレームワークHiPM(Hierarchical Prompted Molecular Representation Learning Framework)について紹介する。
HiPMは、タスク認識プロンプトを通じて、分子表現におけるタスクの差分表現を強化する。
実験により、HiPMは様々なマルチラベルデータセットにまたがって最先端のパフォーマンスを実現する。
- 参考スコア(独自算出の注目度): 5.171406201338042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate prediction of molecular properties is critical in the field of drug discovery. However, existing methods do not fully consider the fact that molecules in the real world usually possess multiple property labels, and complex high-order relationships may exist among these labels. Therefore, molecular representation learning models should generate differential molecular representations that consider multi-granularity correlation information among tasks. To this end, our research introduces a Hierarchical Prompted Molecular Representation Learning Framework (HiPM), which enhances the differential expression of tasks in molecular representations through task-aware prompts, and utilizes shared information among labels to mitigate negative transfer between different tasks. HiPM primarily consists of two core components: the Molecular Representation Encoder (MRE) and the Task-Aware Prompter (TAP). The MRE employs a hierarchical message-passing network architecture to capture molecular features at both the atomic and motif levels, while the TAP uses agglomerative hierarchical clustering to build a prompt tree that reflects the affinity and distinctiveness of tasks, enabling the model to effectively handle the complexity of multi-label property predictions. Extensive experiments demonstrate that HiPM achieves state-of-the-art performance across various multi-label datasets, offering a new perspective on multi-label molecular representation learning.
- Abstract(参考訳): 分子特性の正確な予測は、薬物発見の分野において重要である。
しかし、既存の手法では、実世界の分子が通常複数の特性ラベルを持つという事実を完全には考慮していない。
したがって、分子表現学習モデルは、タスク間の多粒性相関情報を考慮した微分分子表現を生成する必要がある。
この目的のために,階層型プロンプト分子表現学習フレームワーク (HiPM) を導入し,タスク認識プロンプトを通じて分子表現におけるタスクの差分表現を強化し,ラベル間の共有情報を用いて異なるタスク間の負の伝達を緩和する。
HiPMは主に、分子表現エンコーダ(MRE)とタスク・アウェア・プロンプタ(TAP)の2つのコアコンポーネントで構成されている。
MREは、原子レベルとモチーフレベルの分子的特徴を捉えるために、階層的メッセージパッシングネットワークアーキテクチャを使用し、TAPは、集約的階層的クラスタリングを使用して、タスクの親和性と特異性を反映したプロンプトツリーを構築し、モデルがマルチラベルプロパティ予測の複雑さを効果的に処理できるようにする。
大規模な実験により、HiPMは様々なマルチラベルデータセットにまたがって最先端のパフォーマンスを達成し、マルチラベル分子表現学習の新しい視点を提供する。
関連論文リスト
- UniMatch: Universal Matching from Atom to Task for Few-Shot Drug Discovery [24.39705006290841]
我々は、明示的な階層的分子マッチングと暗黙的なタスクレベルマッチングを統合したデュアルマッチングフレームワークUniMatch(UniMatch)を紹介する。
具体的には、階層的なプーリングとマッチングによって、原子、サブ構造、分子など、複数のレベルの構造的特徴を捉える。
実験の結果,UniMatchはMoreculeNetおよびFS-Molベンチマークで最先端の手法より優れていることがわかった。
論文 参考訳(メタデータ) (2025-02-18T02:36:03Z) - DiffMS: Diffusion Generation of Molecules Conditioned on Mass Spectra [60.39311767532607]
DiffMSは式制限エンコーダ-デコーダ生成ネットワークである。
我々は、潜伏埋め込みと分子構造を橋渡しする頑健なデコーダを開発する。
実験の結果、DiffMS は $textitde novo$ 分子生成で既存のモデルより優れていることが示された。
論文 参考訳(メタデータ) (2025-02-13T18:29:48Z) - Graph-based Molecular In-context Learning Grounded on Morgan Fingerprints [28.262593876388397]
In-context Learning (ICL) では、プロパティ予測や分子キャプションなどの分子タスクのための大規模言語モデル(LLM)を、慎重に選択された実演例を入力プロンプトに埋め込む。
しかし、現在の分子タスクのプロンプト検索法は、モーガン指紋のような分子の特徴的類似性に依存しており、これはグローバル分子と原子結合の関係を適切に捉えていない。
本稿では,グローバル分子構造をグラフニューラルネットワーク(GNN)とテキストキャプション(記述)に整合させ,モーガン指紋による局所的特徴類似性を活用する自己教師付き学習手法GAMICを提案する。
論文 参考訳(メタデータ) (2025-02-08T02:46:33Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - Knowledge-enhanced Relation Graph and Task Sampling for Few-shot Molecular Property Prediction [7.302312984575165]
本稿では,新しいメタラーニングFSMPPフレームワーク(KRGTS)を提案する。
KRGTSは知識強化リレーショナルグラフモジュールとタスクサンプリングモジュールで構成される。
経験的に、5つのデータセットに対する広範な実験は、さまざまな最先端手法よりもKRGTSの方が優れていることを示した。
論文 参考訳(メタデータ) (2024-05-24T13:31:19Z) - Data-Efficient Molecular Generation with Hierarchical Textual Inversion [48.816943690420224]
分子生成のための階層型テキスト変換法 (HI-Mol) を提案する。
HI-Molは分子分布を理解する上での階層的情報、例えば粗い特徴ときめ細かい特徴の重要性にインスパイアされている。
単一レベルトークン埋め込みを用いた画像領域の従来のテキストインバージョン法と比較して, マルチレベルトークン埋め込みにより, 基礎となる低ショット分子分布を効果的に学習することができる。
論文 参考訳(メタデータ) (2024-05-05T08:35:23Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - MultiModal-Learning for Predicting Molecular Properties: A Framework Based on Image and Graph Structures [2.5563339057415218]
MolIGは、画像とグラフ構造に基づいて分子特性を予測するための、新しいMultiModaL分子事前学習フレームワークである。
両者の分子表現の強さを融合させる。
ベンチマークグループ内の分子特性予測に関連する下流タスクでは、パフォーマンスが向上する。
論文 参考訳(メタデータ) (2023-11-28T10:28:35Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - t-SMILES: A Scalable Fragment-based Molecular Representation Framework for De Novo Molecule Generation [9.116670221263753]
本研究では, t-SMILESと呼ばれる, フレキシブル, フラグメントベース, マルチスケールな分子表現フレームワークを提案する。
フラグメント化された分子グラフから生成された全二分木上で幅優先探索を行うことにより得られるSMILES型文字列を用いて分子を記述する。
従来のSMILES、DeepSMILES、SELFIES、ベースラインモデルをゴール指向タスクで大幅に上回っている。
論文 参考訳(メタデータ) (2023-01-04T21:41:01Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。