論文の概要: From molecules to scaffolds to functional groups: building
context-dependent molecular representation via multi-channel learning
- arxiv url: http://arxiv.org/abs/2311.02798v1
- Date: Sun, 5 Nov 2023 23:47:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 15:52:03.299181
- Title: From molecules to scaffolds to functional groups: building
context-dependent molecular representation via multi-channel learning
- Title(参考訳): 分子から足場から機能群へ:マルチチャネル学習による文脈依存的分子表現の構築
- Authors: Yue Wan and Jialu Wu and Tingjun Hou and Chang-Yu Hsieh and Xiaowei
Jia
- Abstract要約: 本稿では分子構造における構造的階層の知識を活用する新しい学習フレームワークを提案する。
様々な分子特性ベンチマークの競合性能を示し、最先端の結果を確立する。
- 参考スコア(独自算出の注目度): 10.756149299304981
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reliable molecular property prediction is essential for various scientific
endeavors and industrial applications, such as drug discovery. However, the
scarcity of data, combined with the highly non-linear causal relationships
between physicochemical and biological properties and conventional molecular
featurization schemes, complicates the development of robust molecular machine
learning models. Self-supervised learning (SSL) has emerged as a popular
solution, utilizing large-scale, unannotated molecular data to learn a
foundational representation of chemical space that might be advantageous for
downstream tasks. Yet, existing molecular SSL methods largely overlook
domain-specific knowledge, such as molecular similarity and scaffold
importance, as well as the context of the target application when operating
over the large chemical space. This paper introduces a novel learning framework
that leverages the knowledge of structural hierarchies within molecular
structures, embeds them through separate pre-training tasks over distinct
channels, and employs a task-specific channel selection to compose a
context-dependent representation. Our approach demonstrates competitive
performance across various molecular property benchmarks and establishes some
state-of-the-art results. It further offers unprecedented advantages in
particularly challenging yet ubiquitous scenarios like activity cliffs with
enhanced robustness and generalizability compared to other baselines.
- Abstract(参考訳): 信頼性の高い分子特性予測は、様々な科学的取り組みや薬物発見などの工業的応用に不可欠である。
しかし、物理化学的・生物学的性質と従来の分子破砕法の間の非線型因果関係と組み合わさったデータ不足は、堅牢な分子機械学習モデルの開発を複雑にしている。
自己教師付き学習(SSL)は、ダウンストリームタスクに有利な化学空間の基本的な表現を学ぶために、大規模で無注釈の分子データを活用する一般的なソリューションとして登場した。
しかし、既存の分子SSL法は、分子の類似性や足場の重要性といったドメイン固有の知識や、大規模化学空間上での操作時のターゲット応用の文脈を概ね見落としている。
本稿では,分子構造における構造的階層の知識を活用し,異なるチャネル上の個別の事前学習タスクを組み込んで,コンテキスト依存の表現を構成するためのタスク固有のチャネル選択を利用する,新しい学習フレームワークを提案する。
提案手法は,様々な分子特性ベンチマークにおける競合性能を示し,最先端の成果を導出する。
さらに、他のベースラインと比較して堅牢性と一般化性が向上したアクティビティクリフのような、特に挑戦的でユビキタスなシナリオにおいて、前例のない利点を提供します。
関連論文リスト
- Learning Multi-view Molecular Representations with Structured and Unstructured Knowledge [14.08112359246334]
本稿では, 化学構造から多視点分子知識を抽出する表現学習モデルMV-Mol, バイオメディカルテキストからの非構造化知識, 知識グラフからの構造化知識について述べる。
MV-Molは分子特性予測に有効であることを示す。
論文 参考訳(メタデータ) (2024-06-14T08:48:10Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文 参考訳(メタデータ) (2023-06-21T02:05:48Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。
1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。
我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文 参考訳(メタデータ) (2023-01-26T17:52:56Z) - Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。
我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。
このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文 参考訳(メタデータ) (2023-01-06T14:22:43Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - Knowledge-aware Contrastive Molecular Graph Learning [5.08771973600915]
自己監督型分子表現学習のためのコントラシブナレッジアウェアGNN(CKGNN)を提案する。
私たちは、コントラスト学習フレームワークの下で知識認識分子エンコーダを介してドメイン知識を明示的にエンコードします。
8つの公開データセットの実験は、平均で6%の絶対的な改善と私たちのモデルの有効性を示しています。
論文 参考訳(メタデータ) (2021-03-24T08:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。