Fugu-MT 論文翻訳(概要): From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning

論文の概要: From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning

arxiv url: http://arxiv.org/abs/2311.02798v2
Date: Mon, 1 Jul 2024 02:19:36 GMT
ステータス: 翻訳完了
システム内更新日: 2024-07-02 17:40:31.661633
Title: From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning
Title（参考訳）: 分子から足場から機能群へ:多チャンネル学習による文脈依存的分子表現の構築
Authors: Yue Wan, Jialu Wu, Tingjun Hou, Chang-Yu Hsieh, Xiaowei Jia,
Abstract要約: 本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
参考スコア（独自算出の注目度）: 10.025809630976065
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Reliable molecular property prediction is essential for various scientific endeavors and industrial applications, such as drug discovery. However, the data scarcity, combined with the highly non-linear causal relationships between physicochemical and biological properties and conventional molecular featurization schemes, complicates the development of robust molecular machine learning models. Self-supervised learning (SSL) has emerged as a popular solution, utilizing large-scale, unannotated molecular data to learn a foundational representation of chemical space that might be advantageous for downstream tasks. Yet, existing molecular SSL methods largely overlook chemical knowledge, including molecular structure similarity, scaffold composition, and the context-dependent aspects of molecular properties when operating over the chemical space. They also struggle to learn the subtle variations in structure-activity relationship. This paper introduces a novel pre-training framework that learns robust and generalizable chemical knowledge. It leverages the structural hierarchy within the molecule, embeds them through distinct pre-training tasks across channels, and aggregates channel information in a task-specific manner during fine-tuning. Our approach demonstrates competitive performance across various molecular property benchmarks and offers strong advantages in particularly challenging yet ubiquitous scenarios like activity cliffs.
Abstract（参考訳）: 信頼性の高い分子特性予測は、様々な科学的取り組みや薬物発見などの工業的応用に不可欠である。しかし、データ不足は、物理化学的および生物学的性質と従来の分子破砕法の間の非常に非線形因果関係と相まって、堅牢な分子機械学習モデルの開発を複雑にしている。自己教師付き学習(SSL)は、ダウンストリームタスクに有利な化学空間の基本的な表現を学ぶために、大規模で無注釈の分子データを活用する一般的なソリューションとして登場した。しかし、既存の分子SSL法は、分子構造類似性、足場組成、化学空間上での操作時の分子特性の文脈依存的な側面など、化学知識を概ね見落としている。彼らはまた、構造-活動関係の微妙な変化を学ぶのにも苦労した。本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。分子の構造的階層を利用し、チャネルをまたいだ個別の事前訓練タスクを通じてそれらを埋め込み、微調整中にチャネル情報をタスク固有の方法で集約する。提案手法は,様々な分子特性ベンチマークにおける競合性能を実証し,特に活動崖のようなユビキタスで困難なシナリオにおいて強力な優位性を提供する。

関連論文リスト

Unveiling Latent Knowledge in Chemistry Language Models through Sparse Autoencoders [42.033443425253644]
我々はスパースオートエンコーダ技術を拡張して化学言語モデル内の解釈可能な特徴を明らかにし,検討する。以上の結果から,これらのモデルが化学概念の豊かな風景をエンコードしていることが判明した。我々のアプローチは、化学にフォーカスしたAIシステムにおける潜在知識を明らかにするための一般的なフレームワークを提供する。
論文参考訳（メタデータ） (2025-12-08T22:20:01Z)
Mamba-driven multi-perspective structural understanding for molecular ground-state conformation prediction [69.32436472760712]
本稿では,マンバ駆動型多面的構造理解(MPSU-Mamba)による分子基底状態の局在化手法を提案する。複雑で多様な分子に対しては、対応する分子構造の包括的認識を構築するために、3種類の専用の走査戦略が検討されている。 QM9 と Molecule3D データセットの実験結果から,MPSU-Mamba が既存の手法よりも優れていたことが示唆された。
論文参考訳（メタデータ） (2025-11-10T11:18:32Z)
$\ ext{M}^{2}$LLM: Multi-view Molecular Representation Learning with Large Language Models [59.125833618091846]
分子構造ビュー,分子タスクビュー,分子規則ビューの3つの視点を統合した多視点フレームワークを提案する。実験によると、$textM2$LLMは、分類タスクと回帰タスクをまたいだ複数のベンチマークで最先端のパフォーマンスを達成する。
論文参考訳（メタデータ） (2025-08-12T05:46:47Z)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.87790704067848]
Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。異なる分子エンコーダの相補的な情報を統合するモジュールを導入する。実験の結果,Moll-LLaMAは分子の一般的な特徴を理解することができることがわかった。
論文参考訳（メタデータ） (2025-02-19T05:49:10Z)
Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。 KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文参考訳（メタデータ） (2025-02-17T11:53:58Z)
Learning Multi-view Molecular Representations with Structured and Unstructured Knowledge [14.08112359246334]
本稿では, 化学構造から多視点分子知識を抽出する表現学習モデルMV-Mol, バイオメディカルテキストからの非構造化知識, 知識グラフからの構造化知識について述べる。 MV-Molは分子特性予測に有効であることを示す。
論文参考訳（メタデータ） (2024-06-14T08:48:10Z)
MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文参考訳（メタデータ） (2024-06-13T02:50:23Z)
Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文参考訳（メタデータ） (2024-04-05T17:15:48Z)
Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。 TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文参考訳（メタデータ） (2024-03-20T02:15:55Z)
Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文参考訳（メタデータ） (2023-06-21T02:05:48Z)
Towards Predicting Equilibrium Distributions for Molecular Systems with Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。 DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文参考訳（メタデータ） (2023-06-08T17:12:08Z)
Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文参考訳（メタデータ） (2023-02-04T01:32:40Z)
Domain-Agnostic Molecular Generation with Chemical Feedback [44.063584808910896]
MolGenは、分子生成に特化した事前訓練された分子言語モデルである。 1億以上の分子SELFIESを再構成することで構造的および文法的な洞察を内部化する。我々の化学フィードバックパラダイムは、モデルを分子幻覚から遠ざけ、モデルの推定確率と実世界の化学的嗜好との整合性を確保する。
論文参考訳（メタデータ） (2023-01-26T17:52:56Z)
Discovery of structure-property relations for molecules via hypothesis-driven active learning over the chemical space [0.0]
本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
論文参考訳（メタデータ） (2023-01-06T14:22:43Z)
A Molecular Multimodal Foundation Model Associating Molecule Graphs with Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文参考訳（メタデータ） (2022-09-12T00:56:57Z)
Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文参考訳（メタデータ） (2022-02-01T18:54:24Z)
Knowledge-aware Contrastive Molecular Graph Learning [5.08771973600915]
自己監督型分子表現学習のためのコントラシブナレッジアウェアGNN(CKGNN)を提案する。私たちは、コントラスト学習フレームワークの下で知識認識分子エンコーダを介してドメイン知識を明示的にエンコードします。 8つの公開データセットの実験は、平均で6%の絶対的な改善と私たちのモデルの有効性を示しています。
論文参考訳（メタデータ） (2021-03-24T08:55:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。