Fugu-MT 論文翻訳(概要): Molecular Language Model as Multi-task Generator

論文の概要: Molecular Language Model as Multi-task Generator

arxiv url: http://arxiv.org/abs/2301.11259v1
Date: Thu, 26 Jan 2023 17:52:56 GMT
ステータス: 翻訳完了
システム内更新日: 2023-01-27 13:08:40.507006
Title: Molecular Language Model as Multi-task Generator
Title（参考訳）: マルチタスクジェネレータとしての分子言語モデル
Authors: Yin Fang, Ningyu Zhang, Zhuo Chen, Xiaohui Fan, Huajun Chen
Abstract要約: MolGenはトレーニング済みの分子言語モデルで、複数の世代タスクやドメインの知識を効果的に学習し、共有する。実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。
参考スコア（独自算出の注目度）: 30.738684922996466
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Molecule generation with desired properties has grown immensely in popularity by disruptively changing the way scientists design molecular structures and providing support for chemical and materials design. However, despite the promising outcome, previous machine learning-based deep generative models suffer from a reliance on complex, task-specific fine-tuning, limited dimensional latent spaces, or the quality of expert rules. In this work, we propose MolGen, a pre-trained molecular language model that effectively learns and shares knowledge across multiple generation tasks and domains. Specifically, we pre-train MolGen with the chemical language SELFIES on more than 100 million unlabelled molecules. We further propose multi-task molecular prefix tuning across several molecular generation tasks and different molecular domains (synthetic & natural products) with a self-feedback mechanism. Extensive experiments show that MolGen can obtain superior performances on well-known molecular generation benchmark datasets. The further analysis illustrates that MolGen can accurately capture the distribution of molecules, implicitly learn their structural characteristics, and efficiently explore the chemical space with the guidance of multi-task molecular prefix tuning. Codes, datasets, and the pre-trained model will be available in https://github.com/zjunlp/MolGen.
Abstract（参考訳）: 望ましい性質を持つ分子の生成は、科学者が分子構造を設計する方法を変え、化学や材料の設計をサポートすることによって、非常に人気を高めてきた。しかし、有望な結果にもかかわらず、従来の機械学習に基づく深層生成モデルは、複雑なタスク固有の微調整、限られた次元の潜在空間、あるいはエキスパートルールの品質に依存している。本研究では,複数の世代タスクやドメインの知識を効果的に学習し,共有する分子言語モデルであるMolGenを提案する。具体的には、MolGenを化学言語SELFIESで1億以上の未標識分子で事前訓練する。さらに,複数の分子生成タスクと異なる分子ドメイン(合成および天然物)にまたがるマルチタスク分子プレフィックスチューニングを自己フィードバック機構で提案する。大規模な実験により、MollGenはよく知られた分子生成ベンチマークデータセットで優れた性能を得ることができることが示された。さらに,分子の分布を正確に把握し,その構造的特性を暗黙的に学習し,マルチタスク分子プレフィックスチューニングの指導により効率的に化学空間を探索できることを示した。コード、データセット、および事前トレーニングされたモデルはhttps://github.com/zjunlp/MolGen.orgで入手できる。

関連論文リスト

Mol-CADiff: Causality-Aware Autoregressive Diffusion for Molecule Generation [13.401822039640297]
Mol-CADiffは、テキスト条件の分子生成に因果的注意機構を用いる、新しい拡散ベースのフレームワークである。提案手法はテキストプロンプトと分子構造との因果関係を明示的にモデル化し,既存の手法の限界を克服する。我々の実験は、モル-CADiffが多種多様で新規で化学的に有効な分子を生成する上で、最先端の手法より優れていることを実証した。
論文参考訳（メタデータ） (2025-03-07T15:10:37Z)
Mol-LLaMA: Towards General Understanding of Molecules in Large Molecular Language Model [55.87790704067848]
Mol-LLaMAは、分子を中心とした一般的な知識を把握した大きな分子言語モデルである。異なる分子エンコーダの相補的な情報を統合するモジュールを導入する。実験の結果,Moll-LLaMAは分子の一般的な特徴を理解することができることがわかった。
論文参考訳（メタデータ） (2025-02-19T05:49:10Z)
Knowledge-aware contrastive heterogeneous molecular graph learning [77.94721384862699]
分子グラフを不均一な分子グラフ学習(KCHML)に符号化するパラダイムシフトを提案する。 KCHMLは、不均一な分子グラフと二重メッセージパッシング機構によって強化された3つの異なるグラフビュー-分子、元素、薬理学-を通して分子を概念化する。この設計は、プロパティ予測やドラッグ・ドラッグ・インタラクション(DDI)予測などの下流タスクに対する包括的な表現を提供する。
論文参考訳（メタデータ） (2025-02-17T11:53:58Z)
MolMiner: Transformer architecture for fragment-based autoregressive generation of molecular stories [7.366789601705544]
生成過程の化学的妥当性、解釈可能性、可変分子サイズへの柔軟性は、計算材料設計における生成モデルに残る課題の1つである。本稿では,分子生成を離散的かつ解釈可能なステップの列に分解する自己回帰的手法を提案する。この結果から,本モデルでは,提案した多目的目標目標に応じて,生成分布を効果的にバイアスすることができることがわかった。
論文参考訳（メタデータ） (2024-11-10T22:00:55Z)
MolTRES: Improving Chemical Language Representation Learning for Molecular Property Prediction [14.353313239109337]
MolTRESは化学言語表現学習フレームワークである。ジェネレータと識別器のトレーニングが組み込まれており、より難しい例からモデルを学習することができる。我々のモデルは、一般的な分子特性予測タスクにおける既存の最先端モデルよりも優れています。
論文参考訳（メタデータ） (2024-07-09T01:14:28Z)
Navigating Chemical Space with Latent Flows [20.95884505685799]
本稿では,分子生成モデルによって学習された潜伏空間をフローを通して移動させることにより,化学空間を横断する新しいフレームワークであるChemFlowを提案する。我々は,分子操作におけるChemFlowの有効性と,教師なしおよび教師なしの両方の分子発見条件下での単目的および多目的最適化タスクの有効性を検証した。
論文参考訳（メタデータ） (2024-05-07T03:55:57Z)
From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文参考訳（メタデータ） (2023-11-05T23:47:52Z)
Interactive Molecular Discovery with Natural Language [69.89287960545903]
対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
論文参考訳（メタデータ） (2023-06-21T02:05:48Z)
An Equivariant Generative Framework for Molecular Graph-Structure Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。 MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文参考訳（メタデータ） (2023-04-12T13:34:22Z)
A Molecular Multimodal Foundation Model Associating Molecule Graphs with Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文参考訳（メタデータ） (2022-09-12T00:56:57Z)
Interpretable Molecular Graph Generation via Monotonic Constraints [19.401468196146336]
ディープグラフ生成モデルは、分子設計をグラフ生成問題として扱う。既存のモデルには多くの欠点があり、解釈性や所望の分子特性に対する制御性が低い。本稿では,分子生成の解釈可能なモデルと深層制御可能なモデルを用いた新しい手法を提案する。
論文参考訳（メタデータ） (2022-02-28T08:35:56Z)
Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文参考訳（メタデータ） (2022-02-01T18:54:24Z)
Learning Latent Space Energy-Based Prior Model for Molecule Generation [59.875533935578375]
分子モデリングのためのSMILES表現を用いた潜時空間エネルギーに基づく先行モデルについて学習する。本手法は,最先端モデルと競合する妥当性と特異性を持つ分子を生成することができる。
論文参考訳（メタデータ） (2020-10-19T09:34:20Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。