論文の概要: Interactive Molecular Discovery with Natural Language
- arxiv url: http://arxiv.org/abs/2306.11976v1
- Date: Wed, 21 Jun 2023 02:05:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-22 15:05:40.685748
- Title: Interactive Molecular Discovery with Natural Language
- Title(参考訳): 自然言語を用いた対話型分子発見
- Authors: Zheni Zeng, Bangchen Yin, Shipeng Wang, Jiarui Liu, Cheng Yang,
Haishen Yao, Xingzhi Sun, Maosong Sun, Guotong Xie, Zhiyuan Liu
- Abstract要約: 対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
この課題をより良くするために、実験プロパティ情報を注入することによって強化された知識的で汎用的な生成事前学習モデルChatMolを設計する。
- 参考スコア(独自算出の注目度): 69.89287960545903
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Natural language is expected to be a key medium for various human-machine
interactions in the era of large language models. When it comes to the
biochemistry field, a series of tasks around molecules (e.g., property
prediction, molecule mining, etc.) are of great significance while having a
high technical threshold. Bridging the molecule expressions in natural language
and chemical language can not only hugely improve the interpretability and
reduce the operation difficulty of these tasks, but also fuse the chemical
knowledge scattered in complementary materials for a deeper comprehension of
molecules. Based on these benefits, we propose the conversational molecular
design, a novel task adopting natural language for describing and editing
target molecules. To better accomplish this task, we design ChatMol, a
knowledgeable and versatile generative pre-trained model, enhanced by injecting
experimental property information, molecular spatial knowledge, and the
associations between natural and chemical languages into it. Several typical
solutions including large language models (e.g., ChatGPT) are evaluated,
proving the challenge of conversational molecular design and the effectiveness
of our knowledge enhancement method. Case observations and analysis are
conducted to provide directions for further exploration of natural-language
interaction in molecular discovery.
- Abstract(参考訳): 自然言語は、大規模言語モデルの時代における様々な人間と機械の相互作用の鍵となる媒体として期待されている。
生化学の分野では、分子を取り巻く一連のタスク(例えば、特性予測、分子採掘など)は、高い技術的閾値を持ちながら非常に重要である。
自然言語と化学言語における分子表現の橋渡しは、これらのタスクの解釈性を大幅に向上させ、操作の困難さを低減させるだけでなく、分子の深い理解のために補足材料に散在する化学知識を融合させる。
これらの利点に基づき,対象分子を記述・編集するための自然言語を用いた対話型分子設計を提案する。
実験的な特性情報、分子空間知識、そして自然言語と化学言語の間の関連を注入することで強化された、知識の豊富で多用途な事前学習モデルであるchatmolを設計した。
大規模言語モデル(chatgptなど)を含むいくつかの典型的なソリューションを評価し、対話型分子設計の課題と知識強化手法の有効性を証明した。
事例観察と解析を行い、分子発見における自然言語相互作用のさらなる探索の方向性を提供する。
関連論文リスト
- MolMetaLM: a Physicochemical Knowledge-Guided Molecular Meta Language Model [19.458584012046646]
本稿では,分子メタ言語フレームワーク MolMetaLM を提案する。
我々は、同じS(分子)を共有する複数のS,P,O>知識トリプルとしてフォーマットされた分子特化メタ言語パラダイムを設計する。
異なる分子知識とノイズを導入することで、メタ言語パラダイムは数万の事前学習タスクを生成する。
論文 参考訳(メタデータ) (2024-11-23T09:27:38Z) - InstructBioMol: Advancing Biomolecule Understanding and Design Following Human Instructions [32.38318676313486]
InstructBioMolは自然言語と生体分子を橋渡しするように設計されている。
マルチモーダルな生体分子を入力として統合し、研究者が自然言語で設計目標を明確にすることができる。
結合親和性は10%向上し、ESPスコア70.4に達する酵素を設計することができる。
論文 参考訳(メタデータ) (2024-10-10T13:45:56Z) - Instruction Multi-Constraint Molecular Generation Using a Teacher-Student Large Language Model [49.64512917330373]
本稿では,学生に類似した多制約分子生成大言語モデルTSMMGを紹介する。
TSMMGを訓練するために、これらの「教師」から分子知識を抽出し、大量のテキスト-分子対を構築する。
我々は,TSMMGが複雑で自然言語で記述された特性を満たす分子を生成できることを実験的に明らかにした。
論文 参考訳(メタデータ) (2024-03-20T02:15:55Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - Language models in molecular discovery [2.874893537471256]
科学的言語モデル」は、小さな分子、タンパク質、またはポリマーで機能する。
化学において、言語モデルは分子発見サイクルの加速に寄与する。
我々は、貴重なオープンソースソフトウェア資産を強調し、科学言語モデリングの分野への参入障壁を低くする。
論文 参考訳(メタデータ) (2023-09-28T08:19:54Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Multi-modal Molecule Structure-text Model for Text-based Retrieval and
Editing [107.49804059269212]
分子の化学構造とテキスト記述を共同で学習し, マルチモーダルな分子構造テキストモデル, MoleculeSTMを提案する。
実験において、分子STMは、新しい生化学的概念を創出するための最先端の一般化能力を得る。
論文 参考訳(メタデータ) (2022-12-21T06:18:31Z) - A Molecular Multimodal Foundation Model Associating Molecule Graphs with
Natural Language [63.60376252491507]
本稿では,分子グラフとその意味的関連テキストデータから事前学習した分子マルチモーダル基礎モデルを提案する。
我々のモデルは、生物学、化学、材料、環境、医学などの分野において、AIを動力とする分野に幅広い影響を与えるだろうと考えています。
論文 参考訳(メタデータ) (2022-09-12T00:56:57Z) - Exploring Chemical Space using Natural Language Processing Methodologies
for Drug Discovery [0.5389800405902634]
テキストに基づく化学物質やタンパク質の表現は、ドメイン固有の知識を記述するために人間がコード化した非構造言語と考えることができる。
本総説では、これらの進歩が薬物発見に与える影響を概説し、薬理学者とコンピュータ科学者との対話をさらに進めることを目的とする。
論文 参考訳(メタデータ) (2020-02-10T21:02:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。