論文の概要: Prompt Engineering for Transformer-based Chemical Similarity Search
Identifies Structurally Distinct Functional Analogues
- arxiv url: http://arxiv.org/abs/2305.16330v1
- Date: Wed, 17 May 2023 13:37:15 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-04 12:07:14.825967
- Title: Prompt Engineering for Transformer-based Chemical Similarity Search
Identifies Structurally Distinct Functional Analogues
- Title(参考訳): 変換器を用いた化学類似性探索のためのプロンプト工学
- Authors: Clayton W. Kosonocky, Aaron L. Feller, Claus O. Wilke, Andrew D.
Ellington
- Abstract要約: 化学言語モデルを用いて,ベクトルに基づく化学探索を行う。
本手法は,5つの薬物様問合せ分子と3つの染料様問合せ分子の検索結果をレビューすることによって検討する。
本手法は, 関連する特許文献で示される, クエリと機能的に類似した分子を同定する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Chemical similarity searches are widely used in-silico methods for
identifying new drug-like molecules. These methods have historically relied on
structure-based comparisons to compute molecular similarity. Here, we use a
chemical language model to create a vector-based chemical search. We extend
implementations by creating a prompt engineering strategy that utilizes two
different chemical string representation algorithms: one for the query and the
other for the database. We explore this method by reviewing the search results
from five drug-like query molecules (penicillin G, nirmatrelvir, zidovudine,
lysergic acid diethylamide, and fentanyl) and three dye-like query molecules
(acid blue 25, avobenzone, and 2-diphenylaminocarbazole). We find that this
novel method identifies molecules that are functionally similar to the query,
indicated by the associated patent literature, and that many of these molecules
are structurally distinct from the query, making them unlikely to be found with
traditional chemical similarity search methods. This method may aid in the
discovery of novel structural classes of molecules that achieve target
functionality.
- Abstract(参考訳): 化学類似性検索は、新しい薬物様分子を同定するためにin-silico法で広く使われている。
これらの手法は歴史的に計算分子の類似性に対する構造に基づく比較に依存している。
ここでは, 化学言語モデルを用いて, ベクトルに基づく化学探索を行う。
我々は,2つの異なる化学文字列表現アルゴリズム(1つはクエリ,もう1つはデータベース)を利用する,迅速なエンジニアリング戦略を作成することで実装を拡張した。
本手法は,5つの薬物様クエリ分子 (ペニシリンG, ニアルトレルビル, ジドブジン, リセリン酸ジエチルアミド, フェンタニル) および3つの色素様クエリ分子 (アシッドブルー25, アボベンゾインおよび2-ジフェニルアミノカルバゾール) の検索結果について検討した。
この手法は,関連特許文献で示されるクエリと機能的に類似する分子を同定し,これらの分子の多くはクエリとは構造的に異なるため,従来の化学類似性探索法では見当たらないことが判明した。
この方法は、標的機能を達成する新しい分子の構造クラスを発見するのに役立つ。
関連論文リスト
- Mining Patents with Large Language Models Elucidates the Chemical
Function Landscape [0.3749861135832073]
大規模テキスト由来の化学関数データセットが, 化学機能の実際の景観を反映していることが示される。
そして、このテキストベースの機能的ランドスケープを利用して、ターゲット機能を持つ薬物を識別できることを実証する。
我々は、機能的ラベル誘導分子発見が、従来の構造に基づく手法へのアプローチとして役立つと信じている。
論文 参考訳(メタデータ) (2023-09-15T21:08:41Z) - Context-enriched molecule representations improve few-shot drug
discovery [8.379853456273674]
数発の薬物発見のための新しい方法を提案する。
私たちの基本的な考え方は、既知のコンテキストや参照分子に関する知識によって分子表現を豊かにすることです。
本手法は,FS-Molベンチマークデータセットにおいて,薬物発見のためのいくつかの方法と比較した。
論文 参考訳(メタデータ) (2023-04-24T17:58:05Z) - An Equivariant Generative Framework for Molecular Graph-Structure
Co-Design [54.92529253182004]
分子グラフ構造アンダーラインCo設計のための機械学習ベースの生成フレームワークであるMollCodeを提案する。
MolCodeでは、3D幾何情報によって分子2Dグラフの生成が促進され、それによって分子3D構造の予測が導かれる。
分子設計における2次元トポロジーと3次元幾何は本質的に相補的な情報を含んでいることが明らかとなった。
論文 参考訳(メタデータ) (2023-04-12T13:34:22Z) - De Novo Molecular Generation via Connection-aware Motif Mining [197.97528902698966]
我々は、マイニングされた接続認識モチーフに基づいて分子を生成する新しい方法、MiCaMを提案する。
得られたモチーフ語彙は、分子モチーフ(頻繁な断片)だけでなく、それらの接続情報も含む。
マイニングされた接続対応モチーフに基づいて、MiCaMは接続対応ジェネレータを構築し、同時にモチーフをピックアップし、どのように接続されているかを決定する。
論文 参考訳(メタデータ) (2023-02-02T14:40:47Z) - Multi-modal Molecule Structure-text Model for Text-based Retrieval and
Editing [107.49804059269212]
分子の化学構造とテキスト記述を共同で学習し, マルチモーダルな分子構造テキストモデル, MoleculeSTMを提案する。
実験において、分子STMは、新しい生化学的概念を創出するための最先端の一般化能力を得る。
論文 参考訳(メタデータ) (2022-12-21T06:18:31Z) - Equivariant 3D-Conditional Diffusion Models for Molecular Linker Design [82.23006955069229]
分子リンカ設計のためのE(3)等価な3次元拡散モデルDiffLinkerを提案する。
我々のモデルは、欠落した原子を中間に配置し、初期フラグメントを全て組み込んだ分子を設計する。
DiffLinkerは、より多種多様な合成可能な分子を生成する標準データセット上で、他の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-10-11T09:13:37Z) - Scalable Fragment-Based 3D Molecular Design with Reinforcement Learning [68.8204255655161]
分子構築に階層的エージェントを用いるスケーラブルな3D設計のための新しいフレームワークを提案する。
様々な実験において、エネルギーのみを考慮に入れたエージェントが、100以上の原子を持つ分子を効率よく生成できることが示されている。
論文 参考訳(メタデータ) (2022-02-01T18:54:24Z) - MM-Deacon: Multimodal molecular domain embedding analysis via
contrastive learning [6.761743360275381]
MM-Deacon と呼ばれる多モード分子埋め込み生成手法を提案する。
MM-DeaconはSMILESとIUPAC分子表現を2つの異なるモードとして訓練する。
分子クラスタリング,クロスモーダル分子探索,薬物類似性評価,薬物と薬物の相互作用タスクに対する分子埋め込みの堅牢性を評価した。
論文 参考訳(メタデータ) (2021-09-18T04:46:39Z) - RetroGNN: Approximating Retrosynthesis by Graph Neural Networks for De
Novo Drug Design [75.14290780116002]
我々は、再合成計画ソフトウェアの出力を近似するために、ディープグラフニューラルネットワークを訓練する。
提案手法では, 薬剤的特性は良好であり, 合成が容易であるにもかかわらず, 抗生物質である可能性が示唆された分子について検討した。
論文 参考訳(メタデータ) (2020-11-25T22:04:16Z) - Goal directed molecule generation using Monte Carlo Tree Search [15.462930062711237]
我々は,モンテカルロ木探索を用いて,各ステップで分子を単位変化させることにより分子生成を行う,ユニットMCTSと呼ばれる新しい手法を提案する。
本手法は,最近発表されたQEDやopalized logPといったベンチマーク分子最適化の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-10-30T17:49:59Z) - ChemoVerse: Manifold traversal of latent spaces for novel molecule
discovery [0.7742297876120561]
所望の化学的性質を持つ分子構造を同定することが不可欠である。
ニューラルネットワークと機械学習を用いた生成モデルの最近の進歩は、薬物のような化合物の仮想ライブラリの設計に広く利用されている。
論文 参考訳(メタデータ) (2020-09-29T12:11:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。