論文の概要: Assay2Mol: large language model-based drug design using BioAssay context
- arxiv url: http://arxiv.org/abs/2507.12574v1
- Date: Wed, 16 Jul 2025 18:42:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.248272
- Title: Assay2Mol: large language model-based drug design using BioAssay context
- Title(参考訳): Assay2Mol:BioAssayコンテキストを用いた大規模言語モデルに基づく医薬品設計
- Authors: Yifan Deng, Spencer S. Ericksen, Anthony Gitter,
- Abstract要約: 生化学において、分子スクリーニング法は、疾患標的に対する候補分子の機能的応答を評価する。
これらの標的が作用する生物学的機構を記述した構造化されていないテキストは、新しい薬物発見キャンペーンのための豊富な情報を提供する。
Assay2Molは大規模言語モデルに基づくワークフローで、初期の医薬品発見のための膨大な生化学的スクリーニングアッセイを活用できる。
- 参考スコア(独自算出の注目度): 2.2667044928324747
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific databases aggregate vast amounts of quantitative data alongside descriptive text. In biochemistry, molecule screening assays evaluate the functional responses of candidate molecules against disease targets. Unstructured text that describes the biological mechanisms through which these targets operate, experimental screening protocols, and other attributes of assays offer rich information for new drug discovery campaigns but has been untapped because of that unstructured format. We present Assay2Mol, a large language model-based workflow that can capitalize on the vast existing biochemical screening assays for early-stage drug discovery. Assay2Mol retrieves existing assay records involving targets similar to the new target and generates candidate molecules using in-context learning with the retrieved assay screening data. Assay2Mol outperforms recent machine learning approaches that generate candidate ligand molecules for target protein structures, while also promoting more synthesizable molecule generation.
- Abstract(参考訳): 科学データベースは大量の量的データと記述的テキストを集約する。
生化学において、分子スクリーニング法は、疾患標的に対する候補分子の機能的応答を評価する。
これらの標的が作用する生物学的メカニズムを記述した非構造化テキスト、実験的なスクリーニングプロトコル、その他のアッセイの属性は、新しい薬物発見キャンペーンに豊富な情報を提供するが、その非構造化フォーマットのために未発見のままである。
Assay2Molは大規模言語モデルに基づくワークフローで、初期の医薬品発見のための膨大な生化学的スクリーニングアッセイを活用できる。
Assay2Molは、新しいターゲットに類似したターゲットを含む既存のアッセイレコードを検索し、検索したアッセイスクリーニングデータを用いてコンテキスト内学習を用いて候補分子を生成する。
Assay2Molは、ターゲットタンパク質構造のための候補リガンド分子を生成する機械学習アプローチよりも優れており、さらに合成可能な分子生成を促進する。
関連論文リスト
- Flow Matching Meets Biology and Life Science: A Survey [65.2146737141455]
拡散に基づく生成モデリングの強力な代替手段としてフローマッチングが登場した。
本稿では,フローマッチングの最近の進歩とその生物学的領域への応用に関する包括的調査について述べる。
論文 参考訳(メタデータ) (2025-07-23T17:44:29Z) - Conditional Chemical Language Models are Versatile Tools in Drug Discovery [0.0]
分子の優先順位を決定するための生物学的文脈を規定する化学モデリングフレームワークSAFE-Tを提案する。
仮想スクリーニング、ドラッグ・ターゲット相互作用予測、アクティビティ・崖検出などのタスク間で分子のスコアリングがサポートされている。
既存のアプローチに匹敵するパフォーマンスを継続的に達成します。
論文 参考訳(メタデータ) (2025-07-14T13:42:39Z) - Biological Sequence with Language Model Prompting: A Survey [14.270959261105968]
大きな言語モデル(LLM)は、さまざまなドメインにまたがる課題に対処するための強力なツールとして登場した。
本稿では, LLMを用いたプロンプトベース手法の生物学的配列への応用を系統的に検討する。
論文 参考訳(メタデータ) (2025-03-06T06:28:36Z) - De Novo Generation of Hit-like Molecules from Gene Expression Profiles via Deep Learning [3.9518122220368905]
生体活性と薬物様特性を有する新しい分子を生成するために,ハイブリッドニューラルネットワーク HNN2Mol を提案する。
実験およびケーススタディにより、提案されたHNN2Molモデルが、潜在的な生物活性と薬物様の性質を持つ新しい分子を生成できることが示されている。
論文 参考訳(メタデータ) (2024-12-27T03:16:56Z) - FARM: Functional Group-Aware Representations for Small Molecules [55.281754551202326]
小型分子のための機能的グループ認識表現(FARM)について紹介する。
FARMはSMILES、自然言語、分子グラフのギャップを埋めるために設計された基礎モデルである。
MoleculeNetデータセット上でFARMを厳格に評価し、12タスク中10タスクで最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-02T23:04:58Z) - MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。
我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。
このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文 参考訳(メタデータ) (2024-06-13T02:50:23Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - An Evaluation of Large Language Models in Bioinformatics Research [52.100233156012756]
本研究では,大規模言語モデル(LLM)の性能について,バイオインフォマティクスの幅広い課題について検討する。
これらのタスクには、潜在的なコーディング領域の同定、遺伝子とタンパク質の命名されたエンティティの抽出、抗微生物および抗がんペプチドの検出、分子最適化、教育生物情報学問題の解決が含まれる。
以上の結果から, GPT 変種のような LLM がこれらのタスクの多くをうまく処理できることが示唆された。
論文 参考訳(メタデータ) (2024-02-21T11:27:31Z) - Retrieval-based Controllable Molecule Generation [63.44583084888342]
制御可能な分子生成のための検索に基づく新しいフレームワークを提案する。
我々は、与えられた設計基準を満たす分子の合成に向けて、事前学習された生成モデルを操るために、分子の小さなセットを使用します。
提案手法は生成モデルの選択に非依存であり,タスク固有の微調整は不要である。
論文 参考訳(メタデータ) (2022-08-23T17:01:16Z) - A biologically-inspired evaluation of molecular generative machine
learning [17.623886600638716]
分子生成モデル評価のためのバイオインスパイアされた新しいベンチマークを提案する。
本稿では, 創出出力評価のための相補的手法として, レクリエーション指標, 薬物-標的親和性予測, 分子ドッキングを提案する。
論文 参考訳(メタデータ) (2022-08-20T11:01:10Z) - CogMol: Target-Specific and Selective Drug Design for COVID-19 Using
Deep Generative Models [74.58583689523999]
新規なウイルスタンパク質を標的とした新規な薬物様小分子を設計するためのエンド・ツー・エンドのフレームワークであるCogMolを提案する。
CogMolは、分子SMILES変分オートエンコーダ(VAE)の適応事前学習と、効率的なマルチ属性制御サンプリングスキームを組み合わせる。
CogMolは、高目標特異性と選択性を有する合成可能で低毒性な薬物様分子の多制約設計を扱う。
論文 参考訳(メタデータ) (2020-04-02T18:17:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。