論文の概要: Natural Language Processing Methods for the Study of Protein-Ligand Interactions
- arxiv url: http://arxiv.org/abs/2409.13057v2
- Date: Thu, 17 Oct 2024 16:56:34 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-07 12:03:17.543890
- Title: Natural Language Processing Methods for the Study of Protein-Ligand Interactions
- Title(参考訳): タンパク質-リガンド相互作用研究のための自然言語処理法
- Authors: James Michels, Ramya Bandarupalli, Amin Ahangar Akbari, Thai Le, Hong Xiao, Jing Li, Erik F. Y. Hom,
- Abstract要約: 自然言語処理の最近の進歩は、タンパク質-リガンド相互作用を予測する効果的な方法の開発に関心を抱いている。
本稿では,近年の文献にそのようなアプローチが適用された経緯と,短期記憶,変圧器,注意などの有用なメカニズムについて解説する。
我々は、PLIの研究におけるNLP手法の現在の限界と、今後の課題について論じる。
- 参考スコア(独自算出の注目度): 8.165512093198934
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Recent advances in Natural Language Processing (NLP) have ignited interest in developing effective methods for predicting protein-ligand interactions (PLIs) given their relevance to drug discovery and protein engineering efforts and the ever-growing volume of biochemical sequence and structural data available. The parallels between human languages and the "languages" used to represent proteins and ligands have enabled the use of NLP machine learning approaches to advance PLI studies. In this review, we explain where and how such approaches have been applied in the recent literature and discuss useful mechanisms such as long short-term memory, transformers, and attention. We conclude with a discussion of the current limitations of NLP methods for the study of PLIs as well as key challenges that need to be addressed in future work.
- Abstract(参考訳): 自然言語処理(NLP)の最近の進歩は、医薬品の発見とタンパク質工学の取り組みと、生化学的配列と構造データの利用量との関連性から、タンパク質-リガンド相互作用(PLI)を予測する効果的な方法の開発に関心を抱いている。
ヒト言語とタンパク質とリガンドを表現するために使われる「言語」の並列性は、PLI研究を進めるためにNLP機械学習アプローチを有効活用している。
本稿では,このようなアプローチが近年の文献にどのように適用されているかを説明し,長期記憶,トランスフォーマー,注意などの有用なメカニズムについて論じる。
我々は、PLIの研究におけるNLP手法の現在の限界と、今後の課題について論じる。
関連論文リスト
- Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Leveraging Biomolecule and Natural Language through Multi-Modal
Learning: A Survey [75.47055414002571]
生物分子モデリングと自然言語(BL)の統合は、人工知能、化学、生物学の交差点において有望な学際領域として現れてきた。
生体分子と自然言語の相互モデリングによって達成された最近の進歩について分析する。
論文 参考訳(メタデータ) (2024-03-03T14:59:47Z) - Synergizing Machine Learning & Symbolic Methods: A Survey on Hybrid Approaches to Natural Language Processing [7.242609314791262]
自然言語の理解、生成、推論を必要とする幅広いNLPタスクに使われている最先端のハイブリッドアプローチについて論じる。
具体的には、自然言語理解、生成、推論を必要とする幅広いNLPタスクに使用される最先端のハイブリッドアプローチについて検討する。
論文 参考訳(メタデータ) (2024-01-22T14:24:03Z) - Exploring the Landscape of Natural Language Processing Research [3.3916160303055567]
NLP関連のいくつかのアプローチが研究コミュニティで調査されている。
確立したトピックを分類し、傾向を特定し、今後の研究分野を概説する総合的研究はいまだに残っていない。
その結果,NLPにおける研究分野の分類,最近のNLPの発展分析,研究成果の要約,今後の研究の方向性について概説した。
論文 参考訳(メタデータ) (2023-07-20T07:33:30Z) - Comparative Performance Evaluation of Large Language Models for
Extracting Molecular Interactions and Pathway Knowledge [6.244840529371179]
タンパク質の相互作用と経路の知識を理解することは、生きたシステムの複雑さを解き明かすのに不可欠です。
既存のデータベースは、文学やその他の情報源から収集された生物学的データを提供しているが、そのメンテナンスは労働集約的である。
本稿では,これらの問題に対処する大規模言語モデルの能力を活用し,関連する科学文献からそのような知識を自動的に抽出することを提案する。
論文 参考訳(メタデータ) (2023-07-17T20:01:11Z) - Interactive Natural Language Processing [67.87925315773924]
対話型自然言語処理(iNLP)は,NLP分野における新しいパラダイムとして登場した。
本稿では,iNLPの概念の統一的定義と枠組みを提案することから,iNLPに関する包括的調査を行う。
論文 参考訳(メタデータ) (2023-05-22T17:18:29Z) - Meta Learning for Natural Language Processing: A Survey [88.58260839196019]
ディープラーニングは自然言語処理(NLP)分野において主要な技術である。
ディープラーニングには多くのラベル付きデータが必要です。
メタ学習は、より良いアルゴリズムを学ぶためのアプローチを研究する機械学習の分野である。
論文 参考訳(メタデータ) (2022-05-03T13:58:38Z) - A Survey on Model Compression for Natural Language Processing [13.949219077548687]
Transformerは、エッジやモバイルコンピューティングを含む幅広いシナリオにNLPが入り込むのを防ぐ。
効率的なNLP研究は、NLPのライフサイクル全体に対する計算、時間、炭素排出量を包括的に検討することを目的としている。
論文 参考訳(メタデータ) (2022-02-15T00:18:47Z) - Ensuring the Inclusive Use of Natural Language Processing in the Global
Response to COVID-19 [58.720142291102135]
低リソース言語を網羅することで、現在のNLPアプローチと将来のNLPアプローチをより包括的に行う方法について議論する。
我々は,NLPの正の社会的影響を最大化することに関心のある研究者のために,いくつかの今後の方向性を提案する。
論文 参考訳(メタデータ) (2021-08-11T12:54:26Z) - Exploring Chemical Space using Natural Language Processing Methodologies
for Drug Discovery [0.5389800405902634]
テキストに基づく化学物質やタンパク質の表現は、ドメイン固有の知識を記述するために人間がコード化した非構造言語と考えることができる。
本総説では、これらの進歩が薬物発見に与える影響を概説し、薬理学者とコンピュータ科学者との対話をさらに進めることを目的とする。
論文 参考訳(メタデータ) (2020-02-10T21:02:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。