論文の概要: End-to-End Optimized Pipeline for Prediction of Protein Folding Kinetics
- arxiv url: http://arxiv.org/abs/2309.09191v1
- Date: Sun, 17 Sep 2023 07:35:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-19 17:04:20.643814
- Title: End-to-End Optimized Pipeline for Prediction of Protein Folding Kinetics
- Title(参考訳): タンパク質成形速度予測のためのエンドツーエンド最適化パイプライン
- Authors: Vijay Arvind.R and Haribharathi Sivakumar and Brindha.R
- Abstract要約: 本研究では,タンパク質の折り畳み速度を高精度かつ低メモリフットプリントで予測する効率的なパイプラインを提案する。
デプロイされた機械学習(ML)モデルは、最先端のMLモデルよりも精度が4.8%向上し、327倍のメモリを消費し、7.3%高速になった。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Protein folding is the intricate process by which a linear sequence of amino
acids self-assembles into a unique three-dimensional structure. Protein folding
kinetics is the study of pathways and time-dependent mechanisms a protein
undergoes when it folds. Understanding protein kinetics is essential as a
protein needs to fold correctly for it to perform its biological functions
optimally, and a misfolded protein can sometimes be contorted into shapes that
are not ideal for a cellular environment giving rise to many degenerative,
neuro-degenerative disorders and amyloid diseases. Monitoring at-risk
individuals and detecting protein discrepancies in a protein's folding kinetics
at the early stages could majorly result in public health benefits, as
preventive measures can be taken. This research proposes an efficient pipeline
for predicting protein folding kinetics with high accuracy and low memory
footprint. The deployed machine learning (ML) model outperformed the
state-of-the-art ML models by 4.8% in terms of accuracy while consuming 327x
lesser memory and being 7.3% faster.
- Abstract(参考訳): タンパク質の折り畳みは、アミノ酸の線形配列が独自の3次元構造に自己組織化する複雑な過程である。
タンパク質の折り畳み運動学は、タンパク質が折り畳むときに起こる経路と時間依存機構の研究である。
タンパク質の動態を理解することは、その生物学的機能を実行するために正しく折りたたむ必要があるため、しばしば細胞環境に理想的でない形に縮めることができ、多くの変性神経変性疾患やアミロイド病を引き起こす。
リスクの高い個体をモニタリングし、タンパク質の折りたたみ運動におけるタンパク質の異常を早期に検出することは、予防措置がとれるように、公衆の健康上の利益に繋がる可能性がある。
本研究では,タンパク質の折り畳み速度を高精度かつ低いメモリフットプリントで予測する効率的なパイプラインを提案する。
デプロイされた機械学習(ML)モデルは、最先端のMLモデルよりも精度が4.8%向上し、327倍のメモリを消費し、7.3%高速になった。
関連論文リスト
- Long-context Protein Language Model [76.95505296417866]
言語モデル(LM)の自己教師による訓練は、有意義な表現の学習や創薬設計において、タンパク質配列に大きな成功を収めている。
ほとんどのタンパク質LMは、短い文脈長を持つ個々のタンパク質に基づいて訓練されたトランスフォーマーアーキテクチャに基づいている。
そこで我々は,選択的構造化状態空間モデルから構築した代替のタンパク質LMアーキテクチャであるBiMamba-Sに基づくLC-PLMを提案する。
また、第2段階のトレーニングのために、タンパク質-タンパク質相互作用グラフの文脈化を行うLC-PLM-Gも導入した。
論文 参考訳(メタデータ) (2024-10-29T16:43:28Z) - Geometric Self-Supervised Pretraining on 3D Protein Structures using Subgraphs [26.727436310732692]
本稿では,3次元タンパク質構造上の3次元グラフニューラルネットワークを事前学習するための自己教師型手法を提案する。
提案手法が6%までの大幅な改善につながることを実験的に示す。
論文 参考訳(メタデータ) (2024-06-20T09:34:31Z) - ProLLM: Protein Chain-of-Thoughts Enhanced LLM for Protein-Protein Interaction Prediction [54.132290875513405]
タンパク質-タンパク質相互作用(PPI)の予測は、生物学的機能や疾患を理解する上で重要である。
PPI予測に対する従来の機械学習アプローチは、主に直接的な物理的相互作用に焦点を当てていた。
PPIに適したLLMを用いた新しいフレームワークProLLMを提案する。
論文 参考訳(メタデータ) (2024-03-30T05:32:42Z) - Protein Conformation Generation via Force-Guided SE(3) Diffusion Models [48.48934625235448]
新しいタンパク質コンホメーションを生成するために、深層生成モデリング技術が用いられている。
本稿では,タンパク質コンフォメーション生成のための力誘導SE(3)拡散モデルConfDiffを提案する。
論文 参考訳(メタデータ) (2024-03-21T02:44:08Z) - Efficiently Predicting Mutational Effect on Homologous Proteins by Evolution Encoding [7.067145619709089]
EvolMPNNは進化を意識したタンパク質の埋め込みを学習するための効率的なモデルである。
我々のモデルは最先端の手法よりも最大6.4%向上し,36倍の高速化を実現している。
論文 参考訳(メタデータ) (2024-02-20T23:06:21Z) - An approach to solve the coarse-grained Protein folding problem in a
Quantum Computer [0.0]
タンパク質の構造や酵素を理解することは、標的とした医薬品の設計、タンパク質関連疾患のメカニズムの解明、新規酵素の革新において重要な役割を担っている。
AIに基づくタンパク質構造予測手法の最近の進歩により、タンパク質の折り畳み問題はある程度解決されているが、配列の類似度が低いタンパク質の構造を決定する精度は限られている。
本研究では,より小さなタンパク質配列の構造を予測するために,ゲートベースの量子コンピュータ上で動作可能なターンベース符号化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2023-11-23T18:20:05Z) - Multi-level Protein Representation Learning for Blind Mutational Effect
Prediction [5.207307163958806]
本稿では,タンパク質構造解析のためのシーケンシャルおよび幾何学的アナライザをカスケードする,新しい事前学習フレームワークを提案する。
野生型タンパク質の自然選択をシミュレートすることにより、所望の形質に対する突然変異方向を誘導する。
提案手法は,多種多様な効果予測タスクに対して,パブリックデータベースと2つの新しいデータベースを用いて評価する。
論文 参考訳(メタデータ) (2023-06-08T03:00:50Z) - A Latent Diffusion Model for Protein Structure Generation [50.74232632854264]
本稿では,タンパク質モデリングの複雑さを低減できる潜在拡散モデルを提案する。
提案手法は, 高い設計性と効率性を有する新規なタンパク質のバックボーン構造を効果的に生成できることを示す。
論文 参考訳(メタデータ) (2023-05-06T19:10:19Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - Learning Geometrically Disentangled Representations of Protein Folding
Simulations [72.03095377508856]
この研究は、薬物標的タンパク質の構造的アンサンブルに基づいて生成ニューラルネットワークを学習することに焦点を当てている。
モデル課題は、様々な薬物分子に結合したタンパク質の構造的変動を特徴付けることである。
その結果,我々の幾何学的学習に基づく手法は,複雑な構造変化を生成するための精度と効率の両方を享受できることがわかった。
論文 参考訳(メタデータ) (2022-05-20T19:38:00Z) - Leveraging Sequence Embedding and Convolutional Neural Network for
Protein Function Prediction [27.212743275697825]
タンパク質機能予測の主な課題は、大きなラベル空間とラベル付きトレーニングデータの欠如である。
これらの課題を克服するために、教師なしシーケンス埋め込みと深部畳み込みニューラルネットワークの成功を活用する。
論文 参考訳(メタデータ) (2021-12-01T08:31:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。