論文の概要: PTransIPs: Identification of phosphorylation sites enhanced by protein
PLM embeddings
- arxiv url: http://arxiv.org/abs/2308.05115v3
- Date: Wed, 13 Mar 2024 05:02:32 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-14 18:57:21.959036
- Title: PTransIPs: Identification of phosphorylation sites enhanced by protein
PLM embeddings
- Title(参考訳): PTransIPs:タンパク質により増強されたリン酸化部位の同定
PLM埋め込み
- Authors: Ziyang Xu, Haitian Zhong, Bingrui He, Xueying Wang and Tianchi Lu
- Abstract要約: 我々は,リン酸化部位の同定のための新しいディープラーニングフレームワークであるPTransIPsを開発した。
PTransIPsは既存のSOTA法より優れており、AUCは0.9232と0.9660である。
- 参考スコア(独自算出の注目度): 2.971764950146918
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Phosphorylation is pivotal in numerous fundamental cellular processes and
plays a significant role in the onset and progression of various diseases. The
accurate identification of these phosphorylation sites is crucial for
unraveling the molecular mechanisms within cells and during viral infections,
potentially leading to the discovery of novel therapeutic targets. In this
study, we develop PTransIPs, a new deep learning framework for the
identification of phosphorylation sites. Independent testing results
demonstrate that PTransIPs outperforms existing state-of-the-art (SOTA)
methods, achieving AUCs of 0.9232 and 0.9660 for the identification of
phosphorylated S/T and Y sites, respectively. PTransIPs contributes from three
aspects. 1) PTransIPs is the first to apply protein pre-trained language model
(PLM) embeddings to this task. It utilizes ProtTrans and EMBER2 to extract
sequence and structure embeddings, respectively, as additional inputs into the
model, effectively addressing issues of dataset size and overfitting, thus
enhancing model performance; 2) PTransIPs is based on Transformer architecture,
optimized through the integration of convolutional neural networks and TIM loss
function, providing practical insights for model design and training; 3) The
encoding of amino acids in PTransIPs enables it to serve as a universal
framework for other peptide bioactivity tasks, with its excellent performance
shown in extended experiments of this paper. Our code, data and models are
publicly available at https://github.com/StatXzy7/PTransIPs.
- Abstract(参考訳): リン酸化は多くの基本的な細胞プロセスにおいて重要な役割を担い、様々な疾患の発症と進行に重要な役割を果たしている。
これらのリン酸化部位の正確な同定は、細胞内およびウイルス感染時の分子機構の解明に不可欠であり、新たな治療標的の発見につながる可能性がある。
本研究では,リン酸化部位の同定のための新しいディープラーニングフレームワークであるPTransIPsを開発する。
独立試験の結果、PTransIPsは既存のSOTA法よりも優れており、リン化S/T部位とY部位の同定にそれぞれ0.9232と0.9660のAUCを達成している。
PTransIPsは3つの側面から貢献する。
1) PTransIPsは, タンパク質事前学習言語モデル (PLM) を組み込んだ最初の試みである。
ProtTransとEMBER2を使用して、それぞれシーケンスと構造埋め込みを抽出し、モデルへの追加入力として、データセットサイズとオーバーフィットの問題に効果的に対処し、モデルパフォーマンスを向上させる。
2) PTransIPsは、畳み込みニューラルネットワークとTIM損失関数の統合により最適化されたTransformerアーキテクチャに基づいており、モデル設計とトレーニングの実践的な洞察を提供する。
3) PTransIPのアミノ酸のコード化により, 他のペプチド生物活性タスクの普遍的な枠組みとして機能し, 優れた性能を示す。
私たちのコード、データ、モデルはhttps://github.com/StatXzy7/PTransIPs.comで公開されています。
関連論文リスト
- SDR-Former: A Siamese Dual-Resolution Transformer for Liver Lesion
Classification Using 3D Multi-Phase Imaging [59.78761085714715]
本研究は肝病変分類のための新しいSDR-Formerフレームワークを提案する。
提案フレームワークは2つの臨床データセットに関する総合的な実験を通じて検証された。
科学コミュニティを支援するため,肝病変解析のための多段階MRデータセットを公開しています。
論文 参考訳(メタデータ) (2024-02-27T06:32:56Z) - xTrimoPGLM: Unified 100B-Scale Pre-trained Transformer for Deciphering
the Language of Protein [76.18058946124111]
本稿では,タンパク質の理解と生成を同時に行うために,統一されたタンパク質言語モデル xTrimoPGLM を提案する。
xTrimoPGLMは、4つのカテゴリにわたる18のタンパク質理解ベンチマークにおいて、他の高度なベースラインを著しく上回っている。
また、自然の原理に従ってデノボタンパク質配列を生成でき、微調整を監督した後にプログラム可能な生成を行うことができる。
論文 参考訳(メタデータ) (2024-01-11T15:03:17Z) - Learning to design protein-protein interactions with enhanced
generalization [15.429259676165913]
PPIRefは3Dタンパク質-タンパク質相互作用の最大かつ非冗長なデータセットである。
PPIRefデータセットをプレトレーニングPPIformerに利用し,多種多様なタンパク質結合変異体を対象とするSE(3)-同変モデルを提案する。
我々はPPIフォーマを微調整し,タンパク質とタンパク質の相互作用に対する変異の影響を予測する。
論文 参考訳(メタデータ) (2023-10-27T22:22:44Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - PIGNet2: A Versatile Deep Learning-based Protein-Ligand Interaction
Prediction Model for Binding Affinity Scoring and Virtual Screening [0.0]
タンパク質-リガンド相互作用の予測(PLI)は、薬物発見において重要な役割を果たす。
結合親和性を正確に評価し、効率的な仮想スクリーニングを行う汎用モデルの開発は依然として課題である。
本稿では、物理インフォームドグラフニューラルネットワークと組み合わせて、新しいデータ拡張戦略を導入することにより、実現可能なソリューションを提案する。
論文 参考訳(メタデータ) (2023-07-03T14:46:49Z) - Using Genetic Programming to Predict and Optimize Protein Function [65.25258357832584]
我々は,進化的手法に基づく遺伝的プログラミングツールPOETを提案し,方向性進化におけるスクリーニングと変異原性を高める。
概念実証として, 化学交換飽和移動機構によって検出されたMRIコントラストを生成するペプチドを用いる。
以上の結果から,POETのような計算モデリングツールは,従来よりも400%優れた機能性を持つペプチドを見つけるのに有効であることが示唆された。
論文 参考訳(メタデータ) (2022-02-08T18:08:08Z) - Multimodal Pre-Training Model for Sequence-based Prediction of
Protein-Protein Interaction [7.022012579173686]
タンパク質モデルによる効果的な表現の学習は、タンパク質とタンパク質の相互作用において重要である。
PPIの事前学習モデルのほとんどは配列ベースであり、自然言語処理で使用される言語モデルをアミノ酸配列に導入している。
本稿では, 配列, 構造, 機能という3つのモーダル性を持つマルチモーダルタンパク質事前学習モデルを提案する。
論文 参考訳(メタデータ) (2021-12-09T10:21:52Z) - Decoding the Protein-ligand Interactions Using Parallel Graph Neural
Networks [6.460973806588082]
PLI予測のための知識表現と推論を統合するための新しい並列グラフニューラルネットワーク(GNN)を提案する。
本手法は, 先行候補の行動, 有効性, 生物物理特性を予測するための, 解釈可能な, 説明可能な人工知能(AI)ツールとして機能する。
論文 参考訳(メタデータ) (2021-11-30T06:02:04Z) - A Brief Review of Machine Learning Techniques for Protein
Phosphorylation Sites Prediction [0.0]
可逆的翻訳後修飾 (Reversible Post-Translational Modifications, PTMs) は、タンパク質の機能的多様性を拡大する上で重要な役割を持つ。
PTMは、様々な細胞プロセスを制御するために利用される重要な分子制御機構として発生してきた。
この修飾の障害は、神経疾患やがんを含む複数の疾患によって引き起こされることがある。
論文 参考訳(メタデータ) (2021-08-10T22:23:30Z) - Confidence-guided Lesion Mask-based Simultaneous Synthesis of Anatomic
and Molecular MR Images in Patients with Post-treatment Malignant Gliomas [65.64363834322333]
信頼性ガイドSAMR(CG-SAMR)は、病変情報からマルチモーダル解剖学的配列にデータを合成する。
モジュールは中間結果に対する信頼度測定に基づいて合成をガイドする。
実際の臨床データを用いた実験により,提案モデルが最先端の合成法よりも優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2020-08-06T20:20:22Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。