論文の概要: GLProtein: Global-and-Local Structure Aware Protein Representation Learning
- arxiv url: http://arxiv.org/abs/2506.06294v1
- Date: Sat, 17 May 2025 14:45:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-16 03:13:19.0286
- Title: GLProtein: Global-and-Local Structure Aware Protein Representation Learning
- Title(参考訳): GLProtein:タンパク質表現学習を意識したグローバル・ローカル構造
- Authors: Yunqing Liu, Wenqi Fan, Xiaoyong Wei, Qing Li,
- Abstract要約: タンパク質の構造情報は3D情報に限らず、アミノ酸分子(局所情報)からタンパク質-タンパク質構造類似性(グローバル情報)までも含んでいると論じる。
我々は,タンパク質事前学習における最初のフレームワークである textbfGLProtein を提案する。
- 参考スコア(独自算出の注目度): 22.154564355158914
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Proteins are central to biological systems, participating as building blocks across all forms of life. Despite advancements in understanding protein functions through protein sequence analysis, there remains potential for further exploration in integrating protein structural information. We argue that the structural information of proteins is not only limited to their 3D information but also encompasses information from amino acid molecules (local information) to protein-protein structure similarity (global information). To address this, we propose \textbf{GLProtein}, the first framework in protein pre-training that incorporates both global structural similarity and local amino acid details to enhance prediction accuracy and functional insights. GLProtein innovatively combines protein-masked modelling with triplet structure similarity scoring, protein 3D distance encoding and substructure-based amino acid molecule encoding. Experimental results demonstrate that GLProtein outperforms previous methods in several bioinformatics tasks, including predicting protein-protein interaction, contact prediction, and so on.
- Abstract(参考訳): タンパク質は生物学的システムの中心であり、あらゆる種類の生命の構成要素として関与する。
タンパク質配列解析によるタンパク質の機能理解の進歩にもかかわらず、タンパク質構造情報の統合のさらなる研究の可能性は残されている。
タンパク質の構造情報は3D情報だけでなく、アミノ酸分子(局所情報)からタンパク質-タンパク質構造類似性(グローバル情報)までも含んでいると論じる。
そこで本研究では,グローバルな構造的類似性と局所アミノ酸詳細の両方を組み込んだタンパク質事前学習のための最初のフレームワークであるtextbf{GLProtein}を提案する。
GLProteinは革新的に3重構造類似性スコア、タンパク質3D距離エンコーディング、サブ構造に基づくアミノ酸分子エンコーディングとタンパク質マズケモデルを組み合わせる。
実験の結果, GLProteinはタンパク質-タンパク質相互作用の予測, 接触予測などのバイオインフォマティクスタスクにおいて, 従来の手法よりも優れていたことが確認された。
関連論文リスト
- A Survey of Deep Learning Methods in Protein Bioinformatics and its Impact on Protein Design [3.5897534810405403]
ディープラーニングはコンピュータビジョンや自然言語処理などの分野において顕著な性能を示している。
近年、タンパク質配列のデータ豊富な領域に応用され、大きな成功を収めている。
ディープラーニングによって達成された性能改善は、タンパク質バイオインフォマティクスの分野での新たな可能性を開く。
論文 参考訳(メタデータ) (2025-01-02T05:21:34Z) - Geometric Self-Supervised Pretraining on 3D Protein Structures using Subgraphs [26.727436310732692]
本稿では,3次元タンパク質構造上の3次元グラフニューラルネットワークを事前学習するための自己教師型手法を提案する。
提案手法が6%までの大幅な改善につながることを実験的に示す。
論文 参考訳(メタデータ) (2024-06-20T09:34:31Z) - ProtT3: Protein-to-Text Generation for Text-based Protein Understanding [88.43323947543996]
言語モデル(LM)は、タンパク質のテキスト記述を理解するのに優れている。
タンパク質言語モデル(PLM)は、タンパク質データを理解し、高品質な表現に変換するが、テキストを処理するのに苦労する。
ProtT3は、テキストベースのタンパク質理解のための、タンパク質からテキストへの生成のためのフレームワークである。
論文 参考訳(メタデータ) (2024-05-21T08:06:13Z) - A Protein Structure Prediction Approach Leveraging Transformer and CNN
Integration [4.909112037834705]
本稿では、畳み込みニューラルネットワーク(CCN)を用いた2次元融合深層ニューラルネットワークモデルDstruCCNと、単一配列タンパク質構造予測のための教師付きトランスフォーマー言語モデルを採用する。
両者のトレーニング特徴を組み合わせ、タンパク質トランスフォーマー結合部位マトリックスを予測し、エネルギー最小化を用いて三次元構造を再構築する。
論文 参考訳(メタデータ) (2024-02-29T12:24:20Z) - A Text-guided Protein Design Framework [106.79061950107922]
本稿では,タンパク質設計のためのテキスト記述を利用するマルチモーダルフレームワークであるProteinDTを提案する。
タンパク質DTは以下の3つのステップから構成される:2つのモダリティの表現を整列するProteinCLAP、テキストモダリティからタンパク質表現を生成するファシリテーター、表現からタンパク質配列を生成するデコーダ。
本研究では,(1)テキスト誘導タンパク質生成における90%以上の精度,(2)ゼロショットテキスト誘導タンパク質編集タスクにおけるベストヒット率,(3)タンパク質特性予測ベンチマーク6項目中4項目における優れた性能の3つの課題に対するProteinDTの有効性を定量的に検証した。
論文 参考訳(メタデータ) (2023-02-09T12:59:16Z) - BERTology Meets Biology: Interpreting Attention in Protein Language
Models [124.8966298974842]
注目レンズを用いたタンパク質トランスフォーマーモデルの解析方法を示す。
注意はタンパク質の折りたたみ構造を捉え、基礎となる配列では遠く離れているが、三次元構造では空間的に近接しているアミノ酸を接続する。
また、注意とタンパク質構造との相互作用を三次元的に可視化する。
論文 参考訳(メタデータ) (2020-06-26T21:50:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。