論文の概要: Integrating Secondary Structures Information into Triangular Spatial Relationships (TSR) for Advanced Protein Classification
- arxiv url: http://arxiv.org/abs/2411.12853v1
- Date: Tue, 19 Nov 2024 20:50:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:11:46.729817
- Title: Integrating Secondary Structures Information into Triangular Spatial Relationships (TSR) for Advanced Protein Classification
- Title(参考訳): 高度タンパク質分類のための二次構造情報を三角空間関係(TSR)に統合する
- Authors: Poorya Khajouie, Titli Sarkar, Krishna Rauniyar, Li Chen, Wu Xu, Vijay Raghavan,
- Abstract要約: 二次構造要素(SSE)は三角空間関係(TSR)に基づくタンパク質表現に統合される。
以上の結果から,SSEはタンパク質分類の精度と信頼性を様々な程度に向上させることが明らかとなった。
- 参考スコア(独自算出の注目度): 5.70148168762687
- License:
- Abstract: Protein structures represent the key to deciphering biological functions. The more detailed form of similarity among these proteins is sometimes overlooked by the conventional structural comparison methods. In contrast, further advanced methods, such as Triangular Spatial Relationship (TSR), have been demonstrated to make finer differentiations. Still, the classical implementation of TSR does not provide for the integration of secondary structure information, which is important for a more detailed understanding of the folding pattern of a protein. To overcome these limitations, we developed the SSE-TSR approach. The proposed method integrates secondary structure elements (SSEs) into TSR-based protein representations. This allows an enriched representation of protein structures by considering 18 different combinations of helix, strand, and coil arrangements. Our results show that using SSEs improves the accuracy and reliability of protein classification to varying degrees. We worked with two large protein datasets of 9.2K and 7.8K samples, respectively. We applied the SSE-TSR approach and used a neural network model for classification. Interestingly, introducing SSEs improved performance statistics for Dataset 1, with accuracy moving from 96.0% to 98.3%. For Dataset 2, where the performance statistics were already good, further small improvements were found with the introduction of SSE, giving an accuracy of 99.5% compared to 99.4%. These results show that SSE integration can dramatically improve TSR key discrimination, with significant benefits in datasets with low initial accuracies and only incremental gains in those with high baseline performance. Thus, SSE-TSR is a powerful bioinformatics tool that improves protein classification and understanding of protein function and interaction.
- Abstract(参考訳): タンパク質構造は生物学的機能の解読の鍵である。
これらのタンパク質間のより詳細な類似性は、しばしば従来の構造比較法によって見過ごされる。
対照的に、三角空間関係 (TSR) のようなより高度な手法は、より微細な微分を可能にすることが示されている。
しかし、TSRの古典的な実装は二次構造情報の統合を提供しておらず、タンパク質の折りたたみパターンをより詳細に理解するために重要である。
これらの制限を克服するため、我々はSSE-TSRアプローチを開発した。
提案手法は、二次構造要素(SSE)をTSRに基づくタンパク質表現に統合する。
これにより、ヘリックス、ストランド、コイル配列の18の異なる組み合わせを考慮し、タンパク質構造を豊かに表現することができる。
以上の結果から,SSEはタンパク質分類の精度と信頼性を様々な程度に向上させることが明らかとなった。
我々は、それぞれ9.2Kと7.8Kの2つの大きなタンパク質データセットで研究した。
SSE-TSR法を適用し,ニューラルネットワークモデルを用いて分類を行った。
興味深いことに、SSEの導入はデータセット1のパフォーマンス統計を96.0%から98.3%に改善した。
パフォーマンス統計がすでに良好であったDataset 2では、SSEの導入によってさらに小さな改善が見られ、99.4%と比較して99.5%の精度が得られた。
これらの結果から,SSE統合はTSRキーの識別を劇的に改善する可能性が示唆された。
したがって、SSE-TSRはタンパク質の分類とタンパク質の機能と相互作用の理解を改善する強力なバイオインフォマティクスツールである。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - Comparative Analysis and Ensemble Enhancement of Leading CNN Architectures for Breast Cancer Classification [0.0]
本研究は,病理組織像を用いた乳癌分類への新規かつ正確なアプローチを提案する。
さまざまな画像データセット間で、主要な畳み込みニューラルネットワーク(CNN)モデルを体系的に比較する。
そこで本研究では,スタンドアロンCNNモデルにおいて,例外的分類精度を実現するために必要な設定について検討した。
論文 参考訳(メタデータ) (2024-10-04T11:31:43Z) - Dumpling GNN: Hybrid GNN Enables Better ADC Payload Activity Prediction Based on Chemical Structure [53.76752789814785]
DumplingGNNは、化学構造に基づいてADCペイロードのアクティビティを予測するために特別に設計された、ハイブリッドなグラフニューラルネットワークアーキテクチャである。
DNAトポイソメラーゼIインヒビターに着目した包括的ADCペイロードデータセットで評価を行った。
特別なADCペイロードデータセットに対して、例外的な精度(91.48%)、感度95.08%)、特異性(97.54%)を示す。
論文 参考訳(メタデータ) (2024-09-23T17:11:04Z) - NaNa and MiGu: Semantic Data Augmentation Techniques to Enhance Protein Classification in Graph Neural Networks [60.48306899271866]
本稿では,背骨化学および側鎖生物物理情報をタンパク質分類タスクに組み込む新しい意味データ拡張手法を提案する。
具体的には, 分子生物学的, 二次構造, 化学結合, およびタンパク質のイオン特性を活用し, 分類作業を容易にする。
論文 参考訳(メタデータ) (2024-03-21T13:27:57Z) - Neural Embeddings for Protein Graphs [0.8258451067861933]
幾何学ベクトル空間にタンパク質グラフを埋め込む新しい枠組みを提案する。
タンパク質グラフ間の構造的距離を保存するエンコーダ関数を学習する。
本フレームワークは,タンパク質構造分類の課題において,顕著な結果をもたらす。
論文 参考訳(メタデータ) (2023-06-07T14:50:34Z) - Structure-informed Language Models Are Protein Designers [69.70134899296912]
配列ベースタンパク質言語モデル(pLM)の汎用的手法であるLM-Designを提案する。
pLMに軽量な構造アダプターを埋め込んだ構造手術を行い,構造意識を付加した構造手術を行った。
実験の結果,我々の手法は最先端の手法よりも大きなマージンで優れていることがわかった。
論文 参考訳(メタデータ) (2023-02-03T10:49:52Z) - S$^3$R: Self-supervised Spectral Regression for Hyperspectral
Histopathology Image Classification [13.388372624497807]
本稿では,高スペクトル画像(HSI)のスペクトル領域における低階特性を利用した,効率的かつ効果的な自己監督型スペクトル回帰法(S$3$R)を提案する。
2つのプレテキストタスクを設計する:(1)S$3$R-CRは線形係数を回帰し、事前学習されたモデルがHSIの固有構造と異なる形態の病理特性を理解するようにし、(2)S$3$R-BRは欠落したバンドを回帰し、HSIの全体論的意味学を学ぶモデルを作る。
論文 参考訳(メタデータ) (2022-09-19T05:47:11Z) - Open-Set Recognition: A Good Closed-Set Classifier is All You Need [146.6814176602689]
分類器が「ゼロ・オブ・ア・ア・ア・ベ」決定を行う能力は、閉集合クラスにおける精度と高い相関関係があることが示される。
この相関を利用して、閉セット精度を向上させることにより、クロスエントロピーOSR'ベースライン'の性能を向上させる。
また、セマンティックノベルティを検出するタスクをより尊重する新しいベンチマークを構築した。
論文 参考訳(メタデータ) (2021-10-12T17:58:59Z) - PersGNN: Applying Topological Data Analysis and Geometric Deep Learning
to Structure-Based Protein Function Prediction [0.07340017786387766]
本研究では,タンパク質構造を分離し,タンパク質データバンク内のタンパク質の機能的アノテーションを作成する。
本稿では,グラフ表現学習とトポロジカルデータ解析を組み合わせた,エンドツーエンドのトレーニング可能なディープラーニングモデルPersGNNを提案する。
論文 参考訳(メタデータ) (2020-10-30T02:24:35Z) - PS8-Net: A Deep Convolutional Neural Network to Predict the Eight-State
Protein Secondary Structure [0.5161531917413706]
我々は,8クラスタンパク質二次構造予測の精度を高めるために,新しいディープ畳み込みニューラルネットワーク(DCNN)(PS8-Net)を提案する。
提案したPS8-Netは、ベンチマークのCullPdb6133、CB513、CASP10、CASP11データセットでそれぞれ76.89%、71.94%、76.86%、75.26%の精度を達成した。
論文 参考訳(メタデータ) (2020-09-22T08:19:10Z) - Device-Robust Acoustic Scene Classification Based on Two-Stage
Categorization and Data Augmentation [63.98724740606457]
我々は,GT,USTC,Tencent,UKEの4つのグループからなる共同で,DCASE 2020 Challengeの第1タスク - 音響シーン分類(ASC)に取り組む。
タスク1aは、複数の(実とシミュレートされた)デバイスで記録されたオーディオ信号のASCを10種類の微細なクラスにフォーカスする。
Task 1bは、低複雑さのソリューションを使用して、データを3つの上位クラスに分類することに関心がある。
論文 参考訳(メタデータ) (2020-07-16T15:07:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。