論文の概要: Unravelling the Architecture of Membrane Proteins with Conditional
Random Fields
- arxiv url: http://arxiv.org/abs/2008.02467v1
- Date: Thu, 6 Aug 2020 05:57:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-02 06:46:03.458135
- Title: Unravelling the Architecture of Membrane Proteins with Conditional
Random Fields
- Title(参考訳): 条件付ランダムフィールドによる膜タンパク質の構造解明
- Authors: Lior Lukov, Sanjay Chawla, Wei Liu, Brett Church, and Gaurav Pandey
- Abstract要約: 条件ランダム場 (CRF) は, 生物体に関するマイクロレベルの情報を数学的モデルに統合し, マクロレベルの振る舞いを理解するテンプレートを提供する。
ベンチマークデータセットと他の28の手法との比較では、CRFモデルが極めて正確な予測につながることが示されている。
- 参考スコア(独自算出の注目度): 11.321552104966326
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we will show that the recently introduced graphical model:
Conditional Random Fields (CRF) provides a template to integrate micro-level
information about biological entities into a mathematical model to understand
their macro-level behavior. More specifically, we will apply the CRF model to
an important classification problem in protein science, namely the secondary
structure prediction of proteins based on the observed primary structure. A
comparison on benchmark data sets against twenty-eight other methods shows that
not only does the CRF model lead to extremely accurate predictions but the
modular nature of the model and the freedom to integrate disparate, overlapping
and non-independent sources of information, makes the model an extremely
versatile tool to potentially solve many other problems in bioinformatics.
- Abstract(参考訳): 本稿では,最近導入されたグラフィカルモデルである条件ランダム場 (CRF) が,生物体に関するマイクロレベルの情報を数学的モデルに統合し,マクロレベルの振る舞いを理解するテンプレートを提供する。
具体的には、CRFモデルをタンパク質科学の重要な分類問題、すなわち観察された一次構造に基づくタンパク質の二次構造予測に適用する。
ベンチマークデータセットを28の他の方法と比較すると、crfモデルは極めて正確な予測につながるだけでなく、モデルのモジュラー性や、異種、重複、非独立な情報ソースを統合できる自由によって、バイオインフォマティクスの他の多くの問題を潜在的に解決できる非常に多用途なツールとなっている。
関連論文リスト
- SFM-Protein: Integrative Co-evolutionary Pre-training for Advanced Protein Sequence Representation [97.99658944212675]
タンパク質基盤モデルのための新しい事前学習戦略を導入する。
アミノ酸残基間の相互作用を強調し、短距離および長距離の共進化的特徴の抽出を強化する。
大規模タンパク質配列データセットを用いて学習し,より優れた一般化能力を示す。
論文 参考訳(メタデータ) (2024-10-31T15:22:03Z) - A Pipeline for Data-Driven Learning of Topological Features with Applications to Protein Stability Prediction [0.0]
生体分子データの解釈可能なトポロジ的特徴を学習するためのデータ駆動手法を提案する。
我々は、自動学習された構造的特徴を利用するモデルと、サブジェクト・マッター・エキスパート(SME)によって決定された大規模生物物理学的特徴に基づいて訓練されたモデルとを比較した。
本モデルでは,タンパク質構造のトポロジ的特徴のみに基づいて,SMEモデルの性能の92%~99%を平均精度スコアで達成した。
論文 参考訳(メタデータ) (2024-08-09T03:52:27Z) - Endowing Protein Language Models with Structural Knowledge [5.587293092389789]
本稿では,タンパク質構造データを統合することにより,タンパク質言語モデルを強化する新しいフレームワークを提案する。
PST(Protein Structure Transformer)と呼ばれる精製モデルは、小さなタンパク質構造データベース上でさらに事前訓練されている。
PSTは、タンパク質配列の最先端基盤モデルであるESM-2を一貫して上回り、タンパク質機能予測の新しいベンチマークを設定している。
論文 参考訳(メタデータ) (2024-01-26T12:47:54Z) - Navigating protein landscapes with a machine-learned transferable
coarse-grained model [29.252004942896875]
同様の予測性能を持つ粗粒度(CG)モデルは、長年にわたる課題である。
ケミカルトランスポータビリティを持つボトムアップCG力場を開発し,新しい配列の分子動力学に利用することができる。
本モデルでは, 折り畳み構造, 中間体, メタスタブル折り畳み型および折り畳み型流域, 内在的に不規則なタンパク質のゆらぎの予測に成功している。
論文 参考訳(メタデータ) (2023-10-27T17:10:23Z) - EigenFold: Generative Protein Structure Prediction with Diffusion Models [10.24107243529341]
EigenFoldは、特定のタンパク質配列から構造分布をサンプリングする拡散生成モデリングフレームワークである。
最近のCAMEOターゲットでは、EigenFoldは0.84の中央値TMSスコアを達成し、モデルの不確実性のより包括的な画像を提供する。
論文 参考訳(メタデータ) (2023-04-05T02:46:13Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Supervised Learning and Model Analysis with Compositional Data [4.082799056366927]
KernelBiomeはカーネルベースの非パラメトリック回帰分類フレームワークである。
我々は、最先端の機械学習手法と比較して、同等または改善された性能を示す。
論文 参考訳(メタデータ) (2022-05-15T12:33:43Z) - tFold-TR: Combining Deep Learning Enhanced Hybrid Potential Energy for
Template-Based Modelling Structure Refinement [53.98034511648985]
現在のテンプレートベースのモデリングアプローチは2つの重要な問題に苦しんでいる。
テンプレートの異なる領域からの距離対の精度は様々であり、この情報はモデリングにはあまり導入されていない。
2つのニューラルネットワークモデルは、欠落した領域の距離情報と、テンプレートモデリング構造における異なる領域の距離ペアの精度を予測する。
論文 参考訳(メタデータ) (2021-05-10T13:32:12Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Modeling Shared Responses in Neuroimaging Studies through MultiView ICA [94.31804763196116]
被験者の大規模なコホートを含むグループ研究は、脳機能組織に関する一般的な結論を引き出す上で重要である。
グループ研究のための新しい多視点独立成分分析モデルを提案し、各被験者のデータを共有独立音源と雑音の線形結合としてモデル化する。
まず、fMRIデータを用いて、被験者間の共通音源の同定における感度の向上を示す。
論文 参考訳(メタデータ) (2020-06-11T17:29:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。