論文の概要: Bridging the Gaps in Statistical Models of Protein Alignment
- arxiv url: http://arxiv.org/abs/2010.00855v1
- Date: Fri, 2 Oct 2020 08:36:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-12 01:15:52.162046
- Title: Bridging the Gaps in Statistical Models of Protein Alignment
- Title(参考訳): タンパク質アライメントの統計モデルにおけるギャップの橋渡し
- Authors: Dinithi Sumanaweera, Lloyd Allison and Arun S. Konagurthu
- Abstract要約: この研究は、一対の整列したタンパク質の進化を定量化する完全な統計モデルを構築する方法を示す。
そのようなモデルの全てのパラメータは、整列したタンパク質配列の任意のベンチマークデータセットから推測することができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This work demonstrates how a complete statistical model quantifying the
evolution of pairs of aligned proteins can be constructed from a
time-parameterised substitution matrix and a time-parameterised 3-state
alignment machine. All parameters of such a model can be inferred from any
benchmark data-set of aligned protein sequences. This allows us to examine nine
well-known substitution matrices on six benchmarks curated using various
structural alignment methods; any matrix that does not explicitly model a
"time"-dependent Markov process is converted to a corresponding base-matrix
that does. In addition, a new optimal matrix is inferred for each of the six
benchmarks. Using Minimum Message Length (MML) inference, all 15 matrices are
compared in terms of measuring the Shannon information content of each
benchmark. This has resulted in a new and clear overall best performed
time-dependent Markov matrix, MMLSUM, and its associated 3-state machine, whose
properties we have analysed in this work. For standard use, the MMLSUM series
of (log-odds) \textit{scoring} matrices derived from the above Markov matrix,
are available at https://lcb.infotech.monash.edu.au/mmlsum.
- Abstract(参考訳): 本研究は、時間パラメータ置換行列と時間パラメータ3状態アライメントマシンから、アライメントタンパク質の対の進化を定量化する完全な統計モデルを構築する方法を示す。
そのようなモデルの全てのパラメータは、整列したタンパク質配列のベンチマークデータセットから推測することができる。
これにより、6つのベンチマークで9つのよく知られた置換行列を、様々な構造的アライメント法を用いてキュレートし、"時間"に依存しないマルコフ過程を明示的にモデル化しない行列は対応するベース行列に変換される。
さらに、6つのベンチマークそれぞれに対して、新しい最適行列が推論される。
最小メッセージ長(MML)推定を用いて、各ベンチマークのシャノン情報量を測定することで、15の行列を比較する。
この結果、時間依存のマルコフ行列であるmmlsumとその関連する3状態機械が新たに開発され、その特性が本研究で解析された。
標準的な用途では、上記のマルコフ行列から派生した (log-odds) \textit{scoring} 行列のMMLSUMシリーズがhttps://lcb.infotech.monash.edu.au/mmlsumで入手できる。
関連論文リスト
- Support matrix machine: A review [0.0]
サポートマトリックスマシン(SMM)は、行列入力データを扱うのに適した新しい手法の1つである。
本稿では,SMM モデルの開発について,より詳細な分析を行う。
我々は、ロバスト、スパース、クラス不均衡、マルチクラス分類モデルなど、多くのSMM変種について論じる。
論文 参考訳(メタデータ) (2023-10-30T16:46:23Z) - Clustering Three-Way Data with Outliers [1.0435741631709405]
行列変量正規データを異常値でクラスタリングする手法について論じる。
このアプローチは、サブセットのログライクな分布を使い、OCLUSTアルゴリズムを拡張し、反復的なアプローチを使ってアウトレイラを検出しトリムする。
論文 参考訳(メタデータ) (2023-10-08T21:27:29Z) - Structure-Preserving Transformers for Sequences of SPD Matrices [6.404789669795639]
トランスフォーマーをベースとした自動アテンション機構は、様々なコンテキスト依存データ型の分析に成功している。
本稿では,対称正定値行列の列を分類する機構を提案する。
本手法は,脳波由来の共分散行列を標準データセットからタイムリーに自動睡眠ステージングに応用し,ステージワイドのパフォーマンスを高いレベルに向上させる。
論文 参考訳(メタデータ) (2023-09-14T10:23:43Z) - Quick Adaptive Ternary Segmentation: An Efficient Decoding Procedure For
Hidden Markov Models [70.26374282390401]
ノイズの多い観測から元の信号(すなわち隠れ鎖)を復号することは、ほぼすべてのHMMに基づくデータ分析の主要な目標の1つである。
本稿では,多対数計算複雑性において隠れた列を復号化するための分法であるQuick Adaptive Ternary(QATS)を提案する。
論文 参考訳(メタデータ) (2023-05-29T19:37:48Z) - Sublinear Time Approximation of Text Similarity Matrices [50.73398637380375]
一般的なNystr"om法を不確定な設定に一般化する。
我々のアルゴリズムは任意の類似性行列に適用でき、行列のサイズでサブ線形時間で実行される。
本手法は,CUR分解の単純な変種とともに,様々な類似性行列の近似において非常によく機能することを示す。
論文 参考訳(メタデータ) (2021-12-17T17:04:34Z) - Test Set Sizing Via Random Matrix Theory [91.3755431537592]
本稿ではランダム行列理論の手法を用いて、単純な線形回帰に対して理想的なトレーニング-テストデータ分割を求める。
それは「理想」を整合性計量を満たすものとして定義し、すなわち経験的モデル誤差は実際の測定ノイズである。
本論文は,任意のモデルのトレーニングとテストサイズを,真に最適な方法で解決した最初の論文である。
論文 参考訳(メタデータ) (2021-12-11T13:18:33Z) - Optimal N-ary ECOC Matrices for Ensemble Classification [1.3561997774592662]
アンサンブル分類法における誤り訂正出力符号(ECOC)の新たな構成について述べる。
任意の素数$N$が与えられたとき、この決定論的構成は基底-$N$対称二乗行列を$M$で生成する。
論文 参考訳(メタデータ) (2021-10-05T16:50:15Z) - Linear-Sample Learning of Low-Rank Distributions [56.59844655107251]
ktimes k$, rank-r$, matrices to normalized $L_1$ distance requires $Omega(frackrepsilon2)$ sample。
我々は、$cal O(frackrepsilon2log2fracepsilon)$ sample, a number linear in the high dimension, and almost linear in the matrices, usually low, rank proofs.というアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-09-30T19:10:32Z) - Information-Theoretic Limits for the Matrix Tensor Product [8.206394018475708]
本稿では,ランダム行列の行列テンソル積を含む高次元推論問題について検討する。
本稿では,高次元行列保存信号の解析のための新しい手法を紹介する。
論文 参考訳(メタデータ) (2020-05-22T17:03:48Z) - Multi-Objective Matrix Normalization for Fine-grained Visual Recognition [153.49014114484424]
双線形プールは細粒度視覚認識(FGVC)において大きな成功を収める
近年,行列パワー正規化は双線形特徴量において2次情報を安定化させることができることが示されている。
両線形表現を同時に正規化できる効率的な多目的行列正規化法(MOMN)を提案する。
論文 参考訳(メタデータ) (2020-03-30T08:40:35Z) - Supervised Quantile Normalization for Low-rank Matrix Approximation [50.445371939523305]
我々は、$X$ の値と $UV$ の値を行ワイズで操作できる量子正規化演算子のパラメータを学習し、$X$ の低ランク表現の質を改善する。
本稿では,これらの手法が合成およびゲノムデータセットに適用可能であることを実証する。
論文 参考訳(メタデータ) (2020-02-08T21:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。