論文の概要: An Investigation in Optimal Encoding of Protein Primary Sequence for
Structure Prediction by Artificial Neural Networks
- arxiv url: http://arxiv.org/abs/2008.00539v1
- Date: Sun, 2 Aug 2020 18:57:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 19:20:26.188745
- Title: An Investigation in Optimal Encoding of Protein Primary Sequence for
Structure Prediction by Artificial Neural Networks
- Title(参考訳): ニューラルネットワークによる構造予測のためのタンパク質一次配列の最適符号化の検討
- Authors: Aaron Hein, Casey Cole, Homayoun Valafar
- Abstract要約: 機械学習とニューラルネットワークの利用は、ここ数年で急激に増加している。
タンパク質構造予測は、ニューラルネットワークがますます普及し、成功している分野のひとつだ。
- 参考スコア(独自算出の注目度): 0.2578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning and the use of neural networks has increased precipitously
over the past few years primarily due to the ever-increasing accessibility to
data and the growth of computation power. It has become increasingly easy to
harness the power of machine learning for predictive tasks. Protein structure
prediction is one area where neural networks are becoming increasingly popular
and successful. Although very powerful, the use of ANN require selection of
most appropriate input/output encoding, architecture, and class to produce the
optimal results. In this investigation we have explored and evaluated the
effect of several conventional and newly proposed input encodings and selected
an optimal architecture. We considered 11 variations of input encoding, 11
alternative window sizes, and 7 different architectures. In total, we evaluated
2,541 permutations in application to the training and testing of more than
10,000 protein structures over the course of 3 months. Our investigations
concluded that one-hot encoding, the use of LSTMs, and window sizes of 9, 11,
and 15 produce the optimal outcome. Through this optimization, we were able to
improve the quality of protein structure prediction by predicting the {\phi}
dihedrals to within 14{\deg} - 16{\deg} and {\psi} dihedrals to within
23{\deg}- 25{\deg}. This is a notable improvement compared to previously
similar investigations.
- Abstract(参考訳): 機械学習とニューラルネットワークの利用は、主にデータへのアクセシビリティの増大と計算能力の増大により、ここ数年で急激に増加している。
予測タスクに機械学習の力を利用するのはますます簡単になっています。
タンパク質構造予測は、ニューラルネットワークがますます普及し、成功している分野のひとつだ。
ANNは非常に強力だが、最適な結果を得るためには、最も適切な入出力符号化、アーキテクチャ、クラスを選択する必要がある。
本研究では,従来型および新たに提案してきた入力エンコーディングの効果を検証・評価し,最適なアーキテクチャを選定した。
11種類の入力エンコーディング,11種類の代替ウィンドウサイズ,7種類のアーキテクチャを検討した。
3ヶ月で1万以上のタンパク質構造を訓練し, 試験するために, 合計で2,541種類の置換を行った。
調査の結果,1ホット符号化,LSTMの使用,ウィンドウサイズ9,11,15が最適であることがわかった。
この最適化により, 14{\deg} - 16{\deg} および {\psi} dihedral を 23{\deg}-25{\deg} に予測することにより, タンパク質構造予測の質を向上させることができた。
これは以前と類似した調査に比べて顕著な改善である。
関連論文リスト
- A Stable, Fast, and Fully Automatic Learning Algorithm for Predictive
Coding Networks [65.34977803841007]
予測符号化ネットワークは、ベイズ統計学と神経科学の両方にルーツを持つ神経科学にインスパイアされたモデルである。
シナプス重みに対する更新規則の時間的スケジュールを変更するだけで、元の規則よりもずっと効率的で安定したアルゴリズムが得られることを示す。
論文 参考訳(メタデータ) (2022-11-16T00:11:04Z) - Improving RNA Secondary Structure Design using Deep Reinforcement
Learning [69.63971634605797]
本稿では,RNA配列設計に強化学習を適用した新しいベンチマークを提案する。このベンチマークでは,目的関数を配列の二次構造における自由エネルギーとして定義する。
本稿では,これらのアルゴリズムに対して行うアブレーション解析の結果と,バッチ間でのアルゴリズムの性能を示すグラフを示す。
論文 参考訳(メタデータ) (2021-11-05T02:54:06Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - On the performance of deep learning for numerical optimization: an
application to protein structure prediction [0.0]
本稿では,グローバルな最適化問題に対処するディープラーニングモデルの性能について述べる。
提案手法は、効率的なニューラルネットワークを生成するために、NAS(Neural Architecture Search)の概念を採用する。
実験により、手書きのアルゴリズムと比較して、生成された学習モデルが競合する結果が得られることが明らかになった。
論文 参考訳(メタデータ) (2020-12-17T17:01:30Z) - Genetic-algorithm-optimized neural networks for gravitational wave
classification [0.0]
遺伝的アルゴリズム(GA)に基づくハイパーパラメータ最適化の新しい手法を提案する。
我々は,初期パラメータのシード値が良い解には程遠い場合に,GAが高品質なアーキテクチャを発見できることを示す。
遺伝的アルゴリズムの最適化を用いて既存のネットワークを洗練することは、問題コンテキストが変化した場合に特に有用である。
論文 参考訳(メタデータ) (2020-10-09T03:14:20Z) - PS8-Net: A Deep Convolutional Neural Network to Predict the Eight-State
Protein Secondary Structure [0.5161531917413706]
我々は,8クラスタンパク質二次構造予測の精度を高めるために,新しいディープ畳み込みニューラルネットワーク(DCNN)(PS8-Net)を提案する。
提案したPS8-Netは、ベンチマークのCullPdb6133、CB513、CASP10、CASP11データセットでそれぞれ76.89%、71.94%、76.86%、75.26%の精度を達成した。
論文 参考訳(メタデータ) (2020-09-22T08:19:10Z) - Accuracy Prediction with Non-neural Model for Neural Architecture Search [185.0651567642238]
精度予測に非神経モデルを用いる別の手法について検討する。
我々は、ニューラルネットワーク探索(NAS)の予測因子として、勾配向上決定木(GBDT)を活用する。
NASBench-101とImageNetの実験は、NASの予測器としてGBDTを使用することの有効性を示した。
論文 参考訳(メタデータ) (2020-07-09T13:28:49Z) - FBNetV3: Joint Architecture-Recipe Search using Predictor Pretraining [65.39532971991778]
サンプル選択とランキングの両方を導くことで、アーキテクチャとトレーニングのレシピを共同でスコアする精度予測器を提案する。
高速な進化的検索をCPU分で実行し、さまざまなリソース制約に対するアーキテクチャと準備のペアを生成します。
FBNetV3は最先端のコンパクトニューラルネットワークのファミリーを構成しており、自動と手動で設計された競合より優れている。
論文 参考訳(メタデータ) (2020-06-03T05:20:21Z) - Self-Directed Online Machine Learning for Topology Optimization [58.920693413667216]
自己指向型オンライン学習最適化は、ディープニューラルネットワーク(DNN)と有限要素法(FEM)計算を統合している。
本アルゴリズムは, コンプライアンスの最小化, 流体構造最適化, 伝熱促進, トラス最適化の4種類の問題によって検証された。
その結果, 直接使用法と比較して計算時間を2~5桁削減し, 実験で検証した全ての最先端アルゴリズムより優れていた。
論文 参考訳(メタデータ) (2020-02-04T20:00:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。