論文の概要: Decoy Selection for Protein Structure Prediction Via Extreme Gradient
Boosting and Ranking
- arxiv url: http://arxiv.org/abs/2010.01441v1
- Date: Sat, 3 Oct 2020 23:09:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-11 11:47:02.933442
- Title: Decoy Selection for Protein Structure Prediction Via Extreme Gradient
Boosting and Ranking
- Title(参考訳): 極度勾配ブースティングとランキングによるタンパク質構造予測のためのdecoy選択
- Authors: Nasrin Akhter and Gopinath Chennupati and Hristo Djidjev and Amarda
Shehu
- Abstract要約: 数百万の非ネイティブデコイから1つ以上の生物活性/ネイティブデコイを同定することは、計算構造生物学における大きな課題の1つである。
テンプレートフリーなデコイ生成により探索される構造空間に付随するエネルギー景観を利用する新しいデコイ選択法であるML-Selectを提案する。
- 参考スコア(独自算出の注目度): 4.951247283741297
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Identifying one or more biologically-active/native decoys from millions of
non-native decoys is one of the major challenges in computational structural
biology. The extreme lack of balance in positive and negative samples (native
and non-native decoys) in a decoy set makes the problem even more complicated.
Consensus methods show varied success in handling the challenge of decoy
selection despite some issues associated with clustering large decoy sets and
decoy sets that do not show much structural similarity. Recent investigations
into energy landscape-based decoy selection approaches show promises. However,
lack of generalization over varied test cases remains a bottleneck for these
methods. We propose a novel decoy selection method, ML-Select, a machine
learning framework that exploits the energy landscape associated with the
structure space probed through a template-free decoy generation. The proposed
method outperforms both clustering and energy ranking-based methods, all the
while consistently offering better performance on varied test-cases. Moreover,
ML-Select shows promising results even for the decoy sets consisting of mostly
low-quality decoys. ML-Select is a useful method for decoy selection. This work
suggests further research in finding more effective ways to adopt machine
learning frameworks in achieving robust performance for decoy selection in
template-free protein structure prediction.
- Abstract(参考訳): 数百万の非ネイティブデコイから1つ以上の生物活性/ネイティブデコイを同定することは、計算構造生物学における大きな課題の1つである。
正および負のサンプル(ネイティブおよび非ネイティブのデコイ)のデコイ集合における極端なバランスの欠如は、問題をさらに複雑にする。
コンセンサス法は、大きなデコイ集合やデコイ集合のクラスタ化に関連するいくつかの問題があるにもかかわらず、デコイ選択の課題を扱うのに成功している。
エネルギーランドスケープに基づくデコイ選択アプローチに関する最近の調査は、将来性を示している。
しかし、様々なテストケースに対する一般化の欠如は、これらの方法のボトルネックである。
テンプレートフリーなデコイ生成によって探索される構造空間に付随するエネルギー景観を利用する機械学習フレームワークである,新しいデコイ選択手法ML-Selectを提案する。
提案手法は, クラスタリング法とエネルギーランク付け法の両方で性能が向上する一方で, 各種テストケースの性能も向上する。
さらに、ML-Selectは、主に低品質のデコイからなるデコイ集合に対しても有望な結果を示す。
ML-Selectはデコイ選択に有用な方法である。
この研究は、テンプレートフリーなタンパク質構造予測におけるデコイ選択のロバストなパフォーマンスを達成するために、機械学習フレームワークを採用するためのより効果的な方法を見つけるためのさらなる研究を示唆している。
関連論文リスト
- SUnAA: Sparse Unmixing using Archetypal Analysis [62.997667081978825]
本稿では, 古細菌スパルス解析(SUnAA)を用いた新しい地質学的エラーマップ手法を提案する。
まず,古細菌スパース解析(SunAA)に基づく新しいモデルの設計を行う。
論文 参考訳(メタデータ) (2023-08-09T07:58:33Z) - Protein Sequence Design with Batch Bayesian Optimisation [0.0]
タンパク質配列設計は、有用な生物学的機能を持つ新規タンパク質の発見を目的とした、タンパク質工学における挑戦的な問題である。
有向進化は、実験室環境における進化のサイクルを模倣し、反復的プロトコルを実行する、タンパク質配列設計のための広く使われているアプローチである。
本稿では,タンパク質配列設計のための最適化手法であるBatch Bayesian Optimization (Batch BO) に基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2023-03-18T14:53:20Z) - Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization [68.28697120944116]
メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
論文 参考訳(メタデータ) (2022-09-13T18:37:27Z) - Structured Q-learning For Antibody Design [82.78798397798533]
抗体設計における重要なステップの1つは、病原体との結合を改善するタンパク質配列中のアミノ酸の配列を見つけることである。
非常に大きな探索空間と非線形目的のために、抗体の組合せ最適化は困難である。
従来の強化学習を抗体設計の最適化に適用すると、性能は低下する。
本稿では,Q-ラーニングの拡張であるQ-ラーニングを提案する。
論文 参考訳(メタデータ) (2022-09-10T15:36:55Z) - ODBO: Bayesian Optimization with Search Space Prescreening for Directed Protein Evolution [18.726398852721204]
タンパク質指向進化のための効率的で実験的な設計指向のクローズドループ最適化フレームワークを提案する。
ODBOは、新しい低次元タンパク質エンコーディング戦略と、外乱検出による検索空間事前スクリーニングによって強化されたベイズ最適化を組み合わせている。
本研究は, タンパク質指向進化実験を4回実施し, 興味のある変異を見出すためのフレームワークの能力を実証した。
論文 参考訳(メタデータ) (2022-05-19T13:21:31Z) - Non-Elitist Selection Can Improve the Performance of Irace [0.8258451067861933]
本研究では,旅行セールスパーソン問題に対するアリコロニー最適化アルゴリズムのチューニング方法と2次代入問題について検討する。
実験結果から, テストベンチマークでは, iraceの既定選択よりも改善が見られた。
さらに, この結果から, アルゴリズムの動作を理解するため, 多様なアルゴリズム構成が得られることが示唆された。
論文 参考訳(メタデータ) (2022-03-17T10:34:30Z) - A Bi-Level Framework for Learning to Solve Combinatorial Optimization on
Graphs [91.07247251502564]
本稿では,2つの世界の長所を結合するハイブリッドな手法を提案する。この手法では,グラフを最適化する上層学習手法とバイレベルフレームワークを開発する。
このような二段階のアプローチは、元のハードCOでの学習を単純化し、モデルキャパシティの需要を効果的に軽減することができる。
論文 参考訳(メタデータ) (2021-06-09T09:18:18Z) - Combination of digital signal processing and assembled predictive models
facilitates the rational design of proteins [0.0]
タンパク質の突然変異の影響を予測することは、タンパク質工学における最も重要な課題の1つである。
符号化段階での物理化学的特性の組み合わせを選択するために,クラスタリング,埋め込み,次元還元技術を用いている。
次に、各プロパティセットで最高のパフォーマンス予測モデルを選択し、組み立てたモデルを作成します。
論文 参考訳(メタデータ) (2020-10-07T16:35:02Z) - AdaLead: A simple and robust adaptive greedy search algorithm for
sequence design [55.41644538483948]
我々は、容易で、拡張性があり、堅牢な進化的欲求アルゴリズム(AdaLead)を開発した。
AdaLeadは、様々な生物学的に動機づけられたシーケンスデザインの課題において、アートアプローチのより複雑な状態を克服する、驚くほど強力なベンチマークである。
論文 参考訳(メタデータ) (2020-10-05T16:40:38Z) - Bloom Origami Assays: Practical Group Testing [90.2899558237778]
グループテストは、いくつかの魅力的なソリューションでよく研究されている問題である。
近年の生物学的研究は、従来の方法と相容れない新型コロナウイルスの実践的な制約を課している。
我々は,Bloomフィルタと信条伝搬を組み合わせた新しい手法を開発し,n(100以上)の大きい値に拡張し,良好な経験的結果を得る。
論文 参考訳(メタデータ) (2020-07-21T19:31:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。