論文の概要: Sampling-based Continuous Optimization with Coupled Variables for RNA Design
- arxiv url: http://arxiv.org/abs/2412.08751v1
- Date: Wed, 11 Dec 2024 19:46:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 17:02:06.757226
- Title: Sampling-based Continuous Optimization with Coupled Variables for RNA Design
- Title(参考訳): RNA設計のための結合変数を用いたサンプリングに基づく連続最適化
- Authors: Wei Yu Tang, Ning Dai, Tianshuo Zhou, David H. Mathews, Liang Huang,
- Abstract要約: RNA設計問題に対する連続的な最適化手法を開発した。
我々の研究はボルツマン確率、アンサンブル欠陥、エネルギーギャップといった重要な指標において、常に最先端の手法よりも優れています。
- 参考スコア(独自算出の注目度): 4.226911519009711
- License:
- Abstract: The task of RNA design given a target structure aims to find a sequence that can fold into that structure. It is a computationally hard problem where some version(s) have been proven to be NP-hard. As a result, heuristic methods such as local search have been popular for this task, but by only exploring a fixed number of candidates. They can not keep up with the exponential growth of the design space, and often perform poorly on longer and harder-to-design structures. We instead formulate these discrete problems as continuous optimization, which starts with a distribution over all possible candidate sequences, and uses gradient descent to improve the expectation of an objective function. We define novel distributions based on coupled variables to rule out invalid sequences given the target structure and to model the correlation between nucleotides. To make it universally applicable to any objective function, we use sampling to approximate the expected objective function, to estimate the gradient, and to select the final candidate. Compared to the state-of-the-art methods, our work consistently outperforms them in key metrics such as Boltzmann probability, ensemble defect, and energy gap, especially on long and hard-to-design puzzles in the Eterna100 benchmark. Our code is available at: http://github.com/weiyutang1010/ncrna_design.
- Abstract(参考訳): ターゲット構造が与えられたRNA設計のタスクは、その構造に折り畳むことができる配列を見つけることを目的としている。
これは、あるバージョンがNPハードであることが証明された、計算的に難しい問題である。
その結果, 局所探索のようなヒューリスティックな手法が広く普及しているが, 一定の数の候補を探索するだけでよいことがわかった。
それらは設計空間の指数関数的な成長に遅れず、多くの場合、長くて設計が難しい構造において不十分に機能する。
代わりに、これらの離散的な問題を連続的な最適化として定式化し、全ての候補列の分布から始まり、勾配降下を用いて目的関数の期待値を改善する。
結合変数に基づいて新規な分布を定義し、対象構造が与えられた不正な配列を除外し、ヌクレオチド間の相関をモデル化する。
任意の目的関数に普遍的に適用するために、サンプリングを用いて予測対象関数を近似し、勾配を推定し、最終候補を選択する。
最先端の手法と比較して、我々の研究はボルツマン確率、アンサンブル欠陥、エネルギーギャップといった重要な指標、特にEterna100ベンチマークの長大で難解なパズルにおいて、それらを一貫して上回っている。
私たちのコードは、http://github.com/weiyutang1010/ncrna_design.comで利用可能です。
関連論文リスト
- SplAgger: Split Aggregation for Meta-Reinforcement Learning [32.25672143072966]
ブラックボックスメソッドは、オフザシェルフシーケンスモデルをエンドツーエンドでトレーニングすることで実現している。
タスク推論メソッドは、未知のタスク上の後方分布を明示的に推論する。
近年の研究では、タスク推論シーケンスモデルは高いパフォーマンスには必要ないことが示されている。
タスク推論シーケンスモデルが依然として有用であることを示す。
論文 参考訳(メタデータ) (2024-03-05T14:57:04Z) - Messenger RNA Design via Expected Partition Function and Continuous
Optimization [4.53482492156538]
古典的分割関数の一般化に基づく連続最適化のための一般的なフレームワークを開発する。
ワクチンや治療に広く応用されたmRNA設計の課題について考察する。
論文 参考訳(メタデータ) (2023-12-29T18:37:38Z) - Generalization Bounds for Stochastic Gradient Descent via Localized
$\varepsilon$-Covers [16.618918548497223]
本稿では,SGDの軌道に局在する新しい被覆手法を提案する。
このローカライゼーションは、境界数によって測定されるアルゴリズム固有のクラスタリングを提供する。
これらの結果は様々な文脈で導き出され、既知の最先端のラベルレートが向上する。
論文 参考訳(メタデータ) (2022-09-19T12:11:07Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Multi-block-Single-probe Variance Reduced Estimator for Coupled
Compositional Optimization [49.58290066287418]
構成問題の複雑さを軽減するために,MSVR (Multi-block-probe Variance Reduced) という新しい手法を提案する。
本研究の結果は, 試料の複雑さの順序や強靭性への依存など, 様々な面で先行して改善された。
論文 参考訳(メタデータ) (2022-07-18T12:03:26Z) - Improved Convergence Rate of Stochastic Gradient Langevin Dynamics with
Variance Reduction and its Application to Optimization [50.83356836818667]
勾配ランゲヴィン・ダイナミクスは非エプス最適化問題を解くための最も基本的なアルゴリズムの1つである。
本稿では、このタイプの2つの変種、すなわち、分散還元ランジュバンダイナミクスと再帰勾配ランジュバンダイナミクスを示す。
論文 参考訳(メタデータ) (2022-03-30T11:39:00Z) - Scaling Structured Inference with Randomization [64.18063627155128]
本稿では、構造化されたモデルを数万の潜在状態に拡張するためにランダム化された動的プログラミング(RDP)のファミリを提案する。
我々の手法は古典的DPベースの推論に広く適用できる。
また、自動微分とも互換性があり、ニューラルネットワークとシームレスに統合できる。
論文 参考訳(メタデータ) (2021-12-07T11:26:41Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - Alleviate Exposure Bias in Sequence Prediction \\ with Recurrent Neural
Networks [47.52214243454995]
繰り返しニューラルネットワーク(RNN)を訓練する一般的な戦略は、各ステップで入力として地上の真実を取ることです。
本稿では,RNNの長期的依存関係をよりよく把握するための,完全微分可能なトレーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-03-22T06:15:22Z) - Train Like a (Var)Pro: Efficient Training of Neural Networks with
Variable Projection [2.7561479348365734]
ディープニューラルネットワーク(DNN)は、さまざまな従来の機械学習タスクで最先端のパフォーマンスを達成した。
本稿では,多くの最先端アプリケーションで発生するDNNのトレーニングについて考察する。
論文 参考訳(メタデータ) (2020-07-26T16:29:39Z) - Hardness of Random Optimization Problems for Boolean Circuits,
Low-Degree Polynomials, and Langevin Dynamics [78.46689176407936]
アルゴリズムの族は高い確率でほぼ最適な解を生成できないことを示す。
ブール回路の場合、回路複雑性理論で知られている最先端境界を改善する。
論文 参考訳(メタデータ) (2020-04-25T05:45:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。