論文の概要: Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization
- arxiv url: http://arxiv.org/abs/2209.06259v1
- Date: Tue, 13 Sep 2022 18:37:27 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-15 12:57:31.609430
- Title: Designing Biological Sequences via Meta-Reinforcement Learning and
Bayesian Optimization
- Title(参考訳): メタ強化学習とベイズ最適化による生物配列の設計
- Authors: Leo Feng, Padideh Nouri, Aneri Muni, Yoshua Bengio, Pierre-Luc Bacon
- Abstract要約: メタ強化学習を用いて自己回帰生成モデルを訓練し、選択のための有望なシーケンスを提案する。
我々は,データのサブセットのサンプリングによって誘導されるMDPの分布に対する最適ポリシーを求める問題として,この問題を提起する。
このようなアンサンブルに対するメタラーニングは,報酬の過小評価に対して頑健であり,競争的な結果が得られることを示す。
- 参考スコア(独自算出の注目度): 68.28697120944116
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: The ability to accelerate the design of biological sequences can have a
substantial impact on the progress of the medical field. The problem can be
framed as a global optimization problem where the objective is an expensive
black-box function such that we can query large batches restricted with a
limitation of a low number of rounds. Bayesian Optimization is a principled
method for tackling this problem. However, the astronomically large state space
of biological sequences renders brute-force iterating over all possible
sequences infeasible. In this paper, we propose MetaRLBO where we train an
autoregressive generative model via Meta-Reinforcement Learning to propose
promising sequences for selection via Bayesian Optimization. We pose this
problem as that of finding an optimal policy over a distribution of MDPs
induced by sampling subsets of the data acquired in the previous rounds. Our
in-silico experiments show that meta-learning over such ensembles provides
robustness against reward misspecification and achieves competitive results
compared to existing strong baselines.
- Abstract(参考訳): 生物配列の設計を加速する能力は、医療分野の進歩に大きな影響を与える可能性がある。
この問題は、低いラウンド数で制限された大きなバッチをクエリできるような高価なブラックボックス関数を目標とする、グローバルな最適化問題としてフレーム化することができる。
ベイズ最適化はこの問題に対処するための原則的手法である。
しかし、天文学的に大きな生物配列の状態空間は、可能な全ての配列を反復的に繰り返すことは不可能である。
本稿では,メタ強化学習を通じて自己回帰生成モデルを訓練し,ベイズ最適化による選択に有望なシーケンスを提案するmetarlboを提案する。
この問題は,mdpの分布に対する最適方針を,前回のラウンドで取得したデータのサブセットをサンプリングすることによるものである。
我々は,このようなアンサンブルに対するメタラーニングが,報酬の相違に対して頑健であり,既存の強靭なベースラインと比較して競争的な結果が得られることを示した。
関連論文リスト
- Batched Bayesian optimization with correlated candidate uncertainties [44.38372821900645]
純粋に活用する qPO (multipoint of Optimality) による離散最適化のための獲得戦略を提案する。
本研究では, 大規模化学ライブラリのモデル誘導探索に適用し, バッチ化ベイズ最適化における最先端手法と同等以上の性能を示すことを示す。
論文 参考訳(メタデータ) (2024-10-08T20:13:12Z) - Reinforcement Learning for Sequence Design Leveraging Protein Language Models [14.477268882311991]
本稿では,タンパク質言語モデル(PLM)を報酬関数として利用し,新たな配列を生成することを提案する。
我々はRLベースのアプローチをベンチマークするために、様々なシーケンス長に関する広範な実験を行う。
生物学的妥当性とタンパク質の多様性に関する総合的な評価を行った。
論文 参考訳(メタデータ) (2024-07-03T14:31:36Z) - Amortizing intractable inference in large language models [56.92471123778389]
難治性後部分布のサンプルとして, 償却ベイズ推定を用いる。
我々は,LLMファインチューニングの分散マッチングパラダイムが,最大習熟の代替となることを実証的に実証した。
重要な応用として、チェーン・オブ・ソート推論を潜在変数モデリング問題として解釈する。
論文 参考訳(メタデータ) (2023-10-06T16:36:08Z) - A Study of Bayesian Neural Network Surrogates for Bayesian Optimization [46.97686790714025]
ベイズニューラルネットワーク(BNN)は近年,実用的な機能近似器になりつつある。
我々は,BNNを最適化のための標準GPサロゲートの代替として検討する。
論文 参考訳(メタデータ) (2023-05-31T17:00:00Z) - Protein Design with Guided Discrete Diffusion [67.06148688398677]
タンパク質設計における一般的なアプローチは、生成モデルと条件付きサンプリングのための識別モデルを組み合わせることである。
離散拡散モデルのためのガイダンス手法であるdiffusioN Optimized Smpling (NOS)を提案する。
NOSは、構造に基づく手法の重要な制限を回避し、シーケンス空間で直接設計を行うことができる。
論文 参考訳(メタデータ) (2023-05-31T16:31:24Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Accelerating Bayesian Optimization for Biological Sequence Design with
Denoising Autoencoders [28.550684606186884]
我々は,識別可能なマルチタスクガウスプロセスヘッドを用いて,デノナイズドオートエンコーダを共同で訓練する手法を開発した。
我々はZINCデータセットに基づく小分子上でLaMBOを評価し,蛍光タンパク質をターゲットとした新しい大規模分子タスクを導入する。
論文 参考訳(メタデータ) (2022-03-23T21:58:45Z) - EBM-Fold: Fully-Differentiable Protein Folding Powered by Energy-based
Models [53.17320541056843]
本研究では,データ駆動型生成ネットワークを用いたタンパク質構造最適化手法を提案する。
EBM-Foldアプローチは,従来のロゼッタ構造最適化ルーチンと比較して,高品質なデコイを効率よく生成できる。
論文 参考訳(メタデータ) (2021-05-11T03:40:29Z) - AdaLead: A simple and robust adaptive greedy search algorithm for
sequence design [55.41644538483948]
我々は、容易で、拡張性があり、堅牢な進化的欲求アルゴリズム(AdaLead)を開発した。
AdaLeadは、様々な生物学的に動機づけられたシーケンスデザインの課題において、アートアプローチのより複雑な状態を克服する、驚くほど強力なベンチマークである。
論文 参考訳(メタデータ) (2020-10-05T16:40:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。