論文の概要: Biological Sequence Design with GFlowNets
- arxiv url: http://arxiv.org/abs/2203.04115v3
- Date: Wed, 24 May 2023 11:21:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-26 03:29:27.748087
- Title: Biological Sequence Design with GFlowNets
- Title(参考訳): GFlowNetsを用いた生物配列設計
- Authors: Moksh Jain, Emmanuel Bengio, Alex-Hernandez Garcia, Jarrid
Rector-Brooks, Bonaventure F. P. Dossou, Chanakya Ekbote, Jie Fu, Tianyu
Zhang, Micheal Kilgour, Dinghuai Zhang, Lena Simine, Payel Das, Yoshua Bengio
- Abstract要約: 望ましい性質を持つデノボ生物配列の設計には、数ラウンドの分子のアイデアと高価なウェットラブ評価を伴う活性ループが伴うことが多い。
これにより、提案された候補の多様性は、構想段階において重要な考慮事項となる。
本稿では,不確実性推定と近年提案されているGFlowNetを多種多様な候補解の生成元として活用した能動的学習アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 75.1642973538266
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Design of de novo biological sequences with desired properties, like protein
and DNA sequences, often involves an active loop with several rounds of
molecule ideation and expensive wet-lab evaluations. These experiments can
consist of multiple stages, with increasing levels of precision and cost of
evaluation, where candidates are filtered. This makes the diversity of proposed
candidates a key consideration in the ideation phase. In this work, we propose
an active learning algorithm leveraging epistemic uncertainty estimation and
the recently proposed GFlowNets as a generator of diverse candidate solutions,
with the objective to obtain a diverse batch of useful (as defined by some
utility function, for example, the predicted anti-microbial activity of a
peptide) and informative candidates after each round. We also propose a scheme
to incorporate existing labeled datasets of candidates, in addition to a reward
function, to speed up learning in GFlowNets. We present empirical results on
several biological sequence design tasks, and we find that our method generates
more diverse and novel batches with high scoring candidates compared to
existing approaches.
- Abstract(参考訳): タンパク質やDNA配列のような望ましい性質を持つデノボ生物配列の設計は、しばしば数ラウンドの分子アイデアと高価なウェットラブ評価を伴う活性ループを含む。
これらの実験は複数の段階から構成され、精度と評価コストが増大し、候補をフィルターする。
これにより、提案された候補の多様性が、イデオレーションフェーズにおいて重要な考慮事項となる。
本研究では,近年提案されているGFlowNetsを多種多様な候補解の生成源として活用する能動的学習アルゴリズムを提案し,各ラウンド後の多種多様な有用(例えば,ペプチドの抗微生物活性の予測など)と情報的候補の獲得を目的とする。
また,gflownetsでの学習を高速化するための報酬関数に加えて,既存のラベル付き候補データセットを組み込む手法を提案する。
本手法は,いくつかの生物シーケンス設計タスクにおいて経験的な結果を示し,既存の手法に比べて高いスコアの候補を持つ新しいバッチを生成できることを見いだした。
関連論文リスト
- Efficient Biological Data Acquisition through Inference Set Design [3.9633147697178996]
本研究は,システム全体としての所望の精度を実現するため,最小の候補群を選択することを目的とする。
本稿では,このメカニズムを推論セット設計と呼び,信頼性に基づくアクティブラーニングソリューションを用いて,挑戦的な事例を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-10-25T15:34:03Z) - Sample-efficient Multi-objective Molecular Optimization with GFlowNets [5.030493242666028]
ハイパーネットワークに基づくGFlowNets(HN-GFN)を利用した多目的ベイズ最適化(MOBO)アルゴリズムを提案する。
HN-GFNは、単一の嗜好条件のハイパーネットワークを用いて、目的間の様々なトレードオフを探索することを学ぶ。
実世界の様々な環境での実験により、我々のフレームワークは、候補品質とサンプル効率の点で、既存の手法よりも圧倒的に優れていることが示された。
論文 参考訳(メタデータ) (2023-02-08T13:30:28Z) - Multi-Objective GFlowNets [59.16787189214784]
本稿では,多目的最適化の文脈において,多様な候補を生成する問題について検討する。
薬物発見やマテリアルデザインといった機械学習の多くの応用において、目標は、競合する可能性のある目標のセットを同時に最適化する候補を生成することである。
GFlowNetsをベースとした多目的GFlowNets(MOGFNs)を提案する。
論文 参考訳(メタデータ) (2022-10-23T16:15:36Z) - Diversifying Design of Nucleic Acid Aptamers Using Unsupervised Machine
Learning [54.247560894146105]
短い一本鎖RNAとDNA配列(アプタマー)の逆設計は、一連の望ましい基準を満たす配列を見つけるタスクである。
我々は、Pottsモデルとして知られる教師なし機械学習モデルを用いて、制御可能なシーケンスの多様性を持つ新しい有用なシーケンスを発見することを提案する。
論文 参考訳(メタデータ) (2022-08-10T13:30:58Z) - Exploiting Diversity of Unlabeled Data for Label-Efficient
Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。
アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。
また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文 参考訳(メタデータ) (2022-07-25T16:11:55Z) - Flow Network based Generative Models for Non-Iterative Diverse Candidate
Generation [110.09855163856326]
本稿では,アクションのシーケンスからオブジェクトを生成するためのポリシーを学習する問題について述べる。
本稿では,生成過程をフローネットワークとして見たGFlowNetを提案する。
提案した目的の任意のグローバルな最小限が、所望の分布から標本化する方針を導出することを証明する。
論文 参考訳(メタデータ) (2021-06-08T14:21:10Z) - Online Active Model Selection for Pre-trained Classifiers [72.84853880948894]
我々は,任意のラウンドにおいて高い確率で最良のモデルをラベル付けし,出力する情報的サンプルを積極的に選択するオンライン選択的サンプリング手法を設計する。
我々のアルゴリズムは、敵とストリームの両方のオンライン予測タスクに利用できる。
論文 参考訳(メタデータ) (2020-10-19T19:53:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。