論文の概要: Property-Guided Generative Modelling for Robust Model-Based Design with
Imbalanced Data
- arxiv url: http://arxiv.org/abs/2305.13650v1
- Date: Tue, 23 May 2023 03:47:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 19:23:16.218789
- Title: Property-Guided Generative Modelling for Robust Model-Based Design with
Imbalanced Data
- Title(参考訳): 不均衡データを用いたロバストモデル設計のための特性誘導型生成モデル
- Authors: Saba Ghaffari, Ehsan Saleh, Alexander G. Schwing, Yu-Xiong Wang,
Martin D. Burke, Saurabh Sinha
- Abstract要約: 本稿では,プロパティ値によって遅延空間が明示的に構造化されたプロパティ誘導変分自動エンコーダ(PGVAE)を提案する。
PGVAEを用いたPGVAEでは,データセットの不均衡が著しいにもかかわらず,特性が向上したシーケンスが頑健に見つかることを示した。
- 参考スコア(独自算出の注目度): 108.3978105433237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of designing protein sequences with desired properties is
challenging, as it requires to explore a high-dimensional protein sequence
space with extremely sparse meaningful regions. This has led to the development
of model-based optimization (MBO) techniques that aid in the design, by using
effective search models guided by the properties over the sequence space.
However, the intrinsic imbalanced nature of experimentally derived datasets
causes existing MBO approaches to struggle or outright fail. We propose a
property-guided variational auto-encoder (PGVAE) whose latent space is
explicitly structured by the property values such that samples are prioritized
according to these properties. Through extensive benchmarking on real and
semi-synthetic protein datasets, we demonstrate that MBO with PGVAE robustly
finds sequences with improved properties despite significant dataset
imbalances. We further showcase the generality of our approach to continuous
design spaces, and its robustness to dataset imbalance in an application to
physics-informed neural networks.
- Abstract(参考訳): 所望の特性を持つタンパク質配列を設計する問題は、非常に希薄な領域を持つ高次元のタンパク質配列空間を探索する必要があるため、難しい。
これにより、シーケンス空間上の特性によって導かれる効果的な探索モデルを用いることで、設計を支援するモデルベース最適化(mbo)技術の開発につながった。
しかし、実験的に導出されたデータセットの本質的な不均衡性は、既存のMBOアプローチに苦労や失敗を引き起こす。
本稿では,これらの特性に応じてサンプルが優先度付けされるような特性値によって遅延空間が明示的に構造化される特性誘導変分自動エンコーダ(PGVAE)を提案する。
実および半合成タンパク質データセットの広範なベンチマークを通じて、PGVAEを用いたMBOは、データセットの不均衡が著しいにもかかわらず、改良された特性を持つ配列を確実に見つけることを示した。
さらに、連続的な設計空間に対する我々のアプローチの一般化と、物理インフォームドニューラルネットワークへの応用における不均衡のデータセット化に対する頑健さについて述べる。
関連論文リスト
- Bridging Model-Based Optimization and Generative Modeling via Conservative Fine-Tuning of Diffusion Models [54.132297393662654]
本稿では,RLによる報酬モデルの最適化により,最先端拡散モデルを微調整するハイブリッド手法を提案する。
我々は、報酬モデルの補間能力を活用し、オフラインデータにおいて最良の設計を上回るアプローチの能力を実証する。
論文 参考訳(メタデータ) (2024-05-30T03:57:29Z) - Accurate Neural Network Pruning Requires Rethinking Sparse Optimization [87.90654868505518]
標準コンピュータビジョンと自然言語処理の疎度ベンチマークを用いたモデルトレーニングにおいて,高い疎度が与える影響について述べる。
本稿では,視覚モデルのスパース事前学習と言語モデルのスパース微調整の両面において,この問題を軽減するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-03T21:49:14Z) - Towards a Better Theoretical Understanding of Independent Subnetwork Training [56.24689348875711]
独立サブネットワークトレーニング(IST)の理論的考察
ISTは、上記の問題を解決するための、最近提案され、非常に効果的である。
圧縮通信を用いた分散手法など,ISTと代替手法の基本的な違いを同定する。
論文 参考訳(メタデータ) (2023-06-28T18:14:22Z) - Happy People -- Image Synthesis as Black-Box Optimization Problem in the
Discrete Latent Space of Deep Generative Models [10.533348468499826]
本稿では、連続的に定量化できる特性に対して、生成したサンプルを最適化する新しい画像生成手法を提案する。
具体的には,ベクトル量子化VAEの離散潜在空間上の数学的プログラムとしてツリーベースアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2023-06-11T13:58:36Z) - Aligning Optimization Trajectories with Diffusion Models for Constrained
Design Generation [17.164961143132473]
本稿では,拡散モデルのサンプリング軌跡と従来の物理法に基づく最適化軌跡との整合性を示す学習フレームワークを提案する。
提案手法では,高コストプリプロセッシングや外部サロゲートモデル,ラベル付きデータの追加を必要とせずに,実用的で高性能な設計を2段階で生成することができる。
この結果から, TAは分布内構成における最先端の深層生成モデルより優れ, 推論計算コストを半減することがわかった。
論文 参考訳(メタデータ) (2023-05-29T09:16:07Z) - Building Resilience to Out-of-Distribution Visual Data via Input
Optimization and Model Finetuning [13.804184845195296]
本稿では,特定の目標視モデルに対する入力データを最適化する前処理モデルを提案する。
自律走行車におけるセマンティックセグメンテーションの文脈におけるアウト・オブ・ディストリビューションシナリオについて検討する。
提案手法により, 微調整モデルに匹敵するデータの性能を実現できることを示す。
論文 参考訳(メタデータ) (2022-11-29T14:06:35Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Instance Selection for GANs [25.196177369030146]
GAN(Generative Adversarial Networks)は、高品質な合成画像を生成するために広く採用されている。
GANはしばしばデータ多様体の外にある非現実的なサンプルを生成する。
本稿では,サンプルの品質向上のための新しいアプローチを提案する。モデルトレーニングが行われる前に,インスタンス選択によるトレーニングデータセットの変更を行う。
論文 参考訳(メタデータ) (2020-07-30T06:33:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。