論文の概要: Property-Guided Generative Modelling for Robust Model-Based Design with
Imbalanced Data
- arxiv url: http://arxiv.org/abs/2305.13650v1
- Date: Tue, 23 May 2023 03:47:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-24 19:23:16.218789
- Title: Property-Guided Generative Modelling for Robust Model-Based Design with
Imbalanced Data
- Title(参考訳): 不均衡データを用いたロバストモデル設計のための特性誘導型生成モデル
- Authors: Saba Ghaffari, Ehsan Saleh, Alexander G. Schwing, Yu-Xiong Wang,
Martin D. Burke, Saurabh Sinha
- Abstract要約: 本稿では,プロパティ値によって遅延空間が明示的に構造化されたプロパティ誘導変分自動エンコーダ(PGVAE)を提案する。
PGVAEを用いたPGVAEでは,データセットの不均衡が著しいにもかかわらず,特性が向上したシーケンスが頑健に見つかることを示した。
- 参考スコア(独自算出の注目度): 108.3978105433237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of designing protein sequences with desired properties is
challenging, as it requires to explore a high-dimensional protein sequence
space with extremely sparse meaningful regions. This has led to the development
of model-based optimization (MBO) techniques that aid in the design, by using
effective search models guided by the properties over the sequence space.
However, the intrinsic imbalanced nature of experimentally derived datasets
causes existing MBO approaches to struggle or outright fail. We propose a
property-guided variational auto-encoder (PGVAE) whose latent space is
explicitly structured by the property values such that samples are prioritized
according to these properties. Through extensive benchmarking on real and
semi-synthetic protein datasets, we demonstrate that MBO with PGVAE robustly
finds sequences with improved properties despite significant dataset
imbalances. We further showcase the generality of our approach to continuous
design spaces, and its robustness to dataset imbalance in an application to
physics-informed neural networks.
- Abstract(参考訳): 所望の特性を持つタンパク質配列を設計する問題は、非常に希薄な領域を持つ高次元のタンパク質配列空間を探索する必要があるため、難しい。
これにより、シーケンス空間上の特性によって導かれる効果的な探索モデルを用いることで、設計を支援するモデルベース最適化(mbo)技術の開発につながった。
しかし、実験的に導出されたデータセットの本質的な不均衡性は、既存のMBOアプローチに苦労や失敗を引き起こす。
本稿では,これらの特性に応じてサンプルが優先度付けされるような特性値によって遅延空間が明示的に構造化される特性誘導変分自動エンコーダ(PGVAE)を提案する。
実および半合成タンパク質データセットの広範なベンチマークを通じて、PGVAEを用いたMBOは、データセットの不均衡が著しいにもかかわらず、改良された特性を持つ配列を確実に見つけることを示した。
さらに、連続的な設計空間に対する我々のアプローチの一般化と、物理インフォームドニューラルネットワークへの応用における不均衡のデータセット化に対する頑健さについて述べる。
関連論文リスト
- Towards Seamless Adaptation of Pre-trained Models for Visual Place Recognition [72.35438297011176]
視覚的位置認識のための事前学習モデル(VPR)のシームレスな適応を実現する新しい手法を提案する。
具体的には、地域を識別するための有意義なランドマークに焦点を当てたグローバルな特徴とローカルな特徴の両方を得るために、ハイブリッド適応法を設計する。
実験結果から,本手法はトレーニングデータやトレーニング時間が少なく,最先端の手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2024-02-22T12:55:01Z) - Phasic Content Fusing Diffusion Model with Directional Distribution
Consistency for Few-Shot Model Adaption [73.98706049140098]
本稿では,方向分布の整合性を損なう少数ショット拡散モデルを用いた新しいファシックコンテンツを提案する。
具体的には、ファシックコンテンツ融合を用いたファシックトレーニング戦略を設計し、tが大きければ、モデルがコンテンツやスタイル情報を学ぶのに役立てる。
最後に、ドメイン適応時の構造整合性を高めるクロスドメイン構造ガイダンス戦略を提案する。
論文 参考訳(メタデータ) (2023-09-07T14:14:11Z) - Towards Accelerated Model Training via Bayesian Data Selection [45.62338106716745]
本稿では,モデルの一般化損失に対するデータの影響を調べることによって,より合理的なデータ選択原理を提案する。
近年の研究では、モデルの一般化損失に対するデータの影響を調べることによって、より合理的なデータ選択の原則が提案されている。
この研究は、軽量ベイズ処理を活用し、大規模な事前訓練モデル上に構築された既製のゼロショット予測器を組み込むことにより、これらの問題を解決する。
論文 参考訳(メタデータ) (2023-08-21T07:58:15Z) - Accurate Neural Network Pruning Requires Rethinking Sparse Optimization [87.90654868505518]
標準コンピュータビジョンと自然言語処理の疎度ベンチマークを用いたモデルトレーニングにおいて,高い疎度が与える影響について述べる。
本稿では,視覚モデルのスパース事前学習と言語モデルのスパース微調整の両面において,この問題を軽減するための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-03T21:49:14Z) - Happy People -- Image Synthesis as Black-Box Optimization Problem in the
Discrete Latent Space of Deep Generative Models [10.533348468499826]
本稿では、連続的に定量化できる特性に対して、生成したサンプルを最適化する新しい画像生成手法を提案する。
具体的には,ベクトル量子化VAEの離散潜在空間上の数学的プログラムとしてツリーベースアンサンブルモデルを提案する。
論文 参考訳(メタデータ) (2023-06-11T13:58:36Z) - Building Resilience to Out-of-Distribution Visual Data via Input
Optimization and Model Finetuning [13.804184845195296]
本稿では,特定の目標視モデルに対する入力データを最適化する前処理モデルを提案する。
自律走行車におけるセマンティックセグメンテーションの文脈におけるアウト・オブ・ディストリビューションシナリオについて検討する。
提案手法により, 微調整モデルに匹敵するデータの性能を実現できることを示す。
論文 参考訳(メタデータ) (2022-11-29T14:06:35Z) - Conservative Objective Models for Effective Offline Model-Based
Optimization [78.19085445065845]
計算設計の問題は、合成生物学からコンピュータアーキテクチャまで、様々な場面で発生している。
本研究では,分布外入力に対する接地的目標の実際の値を低くする目的関数のモデルを学習する手法を提案する。
COMは、様々なMBO問題に対して、既存のメソッドの実装と性能の面では単純である。
論文 参考訳(メタデータ) (2021-07-14T17:55:28Z) - Deep Magnification-Flexible Upsampling over 3D Point Clouds [103.09504572409449]
本稿では,高密度点雲を生成するためのエンドツーエンド学習ベースのフレームワークを提案する。
まずこの問題を明示的に定式化し、重みと高次近似誤差を判定する。
そこで我々は,高次改良とともに,統一重みとソート重みを適応的に学習する軽量ニューラルネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-25T14:00:18Z) - Instance Selection for GANs [25.196177369030146]
GAN(Generative Adversarial Networks)は、高品質な合成画像を生成するために広く採用されている。
GANはしばしばデータ多様体の外にある非現実的なサンプルを生成する。
本稿では,サンプルの品質向上のための新しいアプローチを提案する。モデルトレーニングが行われる前に,インスタンス選択によるトレーニングデータセットの変更を行う。
論文 参考訳(メタデータ) (2020-07-30T06:33:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。