論文の概要: Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient
- arxiv url: http://arxiv.org/abs/2405.18075v1
- Date: Tue, 28 May 2024 11:30:19 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-29 18:58:39.223258
- Title: Implicitly Guided Design with PropEn: Match your Data to Follow the Gradient
- Title(参考訳): PropEnで必然的にガイドされた設計: データをグラディエントにマッチさせる
- Authors: Nataša Tagasovska, Vladimir Gligorijević, Kyunghyun Cho, Andreas Loukas,
- Abstract要約: PropEnは'matching'にインスパイアされている。
一致したデータセットによるトレーニングは、データ分布内に留まりながら、興味のある性質の勾配を近似することを示す。
- 参考スコア(独自算出の注目度): 52.2669490431145
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Across scientific domains, generating new models or optimizing existing ones while meeting specific criteria is crucial. Traditional machine learning frameworks for guided design use a generative model and a surrogate model (discriminator), requiring large datasets. However, real-world scientific applications often have limited data and complex landscapes, making data-hungry models inefficient or impractical. We propose a new framework, PropEn, inspired by ``matching'', which enables implicit guidance without training a discriminator. By matching each sample with a similar one that has a better property value, we create a larger training dataset that inherently indicates the direction of improvement. Matching, combined with an encoder-decoder architecture, forms a domain-agnostic generative framework for property enhancement. We show that training with a matched dataset approximates the gradient of the property of interest while remaining within the data distribution, allowing efficient design optimization. Extensive evaluations in toy problems and scientific applications, such as therapeutic protein design and airfoil optimization, demonstrate PropEn's advantages over common baselines. Notably, the protein design results are validated with wet lab experiments, confirming the competitiveness and effectiveness of our approach.
- Abstract(参考訳): 科学的領域全体、新しいモデルの生成、あるいは特定の基準を満たしながら既存のモデルを最適化することが不可欠である。
ガイド付き設計のための伝統的な機械学習フレームワークは、生成モデルと代理モデル(ディスクリミネータ)を使用し、大きなデータセットを必要とする。
しかし、現実の科学的応用は、しばしば限られたデータと複雑な風景を持ち、データハングリーモデルが非効率的または非実用的になる。
我々は,識別器を訓練することなく暗黙の指導を可能にする,'matching'にインスパイアされた新しいフレームワークPropEnを提案する。
それぞれのサンプルを、より優れたプロパティ値を持つ類似のサンプルとマッチングすることにより、本質的に改善の方向性を示す、より大きなトレーニングデータセットを作成します。
マッチングとエンコーダ・デコーダアーキテクチャが組み合わさって、プロパティ拡張のためのドメインに依存しない生成フレームワークを形成する。
一致したデータセットによるトレーニングは、データ分布内に留まりながら興味のある性質の勾配を近似し、効率的な設計最適化を可能にすることを示す。
おもちゃの問題や治療タンパク質の設計や翼の最適化といった科学的な応用における広範囲な評価は、一般的なベースラインよりもPropEnの利点を示している。
特に,タンパク質設計の結果を湿式実験で検証し,本手法の有効性と有効性を確認した。
関連論文リスト
- Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - Functional Graphical Models: Structure Enables Offline Data-Driven Optimization [111.28605744661638]
構造がサンプル効率のよいデータ駆動最適化を実現する方法を示す。
また、FGM構造自体を推定するデータ駆動最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-08T22:33:14Z) - Federated Learning with Projected Trajectory Regularization [65.6266768678291]
フェデレーション学習は、ローカルデータを共有せずに、分散クライアントから機械学習モデルの共同トレーニングを可能にする。
連合学習における重要な課題の1つは、クライアントにまたがる識別できない分散データを扱うことである。
本稿では,データ問題に対処するための予測軌道正則化(FedPTR)を備えた新しいフェデレーション学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-22T02:12:08Z) - Building Resilience to Out-of-Distribution Visual Data via Input
Optimization and Model Finetuning [13.804184845195296]
本稿では,特定の目標視モデルに対する入力データを最適化する前処理モデルを提案する。
自律走行車におけるセマンティックセグメンテーションの文脈におけるアウト・オブ・ディストリビューションシナリオについて検討する。
提案手法により, 微調整モデルに匹敵するデータの性能を実現できることを示す。
論文 参考訳(メタデータ) (2022-11-29T14:06:35Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Improving Learning Effectiveness For Object Detection and Classification
in Cluttered Backgrounds [6.729108277517129]
本稿では,異種乱雑な背景の学習データセットを自律的に生成するフレームワークを開発する。
提案するフレームワークの学習効率は,複雑で異種な環境で改善されるべきである。
提案フレームワークの性能を実証実験により検討し,COCOデータセットを用いてトレーニングしたモデルと比較した。
論文 参考訳(メタデータ) (2020-02-27T22:28:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。