論文の概要: Boosting Offline Optimizers with Surrogate Sensitivity
- arxiv url: http://arxiv.org/abs/2503.04181v1
- Date: Thu, 06 Mar 2025 07:50:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-07 17:59:00.725889
- Title: Boosting Offline Optimizers with Surrogate Sensitivity
- Title(参考訳): サロゲート感度を用いたオフライン最適化装置の高速化
- Authors: Manh Cuong Dao, Phi Le Nguyen, Thao Nguyen Truong, Trong Nghia Hoang,
- Abstract要約: オフライン最適化は、オンライン実験が高価すぎる多くの材料工学領域において重要であり、ブラックボックス関数のシリコサロゲートに置き換えられる必要がある。
このようなサロゲートはオフラインデータから学ぶことができるが、その予測はオフラインデータ体制以外では信頼性がないかもしれない。
1)サロゲートモデルの感度をどうやって調節するか、(2)そのようなサロゲートで表現されたオフラインインフォームがより良いパフォーマンスをもたらすかどうか。
- 参考スコア(独自算出の注目度): 8.750390242872138
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Offline optimization is an important task in numerous material engineering domains where online experimentation to collect data is too expensive and needs to be replaced by an in silico maximization of a surrogate of the black-box function. Although such a surrogate can be learned from offline data, its prediction might not be reliable outside the offline data regime, which happens when the surrogate has narrow prediction margin and is (therefore) sensitive to small perturbations of its parameterization. This raises the following questions: (1) how to regulate the sensitivity of a surrogate model; and (2) whether conditioning an offline optimizer with such less sensitive surrogate will lead to better optimization performance. To address these questions, we develop an optimizable sensitivity measurement for the surrogate model, which then inspires a sensitivity-informed regularizer that is applicable to a wide range of offline optimizers. This development is both orthogonal and synergistic to prior research on offline optimization, which is demonstrated in our extensive experiment benchmark.
- Abstract(参考訳): オフライン最適化は、データ収集のためのオンライン実験が高価すぎる多くの材料工学領域において重要な課題であり、ブラックボックス関数のサロゲートのシリコ最大化に置き換える必要がある。
このようなサロゲートはオフラインデータから学べるが、その予測はオフラインデータ体制以外では信頼性がないかもしれない。
1)サロゲートモデルの感度をどうやって調節するか、(2)そのような感度の低いサロゲートでオフラインオプティマイザを条件付けると、より良い最適化性能が得られるかどうか、という疑問が提起される。
これらの問題に対処するため,サロゲートモデルに対する最適感度測定法を開発し,様々なオフラインオプティマイザに適用可能な感度インフォームド正規化器を誘導する。
この開発は、我々の広範な実験ベンチマークで実証されたオフライン最適化に関する以前の研究と直交的かつ相乗的である。
関連論文リスト
- Offline Model-Based Optimization: Comprehensive Review [61.91350077539443]
オフライン最適化は、オフラインデータセットのみを使用してブラックボックス機能の最適化を目標とする、科学とエンジニアリングの基本的な課題である。
モデルベース最適化の最近の進歩は、オフライン固有の代理モデルと生成モデルを開発するために、ディープニューラルネットワークの一般化能力を活用している。
科学的な発見を加速させる効果が増大しているにもかかわらず、この分野は包括的なレビューを欠いている。
論文 参考訳(メタデータ) (2025-03-21T16:35:02Z) - Incorporating Surrogate Gradient Norm to Improve Offline Optimization Techniques [8.750390242872138]
オフライン最適化のためのモデルに依存しない手法を開発した。
オフラインデータセットにおけるサロゲートシャープネスの低減は、目に見えないデータに対する一般化シャープネスを確実に減少させることを示す。
我々の分析は、既存の理論を、(目に見えないデータ上の)一般化予測損失と損失シャープネスの境界から、トレーニングデータに対する経験的推定で最悪の一般化サロゲートシャープネスの境界まで拡張する。
論文 参考訳(メタデータ) (2025-03-06T09:24:23Z) - Learning Surrogates for Offline Black-Box Optimization via Gradient Matching [29.831762991506242]
本稿では,オフラインデータに基づく潜伏勾配場とサロゲートがいかによく一致しているかに基づいて,最適化品質を明示的に境界付けることによって,オフラインブラックボックス最適化を理解するための理論的枠組みを提案する。
そこで本研究では,オフライン最適化のための効果的なサロゲートモデル作成のためのブラックボックス勾配マッチングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-02-26T22:35:54Z) - DSTC: Direct Preference Learning with Only Self-Generated Tests and Code to Improve Code LMs [56.4979142807426]
UnderlinetextbfDirect Preference Learning with only underlinetextbfSelf-Generated underlinetextbfTests and underlinetextbfCode (DSTC)を紹介する。
DSTCは自己生成コードスニペットとテストのみを使用して信頼性の高い選好ペアを構築する。
論文 参考訳(メタデータ) (2024-11-20T02:03:16Z) - Correcting the Mythos of KL-Regularization: Direct Alignment without Overoptimization via Chi-Squared Preference Optimization [78.82586283794886]
$chi2$-Preference Optimization(chi$PO)は、オーバー最適化に対して確実に堅牢なオフラインアライメントアルゴリズムである。
$chi$POは、正規化による不確実性に直面して悲観主義の原理を実装している。
$chi$POの単純さと強力な保証により、オーバー最適化に対して確実に堅牢な、実用的で汎用的なオフラインアライメントアルゴリズムとなった。
論文 参考訳(メタデータ) (2024-07-18T11:08:40Z) - Bayesian Design Principles for Offline-to-Online Reinforcement Learning [50.97583504192167]
オフラインからオンラインへの微調整は、探索にコストがかかる、あるいは安全でない、現実世界のアプリケーションにとって極めて重要です。
本稿では,オフラインからオフラインまでの微調整のジレンマに対処する:エージェントが悲観的のままであれば,より良いポリシーを習得できないかもしれないが,楽観的になった場合,性能が突然低下する可能性がある。
このようなジレンマを解決するにはベイズ設計の原則が不可欠であることを示す。
論文 参考訳(メタデータ) (2024-05-31T16:31:07Z) - Offline Model-Based Optimization via Policy-Guided Gradient Search [30.87992788876113]
オフライン強化学習問題として再構成することで、オフライン最適化のための新しい学習-探索-勾配の視点を導入する。
提案手法は,オフラインデータから生成されたサロゲートモデルに対して,適切なポリシーを明示的に学習する。
論文 参考訳(メタデータ) (2024-05-08T18:27:37Z) - Generative Adversarial Model-Based Optimization via Source Critic Regularization [25.19579059511105]
本稿ではアダプティブ・ソース・批評家正規化(aSCR)を用いた生成逆モデルに基づく最適化を提案する。
ASCRは、サロゲート関数が信頼できる設計空間の領域に最適化軌道を制約する。
本稿では,aSCRを標準的なベイズ最適化に活用することにより,オフライン生成設計タスクのスイートにおいて,既存の手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2024-02-09T16:43:57Z) - Efficient Online Reinforcement Learning with Offline Data [78.92501185886569]
オンライン学習時にオフラインデータを活用するために、既存のオフライン手法を単純に適用できることを示します。
私たちはこれらの設計選択を広範囲に改善し、パフォーマンスに最も影響を与える重要な要因を示します。
これらのシンプルなレコメンデーションの正しい適用によって、既存のアプローチよりも$mathbf2.5times$の改善が得られます。
論文 参考訳(メタデータ) (2023-02-06T17:30:22Z) - JUMBO: Scalable Multi-task Bayesian Optimization using Offline Data [86.8949732640035]
追加データをクエリすることで制限をサイドステップするMBOアルゴリズムであるJUMBOを提案する。
GP-UCBに類似した条件下では, 応答が得られないことを示す。
実世界の2つの最適化問題に対する既存手法に対する性能改善を実証的に示す。
論文 参考訳(メタデータ) (2021-06-02T05:03:38Z) - Robust Policy Search for Robot Navigation [3.130722489512822]
複雑なロボットナビゲーションと制御問題は、ポリシー探索問題としてフレーム化することができる。
本研究では、ロバストな最適化と統計的ロバスト性の両方を取り入れ、どちらのタイプのロバスト性も相乗的であることを示す。
本稿では,いくつかのベンチマークとロボットタスクにおいて,モデル誤差を補足してもコンバージェンス保証と性能向上を実現することを目的とした。
論文 参考訳(メタデータ) (2020-03-02T16:30:59Z) - Bilevel Optimization for Differentially Private Optimization in Energy
Systems [53.806512366696275]
本稿では,入力に敏感な制約付き最適化問題に対して,差分プライバシーを適用する方法について検討する。
本稿は, 自然仮定の下では, 大規模非線形最適化問題に対して, 双レベルモデルを効率的に解けることを示す。
論文 参考訳(メタデータ) (2020-01-26T20:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。