論文の概要: Partitioned Active Learning for Heterogeneous Systems
- arxiv url: http://arxiv.org/abs/2105.08547v1
- Date: Fri, 14 May 2021 02:05:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-20 06:47:22.367840
- Title: Partitioned Active Learning for Heterogeneous Systems
- Title(参考訳): 異種システムのための分割アクティブラーニング
- Authors: Cheolhei Lee, Kaiwen Wang, Jianguo Wu, Wenjun Cai, and Xiaowei Yue
- Abstract要約: 本稿では,pgp(partitioned gp)モデルに基づく分断アクティブラーニング戦略を提案する。
グローバル検索は、アクティブラーニングの探索の側面を加速する。
ローカル検索は、ローカルGPモデルによって誘導されるアクティブ学習基準を利用する。
- 参考スコア(独自算出の注目度): 5.331649110169476
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Cost-effective and high-precision surrogate modeling is a cornerstone of
automated industrial and engineering systems. Active learning coupled with
Gaussian process (GP) surrogate modeling is an indispensable tool for demanding
and complex systems, while the existence of heterogeneity in underlying systems
may adversely affect the modeling process. In order to improve the learning
efficiency under the regime, we propose the partitioned active learning
strategy established upon partitioned GP (PGP) modeling. Our strategy seeks the
most informative design point for PGP modeling systematically in twosteps. The
global searching scheme accelerates the exploration aspect of active learning
by investigating the most uncertain design space, and the local searching
exploits the active learning criterion induced by the local GP model. We also
provide numerical remedies to alleviate the computational cost of active
learning, thereby allowing the proposed method to incorporate a large amount of
candidates. The proposed method is applied to numerical simulation and real
world cases endowed with heterogeneities in which surrogate models are
constructed to embed in (i) the cost-efficient automatic fuselage shape control
system; and (ii) the optimal design system of tribocorrosion-resistant alloys.
The results show that our approach outperforms benchmark methods.
- Abstract(参考訳): コスト効率が高く、高精度なサロゲートモデリングは、自動化された産業および工学システムの基盤である。
ガウス過程(GP)に結合したアクティブラーニングは複雑なシステムの要求に欠かせないツールであるが、基礎となるシステムにおける不均一性の存在はモデリングプロセスに悪影響を及ぼす可能性がある。
そこで本研究では,pgp(partmented gp)モデルに基づく分断アクティブラーニング戦略を提案する。
当社の戦略は,pgpモデリングの最も有用な設計ポイントを,体系的に2ステップで求める。
グローバル探索方式は, 最も不確定な設計空間を調査し, アクティブラーニングの探索を加速し, ローカルgpモデルによって引き起こされるアクティブラーニング基準を活用している。
また,能動学習の計算コストを軽減するため,提案手法に大量の候補を組み込むことが可能な数値的な対策も提供する。
提案法を数値シミュレーションに適用し, 費用対効果の高い自動胴体形状制御システム (i) と, トライボコロージョン耐性合金の最適設計システム (ii) にサーロゲートモデルが組み込まれるような不均質性を有する実世界の場合に適用した。
その結果,本手法はベンチマーク手法よりも優れていることがわかった。
関連論文リスト
- Model-Free Active Exploration in Reinforcement Learning [53.786439742572995]
強化学習における探索問題について検討し,新しいモデルフリーソリューションを提案する。
我々の戦略は、最先端の探査アプローチよりも高速に効率的な政策を特定できる。
論文 参考訳(メタデータ) (2024-06-30T19:00:49Z) - Active Learning for Control-Oriented Identification of Nonlinear Systems [26.231260751633307]
本稿では,非線形力学の一般クラスに適した能動学習アルゴリズムの最初の有限サンプル解析について述べる。
ある設定では、アルゴリズムの過剰な制御コストは、対数係数まで、最適な速度を達成する。
我々は,非線形システムの制御におけるアクティブな制御指向探索の利点を示すとともに,シミュレーションにおける我々のアプローチを検証する。
論文 参考訳(メタデータ) (2024-04-13T15:40:39Z) - FLEX: an Adaptive Exploration Algorithm for Nonlinear Systems [6.612035830987298]
本稿では,最適設計に基づく非線形力学探索アルゴリズムFLEXを紹介する。
本ポリシーは,次のステップに関する情報を最大化し,適応探索アルゴリズムを実現する。
FLEXによる性能は競争力があり、計算コストも低い。
論文 参考訳(メタデータ) (2023-04-26T10:20:55Z) - Active Learning of Piecewise Gaussian Process Surrogates [2.5399204134718096]
本研究では,Jump GPサロゲートを能動的に学習する手法を開発した。
ジャンプGPは、設計空間の領域において連続であるが、不連続である。
本研究では,Jump GPモデルのバイアスとばらつきを推定する手法を開発した。
論文 参考訳(メタデータ) (2023-01-20T20:25:50Z) - Latent Variable Representation for Reinforcement Learning [131.03944557979725]
モデルに基づく強化学習のサンプル効率を改善するために、潜在変数モデルが学習、計画、探索をいかに促進するかは理論上、実証上、不明である。
状態-作用値関数に対する潜在変数モデルの表現ビューを提供する。これは、抽出可能な変分学習アルゴリズムと楽観主義/悲観主義の原理の効果的な実装の両方を可能にする。
特に,潜伏変数モデルのカーネル埋め込みを組み込んだUPB探索を用いた計算効率の良い計画アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-12-17T00:26:31Z) - Active Learning of Markov Decision Processes using Baum-Welch algorithm
(Extended) [0.0]
本稿では,マルコフ決定過程とマルコフ連鎖を学習するためのBaum-Welchアルゴリズムを再検討し,適応する。
本研究では,本手法を最先端のツールと実証的に比較し,提案手法が正確なモデルを得るために必要な観測回数を大幅に削減できることを実証する。
論文 参考訳(メタデータ) (2021-10-06T18:54:19Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Model-free Representation Learning and Exploration in Low-rank MDPs [64.72023662543363]
低位mdpに対して,最初のモデルフリー表現学習アルゴリズムを提案する。
主要なアルゴリズムの貢献は新しいミニマックス表現の学習の目的です。
結果は複雑な環境にスケールする一般的な関数近似を収容できます。
論文 参考訳(メタデータ) (2021-02-14T00:06:54Z) - Localized active learning of Gaussian process state space models [63.97366815968177]
多くの共通制御アプリケーションにおいて、優れた性能を達成するためには、グローバルに正確なモデルを必要としない。
本稿では,状態-作用空間の有界部分集合上の正確なモデルを得ることを目的としたガウス過程状態空間モデルに対する能動的学習戦略を提案する。
モデル予測制御を用いることで、探索中に収集した情報を統合し、探索戦略を適応的に改善する。
論文 参考訳(メタデータ) (2020-05-04T05:35:02Z) - Information Theoretic Model Predictive Q-Learning [64.74041985237105]
本稿では,情報理論的MPCとエントロピー正規化RLとの新たな理論的関連性を示す。
バイアスモデルを利用したQ-ラーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2019-12-31T00:29:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。