論文の概要: An Improved Data Augmentation Scheme for Model Predictive Control Policy
Approximation
- arxiv url: http://arxiv.org/abs/2303.05607v2
- Date: Mon, 29 May 2023 09:53:54 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-31 01:07:50.122194
- Title: An Improved Data Augmentation Scheme for Model Predictive Control Policy
Approximation
- Title(参考訳): モデル予測制御政策近似のための改良データ拡張方式
- Authors: Dinesh Krishnamoorthy
- Abstract要約: MPCポリシー近似のための感度に基づくデータ拡張フレームワークを提案する。
不正確なサンプルで設定したトレーニングデータセットの増大による誤差は、近隣の規模で増大した。
本稿では,ユーザの定義した精度のレベルを強制する予測器・相関器のステップに基づく改良されたデータ拡張手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper considers the problem of data generation for MPC policy
approximation. Learning an approximate MPC policy from expert demonstrations
requires a large data set consisting of optimal state-action pairs, sampled
across the feasible state space. Yet, the key challenge of efficiently
generating the training samples has not been studied widely. Recently, a
sensitivity-based data augmentation framework for MPC policy approximation was
proposed, where the parametric sensitivities are exploited to cheaply generate
several additional samples from a single offline MPC computation. The error due
to augmenting the training data set with inexact samples was shown to increase
with the size of the neighborhood around each sample used for data
augmentation. Building upon this work, this letter paper presents an improved
data augmentation scheme based on predictor-corrector steps that enforces a
user-defined level of accuracy, and shows that the error bound of the augmented
samples are independent of the size of the neighborhood used for data
augmentation.
- Abstract(参考訳): 本稿では,mpc政策近似のためのデータ生成の問題について考察する。
専門家による実証から近似的なMPCポリシーを学習するには、可能な状態空間にわたってサンプリングされる最適な状態-作用ペアからなる大きなデータセットが必要である。
しかし、効率的にトレーニングサンプルを生成するという重要な課題は広く研究されていない。
近年,パラメトリックセンシティビティを利用して単一のオフラインmpc計算から複数のサンプルを安価に生成する,mpcポリシー近似のための感度に基づくデータ拡張フレームワークが提案されている。
不定値サンプルで設定したトレーニングデータセットの増大に伴う誤差は,データ拡張に使用するサンプルの周囲の面積に比例して増大した。
本研究を基礎として,ユーザ定義の精度を強制する予測者補正ステップに基づく改良データ拡張スキームを提示し,データ拡張に用いる近傍のサイズに依存しない拡張サンプルの誤差境界を示す。
関連論文リスト
- Learning Augmentation Policies from A Model Zoo for Time Series Forecasting [58.66211334969299]
本稿では,強化学習に基づく学習可能なデータ拡張手法であるAutoTSAugを紹介する。
限界サンプルを学習可能なポリシーで強化することにより、AutoTSAugは予測性能を大幅に改善する。
論文 参考訳(メタデータ) (2024-09-10T07:34:19Z) - Geometry-Aware Instrumental Variable Regression [56.16884466478886]
本稿では,データ導出情報によるデータ多様体の幾何を考慮した移動型IV推定器を提案する。
本手法のプラグイン・アンド・プレイ実装は,標準設定で関連する推定器と同等に動作する。
論文 参考訳(メタデータ) (2024-05-19T17:49:33Z) - Simulation-Enhanced Data Augmentation for Machine Learning Pathloss
Prediction [9.664420734674088]
本稿では,機械学習パスロス予測のための新しいシミュレーション強化データ拡張手法を提案する。
本手法は,細胞被覆シミュレータから生成した合成データと,独立して収集した実世界のデータセットを統合する。
合成データの統合は、異なる環境におけるモデルの一般化可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-02-03T00:38:08Z) - Tackling Diverse Minorities in Imbalanced Classification [80.78227787608714]
不均衡データセットは、様々な現実世界のアプリケーションで一般的に見られ、分類器の訓練において重要な課題が提示されている。
マイノリティクラスとマイノリティクラスの両方のデータサンプルを混合することにより、反復的に合成サンプルを生成することを提案する。
提案するフレームワークの有効性を,7つの公開ベンチマークデータセットを用いて広範な実験により実証する。
論文 参考訳(メタデータ) (2023-08-28T18:48:34Z) - Personalized Federated Learning under Mixture of Distributions [98.25444470990107]
本稿では,ガウス混合モデル(GMM)を用いたPFL(Personalized Federated Learning)を提案する。
FedGMMはオーバーヘッドを最小限に抑え、新しいクライアントに適応する付加的なアドバンテージを持ち、不確実な定量化を可能にします。
PFL分類と新しいサンプル検出の両方において, 合成データセットとベンチマークデータセットの実証評価により, 提案手法の優れた性能を示した。
論文 参考訳(メタデータ) (2023-05-01T20:04:46Z) - SEAM: Searching Transferable Mixed-Precision Quantization Policy through
Large Margin Regularization [50.04951511146338]
混合精度量子化(MPQ)は各層に対して最適なビット幅割り当てを求めるのに時間を要する。
本稿では,小規模なプロキシデータセットを用いて効率的なMPQポリシーを効率的に検索する手法を提案する。
論文 参考訳(メタデータ) (2023-02-14T05:47:45Z) - MAPS: A Noise-Robust Progressive Learning Approach for Source-Free
Domain Adaptive Keypoint Detection [76.97324120775475]
クロスドメインキーポイント検出方法は、常に適応中にソースデータにアクセスする必要がある。
本稿では、ターゲット領域に十分に訓練されたソースモデルのみを提供する、ソースフリーなドメイン適応キーポイント検出について考察する。
論文 参考訳(メタデータ) (2023-02-09T12:06:08Z) - Debiasing In-Sample Policy Performance for Small-Data, Large-Scale
Optimization [4.554894288663752]
本稿では,データ駆動最適化におけるポリシのアウト・オブ・サンプル性能の新たな推定法を提案する。
クロスバリデーションとは異なり、我々の手法はテストセットのデータを犠牲にするのを避ける。
我々は,小規模・大規模システムにおける推定器の性能を実証する。
論文 参考訳(メタデータ) (2021-07-26T19:00:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。