論文の概要: Meta-active Learning in Probabilistically-Safe Optimization
- arxiv url: http://arxiv.org/abs/2007.03742v1
- Date: Tue, 7 Jul 2020 19:14:06 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 18:56:39.208591
- Title: Meta-active Learning in Probabilistically-Safe Optimization
- Title(参考訳): 確率的安全最適化におけるメタアクティブ学習
- Authors: Mariah L. Schrum, Mark Connolly, Eric Cole, Mihir Ghetiya, Robert
Gross, Matthew C. Gombolay
- Abstract要約: 本稿では,システムダイナミクスと最適構成を効率的に学習するための,確率論的に安全なメタアクティブ学習手法を提案する。
我々は,動的に変化する高次元システムを制御するために,能動的学習のための新しい最先端技術を構築した。
本研究では,ラットの脳深部刺激に対する最適パラメータ設定を学習し,不必要な副作用を回避できることを実証する。
- 参考スコア(独自算出の注目度): 6.459215652021235
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Learning to control a safety-critical system with latent dynamics (e.g. for
deep brain stimulation) requires taking calculated risks to gain information as
efficiently as possible. To address this problem, we present a
probabilistically-safe, meta-active learning approach to efficiently learn
system dynamics and optimal configurations. We cast this problem as
meta-learning an acquisition function, which is represented by a Long-Short
Term Memory Network (LSTM) encoding sampling history. This acquisition function
is meta-learned offline to learn high quality sampling strategies. We employ a
mixed-integer linear program as our policy with the final, linearized layers of
our LSTM acquisition function directly encoded into the objective to trade off
expected information gain (e.g., improvement in the accuracy of the model of
system dynamics) with the likelihood of safe control. We set a new
state-of-the-art in active learning for control of a high-dimensional system
with altered dynamics (i.e., a damaged aircraft), achieving a 46% increase in
information gain and a 20% speedup in computation time over baselines.
Furthermore, we demonstrate our system's ability to learn the optimal parameter
settings for deep brain stimulation in a rat's brain while avoiding unwanted
side effects (i.e., triggering seizures), outperforming prior state-of-the-art
approaches with a 58% increase in information gain. Additionally, our algorithm
achieves a 97% likelihood of terminating in a safe state while losing only 15%
of information gain.
- Abstract(参考訳): 潜在力学(例えば深部脳刺激)を持つ安全クリティカルシステムを制御するための学習は、できるだけ効率的に情報を得るために計算されたリスクを取る必要がある。
そこで本研究では,システムダイナミクスと最適構成を効率的に学習するための確率論的に安全なメタアクティブ学習手法を提案する。
我々は,この問題を,サンプリング履歴を符号化したLong-Short Term Memory Network (LSTM) で表される取得関数のメタラーニングとして用いた。
この取得機能は、高品質なサンプリング戦略を学ぶために、オフラインでメタ学習される。
我々は, lstm取得関数の最終的な線形化層を, 期待情報ゲイン(例えば, システムダイナミクスのモデル精度の向上)を, 安全な制御の可能性をトレードオフする目的で直接エンコードした, 混合整数線形プログラムをポリシとして採用する。
本研究では,情報利得の46%向上とベースライン上の計算時間の20%の高速化を実現するために,動的に変化した高次元システム(すなわち損傷航空機)を制御するための,アクティブラーニングにおける新たな最先端技術を設定した。
さらに,ラット脳の深部脳刺激に対する最適なパラメータ設定を学習する能力を示すとともに,望ましくない副作用(つまり発作を引き起こす)を避けつつ,情報獲得率を58%向上させ,先行研究を上回った。
さらに,このアルゴリズムは,情報ゲインの15%しか失わず,安全な状態で終了する確率が97%に達する。
関連論文リスト
- Active Learning for Derivative-Based Global Sensitivity Analysis with Gaussian Processes [70.66864668709677]
高価なブラックボックス関数のグローバル感度解析におけるアクティブラーニングの問題点を考察する。
関数評価は高価であるため,最も価値の高い実験資源の優先順位付けにアクティブラーニングを利用する。
本稿では,デリバティブに基づくグローバル感度測定の重要量を直接対象とする,新たな能動的学習獲得関数を提案する。
論文 参考訳(メタデータ) (2024-07-13T01:41:12Z) - Data-Driven Permissible Safe Control with Barrier Certificates [11.96747040086603]
本稿では,未知のダイナミクスを持つシステムのデータから,安全戦略の最大セットを特定する手法を提案する。
ケーススタディでは、システム学習のためのデータセットのサイズが大きくなると、許容可能な戦略セットが大きくなることが示されている。
論文 参考訳(メタデータ) (2024-04-30T18:32:24Z) - MPC of Uncertain Nonlinear Systems with Meta-Learning for Fast Adaptation of Neural Predictive Models [6.031205224945912]
ニューラル状態空間モデル(NSSM)は、ディープエンコーダネットワークがデータから非線形性を学ぶ非線形系を近似するために用いられる。
これにより非線形系を潜在空間の線形系に変換し、モデル予測制御(MPC)を用いて効果的な制御動作を決定する。
論文 参考訳(メタデータ) (2024-04-18T11:29:43Z) - Improving Performance in Continual Learning Tasks using Bio-Inspired
Architectures [4.2903672492917755]
我々は,シナプスの可塑性機構とニューロ変調を組み込んだ,生物学的にインスパイアされた軽量ニューラルネットワークアーキテクチャを開発した。
提案手法により,Split-MNIST,Split-CIFAR-10,Split-CIFAR-100データセット上でのオンライン連続学習性能が向上する。
さらに,鍵設計概念を他のバックプロパゲーションに基づく連続学習アルゴリズムに統合することにより,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-08-08T19:12:52Z) - Learning Large-scale Neural Fields via Context Pruned Meta-Learning [60.93679437452872]
本稿では,大規模ニューラルネットワーク学習のための最適化に基づくメタラーニング手法を提案する。
メタテスト時間における勾配再スケーリングは、非常に高品質なニューラルネットワークの学習を可能にすることを示す。
我々のフレームワークは、モデルに依存しない、直感的で、実装が容易であり、幅広い信号に対する大幅な再構成改善を示す。
論文 参考訳(メタデータ) (2023-02-01T17:32:16Z) - Anticipating the Long-Term Effect of Online Learning in Control [75.6527644813815]
AntLerは、学習を予想する学習ベースの制御法則の設計アルゴリズムである。
AntLer は確率 1 と任意に最適な解を近似することを示す。
論文 参考訳(メタデータ) (2020-07-24T07:00:14Z) - Reinforcement Learning with Fast Stabilization in Linear Dynamical
Systems [91.43582419264763]
未知の安定化線形力学系におけるモデルベース強化学習(RL)について検討する。
本研究では,環境を効果的に探索することで,基盤システムの高速安定化を証明できるアルゴリズムを提案する。
提案アルゴリズムはエージェント環境相互作用の時間ステップで$tildemathcalO(sqrtT)$ regretを達成した。
論文 参考訳(メタデータ) (2020-07-23T23:06:40Z) - Meta-Gradient Reinforcement Learning with an Objective Discovered Online [54.15180335046361]
本稿では,深層ニューラルネットワークによって柔軟にパラメータ化される,自己目的のメタ段階的降下に基づくアルゴリズムを提案する。
目的はオンラインで発見されるため、時間とともに変化に適応することができる。
Atari Learning Environmentでは、メタグラディエントアルゴリズムが時間とともに適応して、より効率よく学習する。
論文 参考訳(メタデータ) (2020-07-16T16:17:09Z) - Neuromodulated Neural Architectures with Local Error Signals for
Memory-Constrained Online Continual Learning [4.2903672492917755]
我々は,局所学習とニューロ変調を取り入れた,生物学的にインスパイアされた軽量ニューラルネットワークアーキテクチャを開発した。
一つの課題と連続的な学習環境の両方にアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-07-16T07:41:23Z) - Chance-Constrained Trajectory Optimization for Safe Exploration and
Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。
本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-05-09T05:57:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。