論文の概要: Neural optimal feedback control with local learning rules
- arxiv url: http://arxiv.org/abs/2111.06920v1
- Date: Fri, 12 Nov 2021 20:02:00 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-08 07:44:25.359051
- Title: Neural optimal feedback control with local learning rules
- Title(参考訳): 局所学習ルールを用いたニューラル最適フィードバック制御
- Authors: Johannes Friedrich, Siavash Golkar, Shiva Farashahi, Alexander Genkin,
Anirvan M. Sengupta, Dmitri B. Chklovskii
- Abstract要約: 運動制御の大きな問題は、脳がどのように遅延と雑音の刺激に直面して適切な動きを計画し実行するかを理解することである。
本稿では,適応カルマンフィルタとモデル自由制御手法を組み合わせた新しいオンラインアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 67.5926699124528
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A major problem in motor control is understanding how the brain plans and
executes proper movements in the face of delayed and noisy stimuli. A prominent
framework for addressing such control problems is Optimal Feedback Control
(OFC). OFC generates control actions that optimize behaviorally relevant
criteria by integrating noisy sensory stimuli and the predictions of an
internal model using the Kalman filter or its extensions. However, a
satisfactory neural model of Kalman filtering and control is lacking because
existing proposals have the following limitations: not considering the delay of
sensory feedback, training in alternating phases, and requiring knowledge of
the noise covariance matrices, as well as that of systems dynamics. Moreover,
the majority of these studies considered Kalman filtering in isolation, and not
jointly with control. To address these shortcomings, we introduce a novel
online algorithm which combines adaptive Kalman filtering with a model free
control approach (i.e., policy gradient algorithm). We implement this algorithm
in a biologically plausible neural network with local synaptic plasticity
rules. This network performs system identification and Kalman filtering,
without the need for multiple phases with distinct update rules or the
knowledge of the noise covariances. It can perform state estimation with
delayed sensory feedback, with the help of an internal model. It learns the
control policy without requiring any knowledge of the dynamics, thus avoiding
the need for weight transport. In this way, our implementation of OFC solves
the credit assignment problem needed to produce the appropriate sensory-motor
control in the presence of stimulus delay.
- Abstract(参考訳): 運動制御の大きな問題は、脳がどのように遅延と雑音の刺激に直面して適切な動きを計画し実行するかを理解することである。
このような制御問題に対処する主要なフレームワークは、最適フィードバック制御(OFC)である。
OFCは、ノイズ知覚刺激とカルマンフィルタまたはその拡張を用いた内部モデルの予測を統合することで、行動関連基準を最適化する制御アクションを生成する。
しかしながら、カルマンフィルタリングと制御の十分なニューラルモデルには、感覚フィードバックの遅れ、交互位相のトレーニング、ノイズ共分散行列の知識、システムダイナミクスの知識など、既存の提案には次のような制限があるため、不足している。
さらに、これらの研究の大多数はカルマンフィルターを単独で検討し、制御と共同ではない。
これらの欠点に対処するために,適応カルマンフィルタとモデル自由制御手法(すなわちポリシー勾配アルゴリズム)を組み合わせた新しいオンラインアルゴリズムを提案する。
我々はこのアルゴリズムを,局所的なシナプス可塑性規則を持つ生体可塑性ニューラルネットワークに実装する。
このネットワークは、異なる更新ルールの複数のフェーズやノイズ共分散の知識を必要とせずに、システム識別とカルマンフィルタリングを行う。
内部モデルの助けを借りて、遅延した感覚フィードバックで状態推定を行うことができる。
動力学の知識を必要とせずに制御方針を学習し、重量輸送の必要性を避ける。
このようにして、OFCの実装は、刺激遅延の有無で適切な感覚運動制御を生成するために必要なクレジット割り当て問題を解決する。
関連論文リスト
- Distributed Leader Follower Formation Control of Mobile Robots based on
Bioinspired Neural Dynamics and Adaptive Sliding Innovation Filter [14.66072990853587]
バイオインスパイアされた神経力学に基づくバックステッピングとスライディングモード制御ハイブリッド形成制御法を提案する。
提案した制御戦略は,従来のバックステッピング設計に存在する非現実的な速度ジャンプ問題を解決する。
提案手法の有効性と有効性を示すため,複数のシミュレーションを行った。
論文 参考訳(メタデータ) (2023-05-03T17:29:46Z) - Neuromorphic Control using Input-Weighted Threshold Adaptation [13.237124392668573]
比例積分微分(PID)コントローラのような基本的な低レベルコントローラでさえ複製することは依然として困難である。
本稿では,学習中に比例経路,積分経路,微分経路を組み込んだニューロモルフィック制御器を提案する。
本研究では,外乱の存在下での飛行によるバイオインスパイアされたアルゴリズムの安定性を実証する。
論文 参考訳(メタデータ) (2023-04-18T07:21:24Z) - Incorporating Recurrent Reinforcement Learning into Model Predictive
Control for Adaptive Control in Autonomous Driving [11.67417895998434]
モデル予測制御(MPC)は、強力な制御技術として自律運転タスクに大きな注目を集めている。
本稿では,この問題を部分的に観測されたマルコフ決定過程(POMDP)として再検討する。
次に、最適かつ適応的な制御のために、リカレント強化学習(RRL)を通して、動的モデルのパラメータを継続的に適応させるリカレントポリシーを学習する。
論文 参考訳(メタデータ) (2023-01-30T22:11:07Z) - Design of a Supervisory Control System for Autonomous Operation of
Advanced Reactors [0.0]
本研究は自律運転の制御面に焦点を当てる。
システム内では、データ駆動モデリング、物理に基づく状態観察、古典的な制御アルゴリズムが統合されている。
320MWのフッ化物冷却高温Pebbleベッドリアクターは、制御システムの実証のための設計基盤である。
論文 参考訳(メタデータ) (2022-09-09T14:48:34Z) - Adaptation through prediction: multisensory active inference torque
control [0.0]
本稿では,産業用アームのための多感能動型トルクコントローラを提案する。
私たちのコントローラは、予測的脳仮説にインスパイアされ、現在のアクティブな推論アプローチの能力を向上します。
論文 参考訳(メタデータ) (2021-12-13T16:03:18Z) - Adaptive Low-Pass Filtering using Sliding Window Gaussian Processes [71.23286211775084]
ガウス過程回帰に基づく適応型低域通過フィルタを提案する。
本研究では,提案手法の誤差が一様境界であることを示す。
論文 参考訳(メタデータ) (2021-11-05T17:06:59Z) - KalmanNet: Neural Network Aided Kalman Filtering for Partially Known
Dynamics [84.18625250574853]
KalmanNetは、データから学習し、非線形力学の下でKalmanフィルタを実行するリアルタイム状態推定器である。
我々は、KalmanNetが非線形性とモデルミスマッチを克服し、古典的なフィルタリング手法より優れていることを数値的に示す。
論文 参考訳(メタデータ) (2021-07-21T12:26:46Z) - Neural Kalman Filtering [62.997667081978825]
カルマンフィルタの勾配差近似は,差分重み付き予測誤差を持つ局所計算のみを必要とすることを示す。
また、同じスキームの下では、ヘビアン可塑性に直接対応する学習規則で動的モデルを適応的に学習することが可能であることを示す。
論文 参考訳(メタデータ) (2021-02-19T16:43:15Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z) - Adaptive Control and Regret Minimization in Linear Quadratic Gaussian
(LQG) Setting [91.43582419264763]
我々は不確実性に直面した楽観主義の原理に基づく新しい強化学習アルゴリズムLqgOptを提案する。
LqgOptはシステムのダイナミクスを効率的に探索し、モデルのパラメータを信頼区間まで推定し、最も楽観的なモデルのコントローラをデプロイする。
論文 参考訳(メタデータ) (2020-03-12T19:56:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。