論文の概要: Spiking Neural Networks for Continuous Control via End-to-End Model-Based Learning
- arxiv url: http://arxiv.org/abs/2509.05356v2
- Date: Tue, 16 Sep 2025 11:40:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-17 15:46:32.987794
- Title: Spiking Neural Networks for Continuous Control via End-to-End Model-Based Learning
- Title(参考訳): 終端モデルに基づく学習による連続制御のためのスパイキングニューラルネットワーク
- Authors: Justus Huebotter, Pablo Lanillos, Marcel van Gerven, Serge Thill,
- Abstract要約: 完全なスパイクアーキテクチャをエンドツーエンドでトレーニングすることで、連続環境において複数の自由度を持つロボットアームを制御できることが示される。
我々の予測制御フレームワークは、Leaky Integrate-and-Fireのダイナミクスと代理勾配を組み合わせ、ダイナミックス予測のためのフォワードモデルとゴール指向アクションのためのポリシーネットワークを協調的に最適化する。
その結果、SNNは安定したトレーニングと正確なトルク制御を達成でき、高次元モータタスクの生存性を確立することができることがわかった。
- 参考スコア(独自算出の注目度): 0.7366393875723448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent progress in training spiking neural networks (SNNs) for classification, their application to continuous motor control remains limited. Here, we demonstrate that fully spiking architectures can be trained end-to-end to control robotic arms with multiple degrees of freedom in continuous environments. Our predictive-control framework combines Leaky Integrate-and-Fire dynamics with surrogate gradients, jointly optimizing a forward model for dynamics prediction and a policy network for goal-directed action. We evaluate this approach on both a planar 2D reaching task and a simulated 6-DOF Franka Emika Panda robot. Results show that SNNs can achieve stable training and accurate torque control, establishing their viability for high-dimensional motor tasks. An extensive ablation study highlights the role of initialization, learnable time constants, and regularization in shaping training dynamics. We conclude that while stable and effective control can be achieved, recurrent spiking networks remain highly sensitive to hyperparameter settings, underscoring the importance of principled design choices.
- Abstract(参考訳): スパイクニューラルネットワーク(SNN)の分類訓練は近年進歩しているが、連続運動制御への応用は依然として限られている。
ここでは、完全なスパイクアーキテクチャをエンドツーエンドでトレーニングして、連続環境において複数の自由度を持つロボットアームを制御できることを実証する。
我々の予測制御フレームワークは、Leaky Integrate-and-Fireのダイナミクスと代理勾配を組み合わせ、ダイナミックス予測のためのフォワードモデルとゴール指向アクションのためのポリシーネットワークを協調的に最適化する。
本研究では,平面2次元リーチタスクと,Franka Emika Pandaロボットのシミュレーションを行った。
その結果、SNNは安定したトレーニングと正確なトルク制御を達成でき、高次元モータタスクの生存性を確立することができることがわかった。
広範囲にわたるアブレーション研究は、初期化、学習可能な時間定数、そして整形トレーニングダイナミクスにおける正規化の役割を強調している。
安定かつ効果的に制御できるが、リカレントスパイクネットワークは高パラメータ設定に非常に敏感であり、設計選択の重要性を強調できると結論付けている。
関連論文リスト
- Langevin Flows for Modeling Neural Latent Dynamics [81.81271685018284]
逐次変分自動エンコーダであるLangevinFlowを導入し、潜伏変数の時間的進化をアンダーダム化したLangevin方程式で制御する。
われわれのアプローチは、慣性、減衰、学習されたポテンシャル関数、力などの物理的事前を組み込んで、ニューラルネットワークにおける自律的および非自律的プロセスの両方を表現する。
本手法は,ロレンツ誘引器によって生成される合成神経集団に対する最先端のベースラインより優れる。
論文 参考訳(メタデータ) (2025-07-15T17:57:48Z) - Context-Aware Deep Lagrangian Networks for Model Predictive Control [17.06619330822293]
本研究では,Deep Lagrangian Networks (DeLaN)を拡張し,コンテキスト認識を実現する。
また、DeLaNと残留力学モデルを組み合わせることで、ロボットの名目モデルが一般的に利用可能であるという事実を活用する。
本手法は, ベースラインで達成した21%の改善に比べ, エンドエフェクタ追跡誤差を39%削減する。
論文 参考訳(メタデータ) (2025-06-18T08:26:30Z) - Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [59.65431931190187]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上で低レイテンシかつエネルギー効率の意思決定を提供する。
連続制御のためのほとんどの連続制御アルゴリズムは、人工ニューラルネットワーク(ANN)のために設計されている。
このミスマッチはSNNのトレーニングを不安定にし、性能を劣化させる。
離散SNNと連続制御アルゴリズムのギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T03:08:03Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Provably Safe Model-Based Meta Reinforcement Learning: An
Abstraction-Based Approach [3.569867801312134]
本研究では,不確実な非線形力学系に対して,確実に安全なニューラルネットワーク(NN)コントローラをトレーニングする問題を考察する。
私たちのアプローチは、トレーニングフェーズ中にNNコントローラのセットを学ぶことです。
タスクが実行時に利用可能になると、我々のフレームワークはこれらのNNコントローラのサブセットを慎重に選択し、最終的なNNコントローラを構成する。
論文 参考訳(メタデータ) (2021-09-03T00:38:05Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Safe Active Dynamics Learning and Control: A Sequential
Exploration-Exploitation Framework [30.58186749790728]
本研究では,力学の不確実性の存在下での安全性を維持するための理論的に正当なアプローチを提案する。
我々のフレームワークは、常に全ての制約の高確率満足度を保証します。
この理論解析は、オンライン適応能力を改善する最終層メタラーニングモデルの2つの正則化を動機付けている。
論文 参考訳(メタデータ) (2020-08-26T17:39:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。