論文の概要: Spiking Neural Networks for Continuous Control via End-to-End Model-Based Learning
- arxiv url: http://arxiv.org/abs/2509.05356v1
- Date: Wed, 03 Sep 2025 12:05:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-09 14:07:03.455158
- Title: Spiking Neural Networks for Continuous Control via End-to-End Model-Based Learning
- Title(参考訳): 終端モデルに基づく学習による連続制御のためのスパイキングニューラルネットワーク
- Authors: Justus Huebotter, Pablo Lanillos, Marcel van Gerven, Serge Thill,
- Abstract要約: 完全なスパイクアーキテクチャをエンドツーエンドでトレーニングすることで、連続環境において複数の自由度を持つロボットアームを制御できることが示される。
我々の予測制御フレームワークは、Leaky Integrate-and-Fireのダイナミクスと代理勾配を組み合わせ、ダイナミックス予測のためのフォワードモデルとゴール指向アクションのためのポリシーネットワークを協調的に最適化する。
その結果、SNNは安定したトレーニングと正確なトルク制御を達成でき、高次元モータタスクの生存性を確立することができることがわかった。
- 参考スコア(独自算出の注目度): 0.7366393875723448
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent progress in training spiking neural networks (SNNs) for classification, their application to continuous motor control remains limited. Here, we demonstrate that fully spiking architectures can be trained end-to-end to control robotic arms with multiple degrees of freedom in continuous environments. Our predictive-control framework combines Leaky Integrate-and-Fire dynamics with surrogate gradients, jointly optimizing a forward model for dynamics prediction and a policy network for goal-directed action. We evaluate this approach on both a planar 2D reaching task and a simulated 6-DOF Franka Emika Panda robot. Results show that SNNs can achieve stable training and accurate torque control, establishing their viability for high-dimensional motor tasks. An extensive ablation study highlights the role of initialization, learnable time constants, and regularization in shaping training dynamics. We conclude that while stable and effective control can be achieved, recurrent spiking networks remain highly sensitive to hyperparameter settings, underscoring the importance of principled design choices.
- Abstract(参考訳): スパイクニューラルネットワーク(SNN)の分類訓練は近年進歩しているが、連続運動制御への応用は依然として限られている。
ここでは、完全なスパイクアーキテクチャをエンドツーエンドでトレーニングして、連続環境において複数の自由度を持つロボットアームを制御できることを実証する。
我々の予測制御フレームワークは、Leaky Integrate-and-Fireのダイナミクスと代理勾配を組み合わせ、ダイナミックス予測のためのフォワードモデルとゴール指向アクションのためのポリシーネットワークを協調的に最適化する。
本研究では,平面2次元リーチタスクと,Franka Emika Pandaロボットのシミュレーションを行った。
その結果、SNNは安定したトレーニングと正確なトルク制御を達成でき、高次元モータタスクの生存性を確立することができることがわかった。
広範囲にわたるアブレーション研究は、初期化、学習可能な時間定数、そして整形トレーニングダイナミクスにおける正規化の役割を強調している。
安定かつ効果的に制御できるが、リカレントスパイクネットワークは高パラメータ設定に非常に敏感であり、設計選択の重要性を強調できると結論付けている。
関連論文リスト
- Context-Aware Deep Lagrangian Networks for Model Predictive Control [17.06619330822293]
本研究では,Deep Lagrangian Networks (DeLaN)を拡張し,コンテキスト認識を実現する。
また、DeLaNと残留力学モデルを組み合わせることで、ロボットの名目モデルが一般的に利用可能であるという事実を活用する。
本手法は, ベースラインで達成した21%の改善に比べ, エンドエフェクタ追跡誤差を39%削減する。
論文 参考訳(メタデータ) (2025-06-18T08:26:30Z) - Auto-Train-Once: Controller Network Guided Automatic Network Pruning from Scratch [72.26822499434446]
オートトレインオース (Auto-Train-Once, ATO) は、DNNの計算コストと記憶コストを自動的に削減するために設計された、革新的なネットワークプルーニングアルゴリズムである。
総合的な収束解析と広範な実験を行い,本手法が様々なモデルアーキテクチャにおける最先端性能を実現することを示す。
論文 参考訳(メタデータ) (2024-03-21T02:33:37Z) - ConCerNet: A Contrastive Learning Based Framework for Automated
Conservation Law Discovery and Trustworthy Dynamical System Prediction [82.81767856234956]
本稿では,DNNに基づく動的モデリングの信頼性を向上させるために,ConCerNetという新しい学習フレームワークを提案する。
本手法は, 座標誤差と保存量の両方において, ベースラインニューラルネットワークよりも一貫して優れていることを示す。
論文 参考訳(メタデータ) (2023-02-11T21:07:30Z) - Active Learning of Discrete-Time Dynamics for Uncertainty-Aware Model Predictive Control [46.81433026280051]
本稿では,非線形ロボットシステムの力学を積極的にモデル化する自己教師型学習手法を提案する。
我々のアプローチは、目に見えない飛行条件に一貫して適応することで、高いレジリエンスと一般化能力を示す。
論文 参考訳(メタデータ) (2022-10-23T00:45:05Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z) - Provably Safe Model-Based Meta Reinforcement Learning: An
Abstraction-Based Approach [3.569867801312134]
本研究では,不確実な非線形力学系に対して,確実に安全なニューラルネットワーク(NN)コントローラをトレーニングする問題を考察する。
私たちのアプローチは、トレーニングフェーズ中にNNコントローラのセットを学ぶことです。
タスクが実行時に利用可能になると、我々のフレームワークはこれらのNNコントローラのサブセットを慎重に選択し、最終的なNNコントローラを構成する。
論文 参考訳(メタデータ) (2021-09-03T00:38:05Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。