論文の概要: Autonomous Reinforcement Learning Robot Control with Intel's Loihi 2 Neuromorphic Hardware
- arxiv url: http://arxiv.org/abs/2512.03911v1
- Date: Wed, 03 Dec 2025 15:56:39 GMT
- ステータス: 情報取得中
- システム内更新日: 2025-12-04 11:56:21.815882
- Title: Autonomous Reinforcement Learning Robot Control with Intel's Loihi 2 Neuromorphic Hardware
- Title(参考訳): IntelのLoihi 2ニューロモルフィックハードウェアを用いた自律強化学習ロボット制御
- Authors: Kenneth Stewart, Roxana Leontie, Samantha Chapin, Joe Hays, Sumit Bam Shrestha, Carl Glen Henshaw,
- Abstract要約: ニューロモルフィックハードウェア上に強化学習訓練されたニューラルネットワークを展開するためのエンドツーエンドパイプラインを提案する。
我々は、完全にシミュレーションで訓練されたANNポリシーを、IntelのLoihi 2アーキテクチャと互換性のあるSDNNに変換することを実証した。
その結果, ロボット制御のためのニューロモルフィックプラットフォームの実現可能性を強調し, エネルギー効率, リアルタイムニューロモルフィック計算への道を開いた。
- 参考スコア(独自算出の注目度): 0.8456719958710218
- License:
- Abstract: We present an end-to-end pipeline for deploying reinforcement learning (RL) trained Artificial Neural Networks (ANNs) on neuromorphic hardware by converting them into spiking Sigma-Delta Neural Networks (SDNNs). We demonstrate that an ANN policy trained entirely in simulation can be transformed into an SDNN compatible with Intel's Loihi 2 architecture, enabling low-latency and energy-efficient inference. As a test case, we use an RL policy for controlling the Astrobee free-flying robot, similar to a previously hardware in space-validated controller. The policy, trained with Rectified Linear Units (ReLUs), is converted to an SDNN and deployed on Intel's Loihi 2, then evaluated in NVIDIA's Omniverse Isaac Lab simulation environment for closed-loop control of Astrobee's motion. We compare execution performance between GPU and Loihi 2. The results highlight the feasibility of using neuromorphic platforms for robotic control and establish a pathway toward energy-efficient, real-time neuromorphic computation in future space and terrestrial robotics applications.
- Abstract(参考訳): 本稿では、ニューラルネットワークをスパイクしたSigma-Delta Neural Networks(SDNN)に変換することにより、ニューロモルフィックハードウェア上に強化学習(RL)訓練ニューラルネットワーク(ANN)をデプロイするためのエンドツーエンドパイプラインを提案する。
我々は、完全にシミュレーションで訓練されたANNポリシーを、IntelのLoihi 2アーキテクチャと互換性のあるSDNNに変換することで、低レイテンシとエネルギー効率の推論を可能にすることを実証した。
テストケースでは、宇宙検証コントローラの以前のハードウェアと同様、Astrobeeフリーフライングロボットを制御するためにRLポリシーを使用します。
Rectified Linear Units (ReLUs) で訓練されたこのポリシーはSDNNに変換され、IntelのLoihi 2にデプロイされ、NVIDIAのOmniverse Isaac Labシミュレーション環境で評価された。
実行性能をGPUとLoihi 2.0を比較した。
その結果,ロボット制御のためのニューロモルフィックプラットフォームの実現可能性を強調し,将来的な空間におけるエネルギー効率,リアルタイムニューロモルフィック計算と地上ロボティクス応用への道を開いた。
関連論文リスト
- Crossing the Sim2Real Gap Between Simulation and Ground Testing to Space Deployment of Autonomous Free-flyer Control [0.12194516968349499]
強化学習(Reinforcement Learning, RL)は、宇宙におけるロボット制御の変革的なポテンシャルを提供する。
国際宇宙ステーション(ISS)の無人飛行ロボット、NASA AstrobeeのRLによる自律制御の初の軌道上でのデモンストレーションを紹介する。
NVIDIAのOmniverse物理シミュレータとカリキュラム学習を使用して、Astrobeeの標準姿勢と翻訳制御を置き換えるために、ディープニューラルネットワークをトレーニングし、微小重力でナビゲートできるようにしました。
論文 参考訳(メタデータ) (2025-12-03T12:33:35Z) - Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [59.65431931190187]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上で低レイテンシかつエネルギー効率の意思決定を提供する。
連続制御のためのほとんどの連続制御アルゴリズムは、人工ニューラルネットワーク(ANN)のために設計されている。
このミスマッチはSNNのトレーニングを不安定にし、性能を劣化させる。
離散SNNと連続制御アルゴリズムのギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T03:08:03Z) - Eventprop training for efficient neuromorphic applications [0.9138341348704225]
我々は,mlGeNNで実装されたイベント駆動イベントプロップアルゴリズムを用いて,GPU上でのスパイクニューラルネットワークのトレーニングパイプラインを提案する。
キーワードスポッティングタスクのベンチマークでは、GPUとLoihi 2の実装の間には精度がほとんど失われていないことが示されている。
Loihi 2でサンプルを分類するのは最大10倍速く、NVIDIA Jetson Orin Nanoより200倍少ないエネルギーを使用する。
論文 参考訳(メタデータ) (2025-03-06T11:38:46Z) - Energy-Efficient On-Board Radio Resource Management for Satellite
Communications via Neuromorphic Computing [59.40731173370976]
本研究は,エネルギー効率のよい脳誘発機械学習モデルのオンボード無線リソース管理への応用について検討する。
関連するワークロードでは、Loihi 2に実装されたスパイクニューラルネットワーク(SNN)の方が精度が高く、CNNベースのリファレンスプラットフォームと比較して消費電力が100ドル以上削減される。
論文 参考訳(メタデータ) (2023-08-22T03:13:57Z) - Active Predicting Coding: Brain-Inspired Reinforcement Learning for
Sparse Reward Robotic Control Problems [79.07468367923619]
ニューラルジェネレーティブ・コーディング(NGC)の神経認知計算フレームワークによるロボット制御へのバックプロパゲーションフリーアプローチを提案する。
我々は、スパース報酬から動的オンライン学習を容易にする強力な予測符号化/処理回路から完全に構築されたエージェントを設計する。
提案するActPCエージェントは,スパース(外部)報酬信号に対して良好に動作し,複数の強力なバックプロップベースのRLアプローチと競合し,性能が優れていることを示す。
論文 参考訳(メタデータ) (2022-09-19T16:49:32Z) - Neuroevolution of a Recurrent Neural Network for Spatial and Working
Memory in a Simulated Robotic Environment [57.91534223695695]
我々は,ラットで観察される行動と神経活動を再現する進化的アルゴリズムを用いて,生物学的に有意なリカレントニューラルネットワーク(RNN)でウェイトを進化させた。
提案手法は, 進化したRNNの動的活動が, 興味深く複雑な認知行動をどのように捉えているかを示す。
論文 参考訳(メタデータ) (2021-02-25T02:13:52Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Reinforcement Learning with Population-Coded Spiking Neural Network
for Continuous Control [0.0]
深層強化学習(DRL)を用いた深層批評家ネットワークと連携して訓練された集団符号化スパイキングアクターネットワーク(PopSAN)を提案する。
我々は、トレーニング済みのPopSANをIntelのLoihiニューロモルフィックチップにデプロイし、本手法をメインストリームのDRLアルゴリズムと比較し、連続的な制御を行った。
本研究はニューロモルフィックコントローラの効率性をサポートし,エネルギー効率とロバスト性の両方が重要である場合,我々のハイブリッドRLをディープラーニングの代替として提案する。
論文 参考訳(メタデータ) (2020-10-19T16:20:45Z) - Smooth Exploration for Robotic Reinforcement Learning [11.215352918313577]
強化学習(Reinforcement Learning, RL)は、ロボットが現実世界との対話からスキルを学ぶことを可能にする。
実際には、Deep RLで使用される非構造的なステップベースの探索は、実際のロボットにジャーキーな動きパターンをもたらす。
本稿では、状態依存探索(SDE)を現在のDeep RLアルゴリズムに適応させることにより、これらの問題に対処する。
論文 参考訳(メタデータ) (2020-05-12T12:28:25Z) - Populations of Spiking Neurons for Reservoir Computing: Closed Loop
Control of a Compliant Quadruped [64.64924554743982]
本稿では,ニューラルネットワークを用いた中央パターン生成機構を実装し,閉ループロボット制御を実現するためのフレームワークを提案する。
本研究では,従順な四足歩行ロボットのシミュレーションモデル上で,予め定義された歩行パターン,速度制御,歩行遷移の学習を実演する。
論文 参考訳(メタデータ) (2020-04-09T14:32:49Z) - Reinforcement co-Learning of Deep and Spiking Neural Networks for
Energy-Efficient Mapless Navigation with Neuromorphic Hardware [0.0]
スパイキングニューラルネットワークのエネルギー効率と深部強化学習(DRL)の最適性を組み合わせたニューロモルフィックアプローチを提案する。
筆者らのフレームワークは,スパイクアクターネットワーク(SAN)と深い批判ネットワークから構成されており,この2つのネットワークは勾配降下を用いて共同で訓練されている。
アプローチを評価するため、トレーニング済みのSANをIntelのLoihiニューロモルフィックプロセッサにデプロイした。
論文 参考訳(メタデータ) (2020-03-02T19:39:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。