論文の概要: A Neuromorphic Reinforcement Learning Framework for Efficient Pathfinding in Robotic Mobile Fulfillment Systems
- arxiv url: http://arxiv.org/abs/2606.20031v2
- Date: Mon, 22 Jun 2026 02:52:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-24 16:10:14.906362
- Title: A Neuromorphic Reinforcement Learning Framework for Efficient Pathfinding in Robotic Mobile Fulfillment Systems
- Title(参考訳): ロボットモバイルフルフィルメントシステムにおける効率的なパスフィニングのためのニューロモルフィック強化学習フレームワーク
- Authors: Junzhe Xu, Zecui Zeng, Lusong Li, Yuetong Fang, Renjing Xu,
- Abstract要約: SDQN-RMFSは、RL学習ポリシーの高忠実な展開を実現するエンドツーエンドフレームワークである。
スパースイベントによってのみ起動されるコンピューティングによって、このフレームワークは超低消費電力のRobotic Mobile Fulfillment Systemsをアンロックする。
- 参考スコア(独自算出の注目度): 17.217026932751132
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dynamic environmental changes, confined workspaces, and stringent real-time constraints make pathfinding in Robotic Mobile Fulfillment Systems (RMFS) a challenging problem for conventional search- and rule-based methods, which typically suffer from high computational complexity and long decision latency. While reinforcement learning (RL) has emerged as a powerful alternative, deploying learned policies with extreme energy efficiency on resource-constrained hardware remains an open challenge. We present SDQN-RMFS, an end-to-end framework that achieves high-fidelity deployment of an RL-trained policy from a full-precision artificial neural network (ANN) through to a neuromorphic chip. By computing only when triggered by sparse events, this framework unlocks ultra-low-power RMFS pathfinding. Our full-stack pipeline operates as follows: an ANN policy is first efficiently trained via a collision-allowing strategy to densify informative trajectories, and then converted into a spiking neural network (SNN) via a hard-label knowledge distillation approach. This effectively addresses the output distribution mismatch, preserving policy capability across the ANN-to-SNN pipeline while substantially reducing inference latency. Hardware experiments demonstrate up to 11,281$\times$ energy savings and a nearly two-fold reduction in latency compared to a high-performance GPU baseline, while maintaining decision quality on par with the original trained policy. These results establish physical neuromorphic inference as a practical and energy-sustainable pathway for large-scale RMFS operations.
- Abstract(参考訳): 動的環境変化, 制限されたワークスペース, 厳密なリアルタイム制約は, 従来の検索法やルールベースの手法ではパスフィリングを困難にしている。
強化学習(RL)が強力な代替手段として登場したが、リソース制約のあるハードウェアに極端なエネルギー効率で学習ポリシーをデプロイすることは、依然としてオープンな課題である。
SDQN-RMFSは,完全精度人工ニューラルネットワーク(ANN)からニューロモルフィックチップへのRL学習ポリシーの高忠実な展開を実現するエンドツーエンドフレームワークである。
スパースイベントによってのみ起動される計算により、このフレームワークは超低消費電力のRMFSパスフィンディングをアンロックする。
当社のフルスタックパイプラインは,まず,情報トラジェクトリを密度化するための衝突許容戦略を通じて,ANNポリシを効率的にトレーニングし,硬ラベルの知識蒸留アプローチによってスパイキングニューラルネットワーク(SNN)に変換する。
これにより、ANN-to-SNNパイプライン間のポリシ機能を保ちながら、推論遅延を大幅に低減する出力分布ミスマッチに効果的に対処できる。
ハードウェアの実験では、11,281ドルの省エネと、パフォーマンスの高いGPUベースラインに比べて2倍近いレイテンシの削減が実証されている。
これらの結果は,大規模なRMFS手術のための実用的でエネルギー持続可能な経路として,物理的ニューロモルフィック推論を確立した。
関連論文リスト
- Brain-Inspired Multimodal Spiking Neural Network for Image-Text Retrieval [79.04396446873932]
スパイキングニューラルネットワーク(SNN)は、最近、視覚的タスクとテキストタスクに強い可能性を示している。
画像テキスト検索(ITR)のようなマルチモーダルアプリケーションのための直接訓練され、低エネルギーで高性能なSNNを構築することは、依然として非常に困難である。
我々は脳にインスパイアされたクロスモーダルスパイク・フュージョン・ネットワーク(CMSF)を提案し、初めてITRに適用した。
論文 参考訳(メタデータ) (2026-03-25T08:41:07Z) - A Latency Coding Framework for Deep Spiking Neural Networks with Ultra-Low Latency [51.75891259753546]
スパイキングニューラルネットワーク(SNN)は、エネルギー効率のよいニューラル処理に重要な可能性を持つ生物学的にインスパイアされたコンピューティングパラダイムを提供する。
Time-To-First-Spike (TTFS)コーディングは、ニューロンの最初のスパイクの正確なタイミングを通じて情報を符号化する。
TTFSモデルには効率的なトレーニング方法がなく、高い推論遅延と限られたパフォーマンスに悩まされている。
本稿では,バックプロパゲーション・スロー・タイム(BPTT)アルゴリズムを用いて,深層TTFS符号化SNNの効率的なトレーニングを可能にする包括的フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-24T13:52:03Z) - Population-Coded Spiking Neural Networks for High-Dimensional Robotic Control [0.9916299448089259]
本稿では,集団符号化スパイキングニューラルネットワーク(SNN)と深層強化学習(DRL)を組み合わせた新しい枠組みを提案する。
我々は,従来のニューラルネットワーク(ANN)と比較して最大96.10%の省エネを実現し,比較制御性能を維持した。
これらの結果は、資源制約されたアプリケーションにおけるエネルギー効率、高性能なロボット制御のための有望なソリューションとして、人口コード付きSNNを位置づけている。
論文 参考訳(メタデータ) (2025-10-12T09:27:25Z) - FFGAF-SNN: The Forward-Forward Based Gradient Approximation Free Training Framework for Spiking Neural Networks [7.310627646090302]
Spiking Neural Networks (SNN)は、エネルギー効率の良いニューロモルフィックコンピューティングのための生物学的に妥当なフレームワークを提供する。
SNNを効率よく訓練することは困難である。
本稿では,スパイキングニューラルネットワークのためのフォワードフォワード(FF)に基づく勾配近似自由トレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-31T15:22:23Z) - Learning to Control Dynamical Agents via Spiking Neural Networks and Metropolis-Hastings Sampling [1.0533738606966752]
Spiking Neural Networks(SNN)は、リアルタイム制御システムのための従来のDeep Neural Networks(DNN)に代わる、生物学的にインスパイアされたエネルギー効率の高い代替手段を提供する。
ベイズ推論手法であるメトロポリス・ハスティングスサンプリングを用いて,RL環境における動的エージェント制御のためのSNNのトレーニングを行う最初のフレームワークについて紹介する。
論文 参考訳(メタデータ) (2025-07-13T08:50:00Z) - Proxy Target: Bridging the Gap Between Discrete Spiking Neural Networks and Continuous Control [59.65431931190187]
スパイキングニューラルネットワーク(SNN)は、ニューロモルフィックハードウェア上で低レイテンシかつエネルギー効率の意思決定を提供する。
連続制御のためのほとんどの連続制御アルゴリズムは、人工ニューラルネットワーク(ANN)のために設計されている。
このミスマッチはSNNのトレーニングを不安定にし、性能を劣化させる。
離散SNNと連続制御アルゴリズムのギャップを埋める新しいプロキシターゲットフレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-30T03:08:03Z) - Joint Admission Control and Resource Allocation of Virtual Network Embedding via Hierarchical Deep Reinforcement Learning [69.00997996453842]
本稿では,仮想ネットワークの埋め込みにおいて,入出力制御と資源配分を併用して学習する深層強化学習手法を提案する。
HRL-ACRAは,受入率と長期平均収益の両面で,最先端のベースラインを上回っていることを示す。
論文 参考訳(メタデータ) (2024-06-25T07:42:30Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - Implicit Stochastic Gradient Descent for Training Physics-informed
Neural Networks [51.92362217307946]
物理インフォームドニューラルネットワーク(PINN)は、前方および逆微分方程式問題の解法として効果的に実証されている。
PINNは、近似すべきターゲット関数が高周波またはマルチスケールの特徴を示す場合、トレーニング障害に閉じ込められる。
本稿では,暗黙的勾配降下法(ISGD)を用いてPINNを訓練し,トレーニングプロセスの安定性を向上させることを提案する。
論文 参考訳(メタデータ) (2023-03-03T08:17:47Z) - Deep Networks with Fast Retraining [0.0]
本稿では,深層畳み込みニューラルネットワーク(DCNN)学習のための新しいMP逆ベース高速リトレーニング戦略を提案する。
各トレーニングでは、後進パスでトレーニングされた畳み込み層の数を制御するランダムな学習戦略が最初に利用される。
そこで,MP 逆ベースバッチ・バイ・バッチ・ラーニング・ストラテジーを開発し,産業規模の計算資源を使わずにネットワークを実装できるようにした。
論文 参考訳(メタデータ) (2020-08-13T15:17:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。