論文の概要: Fuzzy Encoding-Decoding to Improve Spiking Q-Learning Performance in Autonomous Driving
- arxiv url: http://arxiv.org/abs/2604.16436v1
- Date: Mon, 06 Apr 2026 20:10:59 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-04 02:32:13.997616
- Title: Fuzzy Encoding-Decoding to Improve Spiking Q-Learning Performance in Autonomous Driving
- Title(参考訳): 自律運転におけるスパイクQ学習性能向上のためのファジィ符号化復号
- Authors: Aref Ghoreishee, Abhishek Mishra, Lifeng Zhou, John Walsh, Anup Das, Nagarajan Kandasamy,
- Abstract要約: 本稿では,自律運転における視覚に基づく深絞りQ-networksの強化を目的とした,エンドツーエンドのファジィエンコーダデコーダアーキテクチャを提案する。
提案アーキテクチャは意思決定精度を大幅に向上させ,スパイクとマルチモーダルQネットワークの性能ギャップを埋める。
- 参考スコア(独自算出の注目度): 11.138810317218047
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper develops an end-to-end fuzzy encoder-decoder architecture for enhancing vision-based multi-modal deep spiking Q-networks in autonomous driving. The method addresses two core limitations of spiking reinforcement learning: information loss stemming from the conversion of dense visual inputs into sparse spike trains, and the limited representational capacity of spike-based value functions, which often yields weakly discriminative Q-value estimates. The encoder introduces trainable fuzzy membership functions to generate expressive, population-based spike representations, and the decoder uses a lightweight neural decoder to reconstruct continuous Q-values from spiking outputs. Experiments on the HighwayEnv benchmark show that the proposed architecture substantially improves decision-making accuracy and closes the performance gap between spiking and non-spiking multi-modal Q-networks. The results highlight the potential of this framework for efficient and real-time autonomous driving with spiking neural networks.
- Abstract(参考訳): 本稿では,視覚に基づく多モード深絞りQ-networksの自律走行性向上を目的とした,エンドツーエンドファジィエンコーダデコーダアーキテクチャを提案する。
本手法は,高密度な視覚入力からスパーススパイク列車への変換に起因する情報損失と,スパイクに基づく値関数の表現能力の制限という,スパイク強化学習の2つの限界に対処する。
エンコーダは、適応的で人口ベースのスパイク表現を生成するための訓練可能なファジィメンバシップ関数を導入し、デコーダは軽量のニューラルデコーダを使用して、スパイク出力から連続Q値を再構成する。
HighwayEnvベンチマークの実験により、提案アーキテクチャは決定精度を大幅に向上し、スパイクと非スパイクマルチモーダルQ-networksのパフォーマンスギャップを埋めることが示された。
この結果は、スパイクニューラルネットワークを用いた効率的でリアルタイムな自動運転のためのこのフレームワークの可能性を強調している。
関連論文リスト
- Task-Oriented Feature Compression for Multimodal Understanding via Device-Edge Co-Inference [54.53508601749513]
本稿では,マルチモーダル理解のためのタスク指向特徴圧縮(TOFC)手法を提案する。
圧縮効率を向上させるために、視覚特徴の特性に基づいて複数のエントロピーモデルを適応的に選択する。
その結果,TOFCはデータ転送オーバーヘッドを最大52%削減し,システム遅延を最大63%削減できることがわかった。
論文 参考訳(メタデータ) (2025-03-17T08:37:22Z) - Fast Quantum Convolutional Neural Networks for Low-Complexity Object
Detection in Autonomous Driving Applications [18.34157974553066]
量子畳み込みに基づく物体検出(QCOD)を提案し,高速に物体検出を行う。
QCODは、提案した高速量子畳み込みを利用して、入力チャネル情報をアップロードし、出力チャネルを再構築する。
KITTI自律走行物体検出データセットを用いた実験により,提案した高速量子畳み込みとQCODが実物体検出アプリケーションで正常に動作することを確認した。
論文 参考訳(メタデータ) (2023-12-28T00:38:10Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Dynamic Encoding and Decoding of Information for Split Learning in
Mobile-Edge Computing: Leveraging Information Bottleneck Theory [1.1151919978983582]
Split Learning(スプリットラーニング)は、MLモデルを2つの部分(エンコーダとデコーダ)に分割する、プライバシ保護の分散学習パラダイムである。
モバイルエッジコンピューティングでは、エンコーダがユーザ機器(UE)に、デコーダがエッジネットワークに、分割学習によってネットワーク機能を訓練することができる。
本稿では,送信リソース消費の動的バランスと,共有潜在表現の情報化を両立させるためのフレームワークとトレーニング機構を提案する。
論文 参考訳(メタデータ) (2023-09-06T07:04:37Z) - A Comparison of Temporal Encoders for Neuromorphic Keyword Spotting with
Few Neurons [0.11726720776908518]
SNNにおける時間的エンコーディングと特徴抽出のための2つの神経計算要素について検討した。
リソース効率の良いキーワードスポッティングアプリケーションは、これらのエンコーダを使用することで恩恵を受けることができるが、時間定数と重み付けを学習する手法をさらに研究する必要がある。
論文 参考訳(メタデータ) (2023-01-24T12:50:54Z) - Problem-Dependent Power of Quantum Neural Networks on Multi-Class
Classification [83.20479832949069]
量子ニューラルネットワーク(QNN)は物理世界を理解する上で重要なツールとなっているが、その利点と限界は完全には理解されていない。
本稿では,多クラス分類タスクにおけるQCの問題依存力について検討する。
我々の研究はQNNの課題依存力に光を当て、その潜在的なメリットを評価するための実践的なツールを提供する。
論文 参考訳(メタデータ) (2022-12-29T10:46:40Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Rate Distortion Characteristic Modeling for Neural Image Compression [59.25700168404325]
エンドツーエンドの最適化機能は、ニューラルイメージ圧縮(NIC)の優れた損失圧縮性能を提供する。
異なるモデルは、R-D空間の異なる点に到達するために訓練される必要がある。
深層ネットワークと統計モデルを用いてNICのR-D挙動を記述するために,本質的な数学的関数の定式化に努めている。
論文 参考訳(メタデータ) (2021-06-24T12:23:05Z) - Discovery of slow variables in a class of multiscale stochastic systems
via neural networks [0.0]
本研究では,システムから遅い表現を抽出するマップを,人工ニューラルネットワークにエンコードする新しい手法を提案する。
我々は、このメソッドを、正しいスロー表現を見つける能力を示すいくつかの例でテストする。
論文 参考訳(メタデータ) (2021-04-28T17:48:25Z) - Supervised Learning with First-to-Spike Decoding in Multilayer Spiking
Neural Networks [0.0]
本稿では,多層スパイキングニューラルネットワークを学習して分類問題を解くための教師あり学習手法を提案する。
提案した学習規則は、隠れニューロンが発する複数のスパイクをサポートし、決定論的出力層によって生成された最初のスパイク応答に依存することにより安定である。
また、入力データのコンパクト表現を形成するために、いくつかの異なるスパイクベースの符号化戦略についても検討する。
論文 参考訳(メタデータ) (2020-08-16T15:34:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。