Fugu-MT 論文翻訳(概要): SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

論文の概要: SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding

arxiv url: http://arxiv.org/abs/2506.07737v2
Date: Wed, 11 Jun 2025 15:55:43 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-12 16:13:48.029308
Title: SpikeSMOKE: Spiking Neural Networks for Monocular 3D Object Detection with Cross-Scale Gated Coding
Title（参考訳）: SpikeSMOKE: クロススケールゲート符号化による単眼3次元物体検出のためのスパイクニューラルネットワーク
Authors: Xuemei Chen, Huamin Wang, Hangchi Shen, Shukai Duan, Shiping Wen, Tingwen Huang,
Abstract要約: SpikeSMOKEは低出力のモノクル3Dオブジェクト検出のための新しい試みである。 SpikeSMOKEはSMOKEと比較してエネルギー消費を大幅に削減できる。
参考スコア（独自算出の注目度）: 40.87826765639894
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Low energy consumption for 3D object detection is an important research area because of the increasing energy consumption with their wide application in fields such as autonomous driving. The spiking neural networks (SNNs) with low-power consumption characteristics can provide a novel solution for this research. Therefore, we apply SNNs to monocular 3D object detection and propose the SpikeSMOKE architecture in this paper, which is a new attempt for low-power monocular 3D object detection. As we all know, discrete signals of SNNs will generate information loss and limit their feature expression ability compared with the artificial neural networks (ANNs).In order to address this issue, inspired by the filtering mechanism of biological neuronal synapses, we propose a cross-scale gated coding mechanism(CSGC), which can enhance feature representation by combining cross-scale fusion of attentional methods and gated filtering mechanisms.In addition, to reduce the computation and increase the speed of training, we present a novel light-weight residual block that can maintain spiking computing paradigm and the highest possible detection performance. Compared to the baseline SpikeSMOKE under the 3D Object Detection, the proposed SpikeSMOKE with CSGC can achieve 11.78 (+2.82, Easy), 10.69 (+3.2, Moderate), and 10.48 (+3.17, Hard) on the KITTI autonomous driving dataset by AP|R11 at 0.7 IoU threshold, respectively. It is important to note that the results of SpikeSMOKE can significantly reduce energy consumption compared to the results on SMOKE. For example,the energy consumption can be reduced by 72.2% on the hard category, while the detection performance is reduced by only 4%. SpikeSMOKE-L (lightweight) can further reduce the amount of parameters by 3 times and computation by 10 times compared to SMOKE.
Abstract（参考訳）: 3次元物体検出のための低エネルギー消費は、自律運転などの分野に広く応用されているため、重要な研究分野である。低消費電力特性を有するスパイキングニューラルネットワーク(SNN)は,本研究の新たな解決策となる。そこで本論文では,SNNをモノクロ3Dオブジェクト検出に適用し,低消費電力モノクロ3Dオブジェクト検出のための新しい試みであるSpikeSMOKEアーキテクチャを提案する。誰もが知っているように、SNNの離散信号は、情報損失を生成し、人工知能(ANN)と比較して特徴表現能力を制限します。生体神経シナプスのフィルタリング機構にインスパイアされたこの問題に対処するため,注意法とゲートフィルタリング機構のクロススケール融合を組み合わせることで特徴表現を向上するクロススケールゲート符号化機構(CSGC)を提案し,また,計算の削減とトレーニングのスピード向上のために,スパイキングコンピューティングパラダイムの維持と検出性能の最大化が可能な,新しい軽量残差ブロックを提案する。 3D Object DetectionのベースラインであるSpikeSMOKEと比較して、CSGCによるSpikeSMOKEは11.78 (+2.82, Easy), 10.69 (+3.2, Moderate), 10.48 (+3.17, Hard)をAP|R11でそれぞれ0.7 IoUの閾値で達成できる。また,SpikeSMOKEの結果はSMOKEと比較してエネルギー消費を著しく削減できる点に留意する必要がある。例えば、ハードカテゴリーではエネルギー消費を72.2%削減でき、検出性能は4%削減できる。 SpikeSMOKE-L(軽量)は、SMOKEに比べてパラメータの量を3倍減らし、計算を10倍減らすことができる。

関連論文リスト

CT Scans As Video: Efficient Intracranial Hemorrhage Detection Using Multi-Object Tracking [0.9332987715848716]
本稿では,2次元検出の効率と3次元コンテキストの必要性を両立させる軽量コンピュータビジョンフレームワークを開発する。計算コストのごく一部で3Dコンテキスト推論を近似することにより,リアルタイム患者優先化のためのスケーラブルなソリューションを提供する。
論文参考訳（メタデータ） (2026-01-05T19:49:51Z)
SpikeGrasp: A Benchmark for 6-DoF Grasp Pose Detection from Stereo Spike Streams [57.84331423686738]
ほとんどのロボットの把握システムは、センサーデータを明示的な3Dポイントの雲に変換することに依存しており、これは生物学的知性には見つからない計算ステップである。生体振動子経路を模倣するフレームワークであるSpikeGraspを導入し、立体スパイクカメラから生の非同期イベントを処理する。我々のモデルは、これらのステレオスパイクストリームを融合させ、高レベルの視覚処理に類似した繰り返しスパイクニューラルネットワークを使用して、点雲を再構築することなく、把握仮説を反復的に洗練する。
論文参考訳（メタデータ） (2025-10-12T13:36:40Z)
Spiking Meets Attention: Efficient Remote Sensing Image Super-Resolution with Attention Spiking Neural Networks [57.17129753411926]
従来の人工ニューラルネットワーク(ANN)の代替手段としてスパイキングニューラルネットワーク(SNN)が登場本稿では,AID,DOTA,DIORなどのリモートセンシングベンチマークにおいて,最先端の性能を実現するSpikeSRを提案する。
論文参考訳（メタデータ） (2025-03-06T09:06:06Z)
SpikeDet: Better Firing Patterns for Accurate and Energy-Efficient Object Detection with Spiking Neuron Networks [13.848361661516595]
Spiking Neural Networks(SNN)は、第3世代のニューラルネットワークである。それらは、低消費電力と生物学的解釈可能性のために、物体検出において広く注目を集めている。既存のSNNベースの物体検出手法は、情報集中領域のニューロンが全時間にわたり連続的に発火する局所的な発火飽和に悩まされる。この異常ニューロンの発火パターンは、特徴識別能力と検出精度を低下させ、SNNが潜在的なエネルギー効率を達成するのを防ぐための発火率を増加させる。
論文参考訳（メタデータ） (2025-01-25T09:24:14Z)
DM3D: Distortion-Minimized Weight Pruning for Lossless 3D Object Detection [42.07920565812081]
本稿では,3次元物体検出のための新しいトレーニング後の重み付け手法を提案する。事前訓練されたモデルにおける冗長パラメータを決定し、局所性と信頼性の両方において最小限の歪みをもたらす。本フレームワークは,ネットワーク出力の歪みを最小限に抑え,検出精度を最大に維持することを目的とする。
論文参考訳（メタデータ） (2024-07-02T09:33:32Z)
Low-power event-based face detection with asynchronous neuromorphic hardware [2.0774873363739985]
本稿では、SynSense Speckニューロモルフィックチップ上に展開されたイベントベースの顔検出のためのオンチップスパイクニューラルネットワークの最初の例を示す。トレーニングに用いるオフチップクロック駆動シミュレーションとオンチップイベント駆動推論との精度の相違について述べる。オンチップ顔検出のmAP[0.5]は0.6で、20mWしか消費しない。
論文参考訳（メタデータ） (2023-12-21T19:23:02Z)
Enabling energy-Efficient object detection with surrogate gradient descent in spiking neural networks [0.40054215937601956]
スパイキングニューラルネットワーク(英: Spiking Neural Networks、SNN)は、イベント駆動処理と処理時情報の両方において、生物学的にもっとも有効なニューラルネットワークモデルである。本研究では,オブジェクト検出タスクにおける深部SNNのトレーニングを容易にするために,回帰問題を解くCurrent Mean Decoding(CMD)手法を提案する。勾配サロゲートとCMDに基づいて,物体検出のためのSNN-YOLOv3モデルを提案する。
論文参考訳（メタデータ） (2023-09-07T15:48:00Z)
Pushing the Limits of Asynchronous Graph-based Object Detection with Event Cameras [62.70541164894224]
低計算を維持しながら、そのようなモデルの深さと複雑さを拡大できるアーキテクチャ選択をいくつか導入する。我々の手法は、密度の高いグラフニューラルネットワークよりも3.7倍高速に動作し、前方通過はわずか8.4msである。
論文参考訳（メタデータ） (2022-11-22T15:14:20Z)
Sparse Compressed Spiking Neural Network Accelerator for Object Detection [0.1246030133914898]
スパイキングニューラルネットワーク(SNN)は、人間の脳にインスパイアされ、バイナリスパイクと非常にスパースなアクティベーションマップを送信する。本稿では, 活性化マップと重みの疎度を生かした, スパース圧縮スパイクニューラルネットワーク加速器を提案する。ニューラルネットワークの実験結果は、71.5$%$mAPで、ISV 3clsデータセットの混合(1,3)タイムステップを示している。
論文参考訳（メタデータ） (2022-05-02T09:56:55Z)
An Empirical Study of Adder Neural Networks for Object Detection [67.64041181937624]
加算ニューラルネットワーク(AdderNets)は、追加操作のみを伴う画像分類において、優れたパフォーマンスを示している。本稿では,オブジェクト検出のためのAdderNetsを実証研究する。
論文参考訳（メタデータ） (2021-12-27T11:03:13Z)
SpikeDyn: A Framework for Energy-Efficient Spiking Neural Networks with Continual and Unsupervised Learning Capabilities in Dynamic Environments [14.727296040550392]
スパイキングニューラルネットワーク(SNN)は、生物学的妥当性のため、効率的な教師なしおよび継続的な学習能力の可能性を秘めている。動的環境下での継続学習と教師なし学習機能を備えたエネルギー効率の高いSNNのためのフレームワークであるSpikeDynを提案する。
論文参考訳（メタデータ） (2021-02-28T08:26:23Z)
Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文参考訳（メタデータ） (2020-08-31T17:10:48Z)
Adaptive Anomaly Detection for IoT Data in Hierarchical Edge Computing [71.86955275376604]
本稿では,階層型エッジコンピューティング(HEC)システムに対する適応型異常検出手法を提案する。本研究では,入力データから抽出した文脈情報に基づいてモデルを選択する適応的手法を設計し,異常検出を行う。提案手法を実際のIoTデータセットを用いて評価し,検出タスクをクラウドにオフロードするのとほぼ同じ精度を維持しながら,検出遅延を84%削減できることを実証した。
論文参考訳（メタデータ） (2020-01-10T05:29:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。