論文の概要: Quantization-Aware Neuromorphic Architecture for Efficient Skin Disease Classification on Resource-Constrained Devices
- arxiv url: http://arxiv.org/abs/2507.15958v1
- Date: Mon, 21 Jul 2025 18:01:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-23 21:34:13.828399
- Title: Quantization-Aware Neuromorphic Architecture for Efficient Skin Disease Classification on Resource-Constrained Devices
- Title(参考訳): 資源制約デバイスを用いた効率的な皮膚疾患分類のための量子化対応型ニューロモルフィックアーキテクチャ
- Authors: Haitian Wang, Xinyu Wang, Yiren Wang, Karen Lee, Zichen Geng, Xian Zhang, Kehkashan Kiran, Yu Zhang, Bo Miao,
- Abstract要約: 資源限定ハードウェア上でのインクリメンタルな皮膚病変分類のための新しい量子化対応ニューロモルフィックアーキテクチャであるQANAを紹介する。
QANAはゴーストモジュール、効率的なチャンネルアテンション、堅牢な特徴表現のためのシャープ・アンド・エキサイティングブロックを統合している。
その量子化対応ヘッドとスパイク互換変換は、スパイクニューラルネットワーク(SNN)へのシームレスな変換と、ニューロモルフィックプラットフォームへの展開を可能にする。
- 参考スコア(独自算出の注目度): 5.137218613814703
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and efficient skin lesion classification on edge devices is critical for accessible dermatological care but remains challenging due to computational, energy, and privacy constraints. We introduce QANA, a novel quantization-aware neuromorphic architecture for incremental skin lesion classification on resource-limited hardware. QANA effectively integrates ghost modules, efficient channel attention, and squeeze-and-excitation blocks for robust feature representation with low-latency and energy-efficient inference. Its quantization-aware head and spike-compatible transformations enable seamless conversion to spiking neural networks (SNNs) and deployment on neuromorphic platforms. Evaluation on the large-scale HAM10000 benchmark and a real-world clinical dataset shows that QANA achieves 91.6\% Top-1 accuracy and 82.4\% macro F1 on HAM10000, and 90.8\% / 81.7\% on the clinical dataset, significantly outperforming state-of-the-art CNN-to-SNN models under fair comparison. Deployed on BrainChip Akida hardware, QANA achieves 1.5\,ms inference latency and 1.7\,mJ energy per image, reducing inference latency and energy use by over 94.6\%/98.6\% compared to GPU-based CNNs surpassing state-of-the-art CNN-to-SNN conversion baselines. These results demonstrate the effectiveness of QANA for accurate, real-time, and privacy-sensitive medical analysis in edge environments.
- Abstract(参考訳): エッジデバイス上での正確な皮膚病変の分類は、アクセス可能な皮膚科医療において重要であるが、計算、エネルギー、プライバシーの制約により依然として困難である。
資源限定ハードウェア上でのインクリメンタルな皮膚病変分類のための新しい量子化対応ニューロモルフィックアーキテクチャであるQANAを紹介する。
QANAは、ゴーストモジュール、効率的なチャネルアテンション、低レイテンシでエネルギー効率のよいロバストな特徴表現のためのシャープ・アンド・エミッションブロックを効果的に統合する。
その量子化対応ヘッドとスパイク互換変換は、スパイクニューラルネットワーク(SNN)へのシームレスな変換と、ニューロモルフィックプラットフォームへの展開を可能にする。
大規模HAM10000ベンチマークと実世界の臨床データセットによる評価は、QANAが91.6\% Top-1精度と82.4\% macro F1をHAM10000で達成し、臨床データセットで90.8\% / 81.7\%を達成し、公正な比較で最先端のCNN-to-SNNモデルよりも著しく優れていることを示している。
BrainChip Akidaハードウェア上にデプロイされたQANAは、1.5\,msの推論レイテンシと1.7\,mJのエネルギを達成し、最新のCNN-SNN変換ベースラインを上回るGPUベースのCNNと比較して、推論レイテンシとエネルギー使用量を94.6\%/98.6\%以上削減する。
これらの結果から, エッジ環境におけるQANAの正確な, リアルタイム, プライバシに敏感な医療分析への応用が示された。
関連論文リスト
- Benchmarking Quantum Convolutional Neural Networks for Signal Classification in Simulated Gamma-Ray Burst Detection [29.259008600842517]
本研究は,ガンマ線バースト(GRB)に似た信号の同定に量子畳み込みニューラルネットワーク(QCNN)を用いたことを評価する。
量子シミュレータでトレーニングしたQCNNを用いて,Qiskitフレームワークを用いたハイブリッド量子古典機械学習手法を実装した。
QCNNは時系列データセット上で堅牢な性能を示し,高い精度でGRB信号の検出に成功した。
論文 参考訳(メタデータ) (2025-01-28T16:07:12Z) - Deep-Unrolling Multidimensional Harmonic Retrieval Algorithms on Neuromorphic Hardware [78.17783007774295]
本稿では,高精度かつエネルギー効率の高い単発多次元高調波検索のための変換に基づくニューロモルフィックアルゴリズムの可能性について検討する。
複雑な値の畳み込み層と活性化をスパイクニューラルネットワーク(SNN)に変換する新しい手法を開発した。
変換されたSNNは、元のCNNに比べて性能が低下し、ほぼ5倍の電力効率を実現している。
論文 参考訳(メタデータ) (2024-12-05T09:41:33Z) - SAN: Hypothesizing Long-Term Synaptic Development and Neural Engram Mechanism in Scalable Model's Parameter-Efficient Fine-Tuning [39.04674956382538]
我々は、事前学習パラメータ空間の洗練された解析により、FFT(Full Fine-Tuning)による性能ギャップを橋渡しした。
本稿では,前方から後方へのスケーリング成分を分解するSynapse and Neuron(SAN)を提案する。
提案手法は,神経伝達物質放出によるシナプス発生を制御できる長期増強/抑うつ(Neural/D)現象に理論的に基礎を置いている。
論文 参考訳(メタデータ) (2024-08-24T03:27:29Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - The Hardware Impact of Quantization and Pruning for Weights in Spiking
Neural Networks [0.368986335765876]
パラメータの量子化とプルーニングは、モデルサイズを圧縮し、メモリフットプリントを削減し、低レイテンシ実行を容易にする。
本研究では,身近な身近なジェスチャー認識システムであるSNNに対して,孤立度,累積的に,そして同時にプルーニングと量子化の様々な組み合わせについて検討する。
本研究では,3次重みまで精度の低下に悩まされることなく,攻撃的パラメータ量子化に対処可能であることを示す。
論文 参考訳(メタデータ) (2023-02-08T16:25:20Z) - Implementing a Hybrid Quantum-Classical Neural Network by Utilizing a
Variational Quantum Circuit for Detection of Dementia [0.0]
2019年にアルツハイマー病の患者3人に1人近くが誤診され、ニューラルネットワークの問題が修正される可能性がある。
この研究により、提案されたハイブリッド量子古典畳み込みニューラルネットワーク(QCCNN)は97.5%と95.1%のテストおよび検証精度を提供することがわかった。
QCCNNはCNNの89%と91%と比較して95%と98%の画像を正しく検出した。
論文 参考訳(メタデータ) (2023-01-29T18:05:42Z) - Masked Spiking Transformer [6.862877794199617]
スパイキングニューラルネットワーク(SNN)とトランスフォーマーは、高エネルギー効率と高性能な性質の可能性を秘めている。
本稿では,SNN と Transformer を組み合わせた ANN-to-SNN 変換手法の利点を活用することを提案する。
本研究では、ランダムスパイク・マスキング(RSM)手法を取り入れた新しいマスケプ・スパイク・トランスフォーマー・フレームワークを導入し、余剰スパイクを発生させ、性能を犠牲にすることなくエネルギー消費を低減させる。
論文 参考訳(メタデータ) (2022-10-03T19:56:09Z) - Atrial Fibrillation Detection Using Weight-Pruned, Log-Quantised
Convolutional Neural Networks [25.160063477248904]
心電図信号から心房細動を検出する畳み込みニューラルネットワークモデルを開発した。
このモデルは、限られた可変長の入力データで訓練されているにもかかわらず、高い性能を示す。
最終モデルは91.1%のモデル圧縮比を達成し、高いモデル精度は91.7%、損失は1%未満であった。
論文 参考訳(メタデータ) (2022-06-14T11:47:04Z) - Multistage Pruning of CNN Based ECG Classifiers for Edge Devices [9.223908421919733]
畳み込みニューラルネットワーク(CNN)に基づくディープラーニングは、ECGの異常なビートを検出するのに成功している。
既存のCNNモデルの計算複雑性は、低消費電力エッジデバイスに実装することを禁止している。
本稿では,CNNモデルの複雑性を低減し,性能を損なうことなく,新たなマルチステージプルーニング手法を提案する。
論文 参考訳(メタデータ) (2021-08-31T17:51:15Z) - A New Neuromorphic Computing Approach for Epileptic Seizure Prediction [4.798958633851825]
CNNは計算的に高価で電力が空腹です。
エネルギー効率のよいスパイクニューラルネットワーク(SNN)によって動機づけられた、発作予測のためのニューロモルフィックコンピューティングアプローチが本研究で提案されている。
論文 参考訳(メタデータ) (2021-02-25T10:39:18Z) - Block-term Tensor Neural Networks [29.442026567710435]
ブロック終端テンソル層(BT層)は,CNNやRNNなどのニューラルネットワークモデルに容易に適用可能であることを示す。
CNNとRNNのBT層は、元のDNNの表現力を維持したり改善したりしながら、パラメータ数に対して非常に大きな圧縮比を達成することができる。
論文 参考訳(メタデータ) (2020-10-10T09:58:43Z) - PENNI: Pruned Kernel Sharing for Efficient CNN Inference [41.050335599000036]
最先端(SOTA)CNNは、様々なタスクにおいて優れたパフォーマンスを達成する。
その高い計算要求と膨大な数のパラメータにより、リソース制約のあるデバイスにこれらのSOTA CNNをデプロイすることは困難である。
本稿では,CNNモデル圧縮フレームワークであるPENNIを提案する。
論文 参考訳(メタデータ) (2020-05-14T16:57:41Z) - Widening and Squeezing: Towards Accurate and Efficient QNNs [125.172220129257]
量子化ニューラルネットワーク(QNN)は、非常に安価な計算とストレージオーバーヘッドのため、業界にとって非常に魅力的なものだが、その性能は、完全な精度パラメータを持つネットワークよりも悪い。
既存の手法の多くは、より効果的なトレーニング技術を利用して、特にバイナリニューラルネットワークの性能を高めることを目的としている。
本稿では,従来の完全精度ネットワークで高次元量子化機能に特徴を投影することで,この問題に対処する。
論文 参考訳(メタデータ) (2020-02-03T04:11:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。