論文の概要: $γ$-Quant: Towards Learnable Quantization for Low-bit Pattern Recognition
- arxiv url: http://arxiv.org/abs/2509.22448v1
- Date: Fri, 26 Sep 2025 15:03:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.528604
- Title: $γ$-Quant: Towards Learnable Quantization for Low-bit Pattern Recognition
- Title(参考訳): $γ$-Quant: 低ビットパターン認識のための学習可能な量子化を目指して
- Authors: Mishal Fatima, Shashank Agnihotri, Marius Bock, Kanchana Vaishnavi Gandikota, Kristof Van Laerhoven, Michael Moeller, Margret Keuper,
- Abstract要約: パターン認識のための非線形量子化のタスク特化学習として$gamma$-Quantを提案する。
学習可能な量子化が可能な生データは,12ビットのデータと同等に4ビットで処理できることを実証した。
- 参考スコア(独自算出の注目度): 28.31494154592102
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Most pattern recognition models are developed on pre-proce\-ssed data. In computer vision, for instance, RGB images processed through image signal processing (ISP) pipelines designed to cater to human perception are the most frequent input to image analysis networks. However, many modern vision tasks operate without a human in the loop, raising the question of whether such pre-processing is optimal for automated analysis. Similarly, human activity recognition (HAR) on body-worn sensor data commonly takes normalized floating-point data arising from a high-bit analog-to-digital converter (ADC) as an input, despite such an approach being highly inefficient in terms of data transmission, significantly affecting the battery life of wearable devices. In this work, we target low-bandwidth and energy-constrained settings where sensors are limited to low-bit-depth capture. We propose $\gamma$-Quant, i.e.~the task-specific learning of a non-linear quantization for pattern recognition. We exemplify our approach on raw-image object detection as well as HAR of wearable data, and demonstrate that raw data with a learnable quantization using as few as 4-bits can perform on par with the use of raw 12-bit data. All code to reproduce our experiments is publicly available via https://github.com/Mishalfatima/Gamma-Quant
- Abstract(参考訳): ほとんどのパターン認識モデルは、プリプロシードデータに基づいて開発されている。
例えば、コンピュータビジョンでは、画像信号処理(ISP)パイプラインを通して処理されるRGBイメージが、人間の知覚に適応するように設計された。
しかし、現代の視覚タスクの多くはループ内で人間なしで動作しており、そのような前処理が自動解析に最適かどうかという疑問が提起されている。
同様に、体輪センサデータ上の人間活動認識(HAR)は、高ビットアナログデジタルコンバータ(ADC)から発生する正規化浮動小数点データを入力として扱う。
本研究では,センサが低ビット深度キャプチャに制限される低帯域幅とエネルギー制約の設定を対象とする。
パターン認識のための非線形量子化のタスク特化学習として$\gamma$-Quantを提案する。
ウェアラブルデータのHARと同様に、生画像オブジェクト検出に対する我々のアプローチを実証し、学習可能な量子化が可能な4ビットのデータを用いて生データを生12ビットのデータと同等に実行できることを実証する。
私たちの実験を再現するコードは、https://github.com/Mishalfatima/Gamma-Quantを通じて公開されています。
関連論文リスト
- MARMOT: Masked Autoencoder for Modeling Transient Imaging [30.865812827455326]
我々は、非視線(NLOS)アプリケーションを容易にするために、過渡イメージング(MARMOT)をモデル化するためのマスク付きオートエンコーダを提案する。
私たちのMARMOTは、大規模で多様なNLOSトランジェントデータセットを前提とした自己教師型モデルです。
論文 参考訳(メタデータ) (2025-06-10T05:49:22Z) - Quanv4EO: Empowering Earth Observation by means of Quanvolutional Neural Networks [62.12107686529827]
本稿は、大量のリモートセンシングデータの処理において、量子コンピューティング技術を活用することへの大きなシフトを取り上げる。
提案したQuanv4EOモデルでは,多次元EOデータを前処理するための準進化法が導入された。
主要な知見は,提案モデルが画像分類の精度を維持するだけでなく,EOのユースケースの約5%の精度向上を図っていることを示唆している。
論文 参考訳(メタデータ) (2024-07-24T09:11:34Z) - Rethinking Transformers Pre-training for Multi-Spectral Satellite
Imagery [78.43828998065071]
教師なし学習の最近の進歩は、下流タスクにおける有望な結果を達成するための大きな視覚モデルの可能性を示している。
このような事前学習技術は、大量の未学習データが利用可能であることから、リモートセンシング領域でも最近研究されている。
本稿では,マルチモーダルで効果的に活用されるマルチスケール情報の事前学習と活用について述べる。
論文 参考訳(メタデータ) (2024-03-08T16:18:04Z) - Let's Roll: Synthetic Dataset Analysis for Pedestrian Detection Across
Different Shutter Types [7.0441427250832644]
本稿では,機械学習(ML)オブジェクト検出モデルに異なるシャッター機構が与える影響について検討する。
特に、合成合成されたGSとRSのデータセットを用いて、主流検出モデルを訓練し、評価する。
論文 参考訳(メタデータ) (2023-09-15T04:07:42Z) - Enabling ISP-less Low-Power Computer Vision [4.102254385058941]
汎用的な高レベル視覚タスクのための大規模ベンチマークの生版をリリースする。
ISPなしのCVシステムでは、生画像のトレーニングにより、テスト精度が7.1%向上する。
そこで本研究では,画素内CNN計算と組み合わせた,エネルギー効率のよいアナログインピクセル復号法を提案する。
論文 参考訳(メタデータ) (2022-10-11T13:47:30Z) - GenISP: Neural ISP for Low-Light Machine Cognition [19.444297600977546]
低照度環境では、原画像データを用いた物体検出器は、ISPパイプラインで処理された画像データを用いた検出器よりも堅牢である。
我々は、デバイスに依存しないカラー空間にカラー空間変換を明示的に組み込んだ、マシン認知のための最小限のニューラルISPパイプラインGenISPを提案する。
論文 参考訳(メタデータ) (2022-05-07T17:17:24Z) - Model-Based Image Signal Processors via Learnable Dictionaries [6.766416093990318]
デジタルカメラは画像信号処理装置(ISP)を用いてRAW読み出しをRGB画像に変換する
近年のアプローチでは、RGBからRAWマッピングを推定することで、このギャップを埋めようとしている。
本稿では,学習可能かつ解釈可能なハイブリッド・モデルベースかつデータ駆動型ISPを提案する。
論文 参考訳(メタデータ) (2022-01-10T08:36:10Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - CNNs for JPEGs: A Study in Computational Cost [49.97673761305336]
畳み込みニューラルネットワーク(CNN)は過去10年間で驚くべき進歩を遂げてきた。
CNNはRGBピクセルから直接データの堅牢な表現を学習することができる。
近年,圧縮領域から直接学習できる深層学習手法が注目されている。
論文 参考訳(メタデータ) (2020-12-26T15:00:10Z) - Deep traffic light detection by overlaying synthetic context on
arbitrary natural images [49.592798832978296]
深部交通光検出器のための人工的な交通関連トレーニングデータを生成する手法を提案する。
このデータは、任意の画像背景の上に偽のトラフィックシーンをブレンドするために、基本的な非現実的なコンピュータグラフィックスを用いて生成される。
また、交通信号データセットの本質的なデータ不均衡問題にも対処し、主に黄色い状態のサンプルの少なさによって引き起こされる。
論文 参考訳(メタデータ) (2020-11-07T19:57:22Z) - Learning Camera Miscalibration Detection [83.38916296044394]
本稿では,視覚センサ,特にRGBカメラの誤校正検出を学習するためのデータ駆動型アプローチに焦点を当てた。
コントリビューションには、RGBカメラの誤校正基準と、この基準に基づく新しい半合成データセット生成パイプラインが含まれる。
深層畳み込みニューラルネットワークをトレーニングすることにより、カメラ固有のパラメータの再校正が必要か否かを判断するパイプラインの有効性を実証する。
論文 参考訳(メタデータ) (2020-05-24T10:32:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。