Fugu-MT 論文翻訳(概要): Single Pixel Image Classification using an Ultrafast Digital Light Projector

論文の概要: Single Pixel Image Classification using an Ultrafast Digital Light Projector

arxiv url: http://arxiv.org/abs/2603.12036v1
Date: Thu, 12 Mar 2026 15:12:34 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-13 14:46:26.170718
Title: Single Pixel Image Classification using an Ultrafast Digital Light Projector
Title（参考訳）: 超高速デジタル光プロジェクタを用いた単一画素画像分類
Authors: Aisha Kanwal, Graeme E. Johnstone, Fahimeh Dehkhoda, Johannes H. Herrnsdorf, Robert K. Henderson, Martin D. Dawson, Xavier Porte, Michael J. Strain,
Abstract要約: 低機械学習モデルを用いた単一画素画像(SPI)技術を用いて,マルチkHzフレームレートで画像分類を行う。 SPI用LEDオンCMOSデジタル光プロジェクタを使用することで、サブms画像符号化のための超高速パターン生成が可能となる。我々は,2つの機械学習モデルの分類性能を比較した: エクストリーム機械学習マシン(ELM)とバックプロパゲーション訓練された深層ニューラルネットワーク。
参考スコア（独自算出の注目度）: 0.46843765915430247
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Pattern recognition and image classification are essential tasks in machine vision. Autonomous vehicles, for example, require being able to collect the complex information contained in a changing environment and classify it in real time. Here, we experimentally demonstrate image classification at multi-kHz frame rates combining the technique of single pixel imaging (SPI) with a low complexity machine learning model. The use of a microLED-on-CMOS digital light projector for SPI enables ultrafast pattern generation for sub-ms image encoding. We investigate the classification accuracy of our experimental system against the broadly accepted benchmarking task of the MNIST digits classification. We compare the classification performance of two machine learning models: An extreme learning machine (ELM) and a backpropagation trained deep neural network. The complexity of both models is kept low so the overhead added to the inference time is comparable to the image generation time. Crucially, our single pixel image classification approach is based on a spatiotemporal transformation of the information, entirely bypassing the need for image reconstruction. By exploring the performance of our SPI based ELM as binary classifier we demonstrate its potential for efficient anomaly detection in ultrafast imaging scenarios.
Abstract（参考訳）: パターン認識と画像分類は、マシンビジョンにおいて必須のタスクである。例えば、自動運転車は、変化する環境に含まれる複雑な情報を収集し、リアルタイムで分類する必要がある。本稿では,SPI(Single Pixel Imaging)と低複雑性機械学習モデルを組み合わせたマルチkHzフレームレートの画像分類実験を行った。 SPI用マイクロLEDオンCMOSデジタル光プロジェクタを使用することで、サブms画像符号化のための超高速パターン生成が可能となる。我々は,MNIST桁分類のベンチマークタスクに対する実験システムの分類精度について検討した。我々は,2つの機械学習モデルの分類性能を比較した: エクストリーム機械学習マシン(ELM)とバックプロパゲーション訓練された深層ニューラルネットワーク。両方のモデルの複雑さは低く保たれ、推論時間に追加されるオーバーヘッドは画像生成時間に匹敵する。重要な点として、我々の単一のピクセル画像分類アプローチは、画像再構成の必要性を完全に回避して、情報の時空間変換に基づいている。 SPIをベースとしたELMをバイナリ分類器としての性能を探索することにより,超高速撮像シナリオにおける効率的な異常検出の可能性を示す。

関連論文リスト

Feature Engineering is Not Dead: Reviving Classical Machine Learning with Entropy, HOG, and LBP Feature Fusion for Image Classification [0.13194391758295113]
我々は、置換エントロピー(PE)を中心とした新しいアプローチにより、古典的機械学習に基づく画像分類を再考する。 PEを2次元画像に拡張し,マルチスケール・マルチ指向エントロピーに基づく特徴抽出手法を提案する。この結果から,PEとHOGとLBPの融合は,計算コストが高く,解釈可能な限定的なディープラーニングモデルに対して,コンパクトで,解釈可能な,効果的な代替手段を提供することが示された。
論文参考訳（メタデータ） (2025-07-18T09:29:03Z)
Predicting Satisfied User and Machine Ratio for Compressed Images: A Unified Approach [58.71009078356928]
圧縮画像のSUR(Satified User Ratio)とSMR(Satified Machine Ratio)を同時に予測するディープラーニングモデルを構築した。実験結果から,提案手法は最先端SURおよびSMR予測法より有意に優れていたことが示唆された。
論文参考訳（メタデータ） (2024-12-23T11:09:30Z)
Dual-Scale Transformer for Large-Scale Single-Pixel Imaging [11.064806978728457]
本研究では,HATNet と呼ばれる Kronecker SPI モデル上でのハイブリッドアテンショントランスフォーマを用いた深部展開ネットワークを提案し,実際の SPI カメラの画質向上を図る。勾配降下モジュールはベクトル化されたSPIに基づいて、以前の勾配降下モジュールに根付いた高い計算オーバーヘッドを回避することができる。このデノナイジングモジュールは,高周波・低周波アグリゲーションのための2次元空間アグリゲーションと,グローバル情報再構成のためのチャネルアグリゲーションを利用したエンコーダデコーダアーキテクチャである。
論文参考訳（メタデータ） (2024-04-07T15:53:21Z)
A Single Graph Convolution Is All You Need: Efficient Grayscale Image Classification [3.0299904110792255]
グレースケール画像分類は、医用画像やSAR ATRなどの分野で重要な応用がある。画像のベクトル化ビューを用いた新しいグレースケール画像分類手法を提案する。提案手法では,単一のグラフ畳み込み層をバッチ的に組み込んで,精度の向上と性能のばらつきの低減を図る。
論文参考訳（メタデータ） (2024-02-01T12:50:48Z)
Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文参考訳（メタデータ） (2023-10-22T02:27:02Z)
Augmenting Deep Learning Adaptation for Wearable Sensor Data through Combined Temporal-Frequency Image Encoding [4.458210211781739]
本稿では、時間領域情報と周波数領域情報をシームレスに統合した、新しい修正繰り返しプロットベースの画像表現を提案する。加速度センサを用いた活動認識データと事前訓練されたResNetモデルを用いて提案手法の評価を行い,既存の手法と比較して優れた性能を示す。
論文参考訳（メタデータ） (2023-07-03T09:29:27Z)
Revisiting Temporal Modeling for CLIP-based Image-to-Video Knowledge Transferring [82.84513669453744]
画像テキスト事前訓練モデル(例えばCLIP)は、大規模な画像テキストデータペアから学んだ、印象的な汎用マルチモーダル知識を示している。画像間知識伝達の文脈における時間的モデリングを再考する。本稿では,CLIPモデルを多様なビデオタスクに拡張する簡易かつ効果的な時間的モデリング機構を提案する。
論文参考訳（メタデータ） (2023-01-26T14:12:02Z)
Multi-level Second-order Few-shot Learning [111.0648869396828]
教師付きまたは教師なしの少数ショット画像分類と少数ショット動作認識のためのマルチレベル2次数列学習ネットワーク(MlSo)を提案する。我々は、パワーノーマライズされた二階学習者ストリームと、複数のレベルの視覚的抽象化を表現する機能を組み合わせた、いわゆる2階学習者ストリームを活用している。我々は,Omniglot, mini-ImageNet, tiered-ImageNet, Open MIC, CUB Birds, Stanford Dogs, Cars, HMDB51, UCF101, mini-MITなどのアクション認識データセットなどの標準データセットに対して,優れた結果を示す。
論文参考訳（メタデータ） (2022-01-15T19:49:00Z)
Ensembling with Deep Generative Views [72.70801582346344]
生成モデルは、色やポーズの変化などの現実世界の変動を模倣する人工画像の「ビュー」を合成することができる。そこで本研究では, 画像分類などの下流解析作業において, 実画像に適用できるかどうかを検討する。 StyleGAN2を再生増強の源として使用し、顔の属性、猫の顔、車を含む分類タスクについてこの設定を調査します。
論文参考訳（メタデータ） (2021-04-29T17:58:35Z)
Remote Sensing Image Classification with the SEN12MS Dataset [1.7894377200944511]
我々はsen12msデータセットの分類指向変換を提案する。これにより、2つの標準cnnアーキテクチャと異なる入力データ設定に基づくいくつかのベースラインモデルの結果が得られる。我々は,リモートセンシング画像分類のベンチマークをサポートし,従来のRGB画像に対するマルチスペクトルデータとマルチセンサデータ融合の利点に関する知見を提供する。
論文参考訳（メタデータ） (2021-04-01T18:15:16Z)
Generative Hierarchical Features from Synthesizing Images [65.66756821069124]
画像合成の学習は、広範囲のアプリケーションにまたがって一般化可能な顕著な階層的な視覚的特徴をもたらす可能性があることを示す。生成的階層的特徴(Generative Hierarchical Feature, GH-Feat)と呼ばれるエンコーダが生成する視覚的特徴は、生成的タスクと識別的タスクの両方に強い伝達性を有する。
論文参考訳（メタデータ） (2020-07-20T18:04:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。