論文の概要: Compute-first optical detection for noise-resilient visual perception
- arxiv url: http://arxiv.org/abs/2403.09612v1
- Date: Thu, 14 Mar 2024 17:51:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-15 19:06:48.292118
- Title: Compute-first optical detection for noise-resilient visual perception
- Title(参考訳): 雑音応答型視覚知覚のためのコンピュータファースト光検出
- Authors: Jungmin Kim, Nanfang Yu, Zongfu Yu,
- Abstract要約: 本稿では,この問題に対処するために,検出前の光信号処理の概念を提案する。
線形変圧器によって空間的に再分配された光信号は、視覚的知覚タスクの検出ノイズ耐性を高めることができることを示す。
この計算ファースト検出方式は、産業や防衛用途に広く使われている赤外線機械ビジョン技術の進歩の道を開くことができる。
- 参考スコア(独自算出の注目度): 0.5325390073522079
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the context of visual perception, the optical signal from a scene is transferred into the electronic domain by detectors in the form of image data, which are then processed for the extraction of visual information. In noisy and weak-signal environments such as thermal imaging for night vision applications, however, the performance of neural computing tasks faces a significant bottleneck due to the inherent degradation of data quality upon noisy detection. Here, we propose a concept of optical signal processing before detection to address this issue. We demonstrate that spatially redistributing optical signals through a properly designed linear transformer can enhance the detection noise resilience of visual perception tasks, as benchmarked with the MNIST classification. Our idea is supported by a quantitative analysis detailing the relationship between signal concentration and noise robustness, as well as its practical implementation in an incoherent imaging system. This compute-first detection scheme can pave the way for advancing infrared machine vision technologies widely used for industrial and defense applications.
- Abstract(参考訳): 視覚的知覚の文脈では、シーンからの光学信号は、画像データの形で検出器によって電子ドメインに転送され、視覚情報の抽出のために処理される。
しかし、夜間視覚応用のためのサーマルイメージングのようなノイズや弱い信号環境においては、ニューラルコンピューティングタスクの性能はノイズ検出に伴うデータ品質の固有の劣化のために重大なボトルネックに直面している。
本稿では,この問題に対処するために,検出前の光信号処理の概念を提案する。
我々は、MNIST分類でベンチマークしたように、適切に設計された線形変換器を通して空間的に再分配された光信号は、視覚知覚タスクのノイズ耐性を高めることができることを示した。
我々は,信号濃度と雑音の頑健性との関係を定量的に分析し,非整合イメージングシステムにおけるその実践的実装を支持した。
この計算ファースト検出方式は、産業や防衛用途に広く使われている赤外線機械ビジョン技術の進歩の道を開くことができる。
関連論文リスト
- Generalizable Non-Line-of-Sight Imaging with Learnable Physical Priors [52.195637608631955]
非視線画像(NLOS)は、その潜在的な応用により注目されている。
既存のNLOS再構成アプローチは、経験的物理的前提に依存して制約される。
本稿では,Learningable Path Compensation(LPC)とAdaptive Phasor Field(APF)の2つの主要な設計を含む,学習に基づく新しいソリューションを提案する。
論文 参考訳(メタデータ) (2024-09-21T04:39:45Z) - Quantifying Noise of Dynamic Vision Sensor [49.665407116447454]
動的視覚センサ(DVS)は、大量のバックグラウンドアクティビティ(BA)ノイズによって特徴付けられる。
標準的な画像処理技術を用いて,ノイズとクリーン化センサ信号とを区別することは困難である。
Detrended Fluctuation Analysis (DFA) から得られたBAノイズを特徴付ける新しい手法が提案されている。
論文 参考訳(メタデータ) (2024-04-02T13:43:08Z) - Toward deep-learning-assisted spectrally-resolved imaging of magnetic
noise [52.77024349608834]
本研究では,基礎となるゆらぎ磁場のスペクトル密度を効率的に再構成するディープニューラルネットワークを実装した。
これらの結果は、色中心に基づくナノスケールセンシングとイメージングに機械学習手法を適用する機会を生み出す。
論文 参考訳(メタデータ) (2022-08-01T19:18:26Z) - Neuromorphic Camera Denoising using Graph Neural Network-driven
Transformers [3.805262583092311]
ニューロモルフィック・ビジョン(Neuromorphic vision)は、コンピュータビジョンコミュニティのパラダイムシフトを引き起こしたバイオインスパイアされた技術である。
ニューロモルフィックカメラは、かなりの量の計測ノイズに悩まされている。
このノイズは、ニューロモルフィック事象に基づく知覚とナビゲーションアルゴリズムの性能を劣化させる。
論文 参考訳(メタデータ) (2021-12-17T18:57:36Z) - A photosensor employing data-driven binning for ultrafast image
recognition [0.0]
ピクセルビンニング(Pixel binning)は、光学画像の取得と分光において広く用いられる技術である。
ここでは、センサー要素の大部分を1つのスーパーピクセルに組み合わせることで、バイナリの概念を限界まで押し上げる。
与えられたパターン認識タスクに対しては、機械学習アルゴリズムを用いてトレーニングデータから最適な形状を決定する。
論文 参考訳(メタデータ) (2021-11-20T15:38:39Z) - Convolutional Deep Denoising Autoencoders for Radio Astronomical Images [0.0]
我々は、最先端の電波望遠鏡の合成画像に、畳み込み復号化オートエンコーダ(Convolutional Denoising Autoencoder)と呼ばれる機械学習技術を適用した。
我々のオートエンコーダは、器用感度の限界でかすかな物体を識別し、抽出する複雑な画像を効果的に識別することができる。
論文 参考訳(メタデータ) (2021-10-16T17:08:30Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z) - The Benefit of Distraction: Denoising Remote Vitals Measurements using
Inverse Attention [25.285955440420594]
本稿では,雑音の統計を興味のある信号を含む領域間で共有する手法を提案する。
本手法は, 注意マスクの逆数を用いて, 時間的観測をノイズ推定する手法である。
提案手法により, 信号対雑音比を最大5.8dBに向上させることができた。
論文 参考訳(メタデータ) (2020-10-14T13:51:33Z) - Object-based Illumination Estimation with Rendering-aware Neural
Networks [56.01734918693844]
個々の物体とその局所画像領域のRGBD外観から高速環境光推定手法を提案する。
推定照明により、仮想オブジェクトは実際のシーンと一貫性のあるシェーディングでARシナリオでレンダリングできる。
論文 参考訳(メタデータ) (2020-08-06T08:23:19Z) - Class-Specific Blind Deconvolutional Phase Retrieval Under a Generative
Prior [8.712404218757733]
この問題はフーリエ・プチコグラフィー、X線結晶学、可視光通信など様々な画像モダリティで発生する。
本稿では,事前訓練された2つの深層生成ネットワークの下での交互勾配降下アルゴリズムを用いて,この逆問題の解法を提案する。
提案アルゴリズムは,前向き測定モデルを説明する各前駆体の範囲内で,シャープな画像とぼやけたカーネルを見つけ出そうとする。
論文 参考訳(メタデータ) (2020-02-28T07:36:28Z) - Variational Denoising Network: Toward Blind Noise Modeling and Removal [59.36166491196973]
ブラインド画像のデノイングはコンピュータビジョンにおいて重要な問題であるが、非常に難しい問題である。
本稿では,ノイズ推定と画像デノーミングを併用した新しい変分推論手法を提案する。
論文 参考訳(メタデータ) (2019-08-29T15:54:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。