論文の概要: All-optical image classification through unknown random diffusers using
a single-pixel diffractive network
- arxiv url: http://arxiv.org/abs/2208.03968v1
- Date: Mon, 8 Aug 2022 08:26:08 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-09 12:22:22.517033
- Title: All-optical image classification through unknown random diffusers using
a single-pixel diffractive network
- Title(参考訳): 単一画素拡散ネットワークを用いた未知ランダムディフューザによる全光画像分類
- Authors: Yi Luo, Bijie Bai, Yuhang Li, Ege Cetintas, Aydogan Ozcan
- Abstract要約: ランダムで未知の散乱媒体の背後にある物体の分類は、計算画像とマシンビジョンフィールドの難しいタスクをセットする。
近年の深層学習に基づくアプローチは、画像センサによって収集されたディフューザ歪みパターンを用いた物体の分類を実証した。
本稿では,1画素で検出されたブロードバンド照明を用いて未知の物体をランダムな位相拡散器で直接分類する全光学プロセッサを提案する。
- 参考スコア(独自算出の注目度): 13.7472825798265
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Classification of an object behind a random and unknown scattering medium
sets a challenging task for computational imaging and machine vision fields.
Recent deep learning-based approaches demonstrated the classification of
objects using diffuser-distorted patterns collected by an image sensor. These
methods demand relatively large-scale computing using deep neural networks
running on digital computers. Here, we present an all-optical processor to
directly classify unknown objects through unknown, random phase diffusers using
broadband illumination detected with a single pixel. A set of transmissive
diffractive layers, optimized using deep learning, forms a physical network
that all-optically maps the spatial information of an input object behind a
random diffuser into the power spectrum of the output light detected through a
single pixel at the output plane of the diffractive network. We numerically
demonstrated the accuracy of this framework using broadband radiation to
classify unknown handwritten digits through random new diffusers, never used
during the training phase, and achieved a blind testing accuracy of 88.53%.
This single-pixel all-optical object classification system through random
diffusers is based on passive diffractive layers that process broadband input
light and can operate at any part of the electromagnetic spectrum by simply
scaling the diffractive features proportional to the wavelength range of
interest. These results have various potential applications in, e.g.,
biomedical imaging, security, robotics, and autonomous driving.
- Abstract(参考訳): ランダムで未知の散乱媒質の背後にある物体の分類は、計算画像とマシンビジョンの分野において困難なタスクとなる。
近年,画像センサで収集したディフューザ・ディストリクトパターンを用いて物体の分類を行った。
これらの手法は、デジタルコンピュータ上で動作するディープニューラルネットワークを用いた比較的大規模な計算を必要とする。
本稿では,単一画素で検出された広帯域照明を用いて未知の物体を未知のランダム位相ディフューザで直接分類する全光学プロセッサを提案する。
深層学習を用いて最適化された透過性拡散層からなる物理ネットワークは、ランダムディフューザの背後にある入力対象の空間情報を、回折ネットワークの出力平面の単一画素で検出された出力光のパワースペクトルに全光的にマッピングする。
広帯域放射光を用いた無作為な新しいディフューザを用いて未知の手書き文字を識別する手法の精度を数値的に実証し,88.53%のブラインドテスト精度を達成した。
ランダムディフューザによる単一画素全光学物体分類システムは、広帯域入力光を処理するパッシブ回折層に基づいており、波長範囲に比例する回折特性を単純に拡大することによって電磁スペクトルの任意の部分で動作することができる。
これらの結果は、バイオメディカルイメージング、セキュリティ、ロボティクス、自律運転など、様々な応用がある。
関連論文リスト
- Deep Learning Based Speckle Filtering for Polarimetric SAR Images. Application to Sentinel-1 [51.404644401997736]
本稿では、畳み込みニューラルネットワークを用いて偏光SAR画像のスペックルを除去するための完全なフレームワークを提案する。
実験により,提案手法はスペックル低減と分解能保存の両方において例外的な結果をもたらすことが示された。
論文 参考訳(メタデータ) (2024-08-28T10:07:17Z) - Diffusion Facial Forgery Detection [56.69763252655695]
本稿では,顔に焦点をあてた拡散生成画像を対象とした包括的データセットであるDiFFを紹介する。
人体実験といくつかの代表的な偽造検出手法を用いて,DiFFデータセットの広範な実験を行った。
その結果、人間の観察者と自動検出者の2値検出精度は30%以下であることが判明した。
論文 参考訳(メタデータ) (2024-01-29T03:20:19Z) - Rethinking the Up-Sampling Operations in CNN-based Generative Network
for Generalizable Deepfake Detection [86.97062579515833]
我々は、アップサンプリング操作から生じる一般化された構造的アーティファクトをキャプチャし、特徴付ける手段として、NPR(Neighboring Pixel Relationships)の概念を紹介した。
tft28の異なる生成モデルによって生成されたサンプルを含む、オープンワールドデータセット上で包括的な分析を行う。
この分析は、新しい最先端のパフォーマンスを確立し、既存の手法よりも優れたtft11.6%の向上を示している。
論文 参考訳(メタデータ) (2023-12-16T14:27:06Z) - Unmixing Optical Signals from Undersampled Volumetric Measurements by Filtering the Pixel Latent Variables [5.74378659752939]
遅延アンミキシング(Latent Unmixing)は、マルチスペクトルニューラルネットワークの潜在空間に帯域通過フィルタを適用する新しいアプローチである。
これは、特にアンダーサンプル分布の文脈において、個々の信号のコントリビューションのより優れた分離と定量化を可能にする。
本手法の物理実験における実用的利用を,本手法の汎用性を強調する2つの試験事例を通して紹介する。
論文 参考訳(メタデータ) (2023-12-08T20:34:37Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Probabilistic Deep Metric Learning for Hyperspectral Image
Classification [91.5747859691553]
本稿では,ハイパースペクトル画像分類のための確率論的深度学習フレームワークを提案する。
ハイパースペクトルセンサーが捉えた画像に対して、各ピクセルのカテゴリを予測することを目的としている。
我々のフレームワークは、既存のハイパースペクトル画像分類法に容易に適用できる。
論文 参考訳(メタデータ) (2022-11-15T17:57:12Z) - Time-lapse image classification using a diffractive neural network [0.0]
回折ネットワークを用いたタイムラプス画像分類方式を初めて示す。
CIFAR-10データセットからの物体の光学的分類におけるブラインドテスト精度は62.03%である。
これは、これまで1つの回折ネットワークを用いて達成された最も高い推測精度を構成する。
論文 参考訳(メタデータ) (2022-08-23T08:16:30Z) - Analysis of Diffractive Neural Networks for Seeing Through Random
Diffusers [15.017918620413585]
我々は、無作為に未知の位相拡散器を拡散ニューラルネットワークで見ることのできる、コンピュータフリーで全光学イメージング方法を提案する。
異なる相関長のランダムなディフューザを画像化するために設計された様々なディフューザネットワークを解析することにより,ディフューザネットワークの画像再構成忠実度と歪み低減能力とのトレードオフが観察された。
論文 参考訳(メタデータ) (2022-05-01T09:12:24Z) - Multispectral Satellite Data Classification using Soft Computing
Approach [5.3971200250581814]
本稿では,オブジェクトの識別のためのグリッド密度に基づくクラスタリング手法を提案する。
本稿では,ルール帰納型機械学習アルゴリズムを用いて衛星画像データを分類する手法を提案する。
論文 参考訳(メタデータ) (2022-03-21T17:25:09Z) - A photosensor employing data-driven binning for ultrafast image
recognition [0.0]
ピクセルビンニング(Pixel binning)は、光学画像の取得と分光において広く用いられる技術である。
ここでは、センサー要素の大部分を1つのスーパーピクセルに組み合わせることで、バイナリの概念を限界まで押し上げる。
与えられたパターン認識タスクに対しては、機械学習アルゴリズムを用いてトレーニングデータから最適な形状を決定する。
論文 参考訳(メタデータ) (2021-11-20T15:38:39Z) - Light Stage Super-Resolution: Continuous High-Frequency Relighting [58.09243542908402]
光ステージから採取した人間の顔の「超解像」を学習ベースで解析する手法を提案する。
本手法では,ステージ内の隣接する照明に対応する撮像画像を集約し,ニューラルネットワークを用いて顔の描画を合成する。
我々の学習モデルは、リアルな影と特異なハイライトを示す任意の光方向のレンダリングを生成することができる。
論文 参考訳(メタデータ) (2020-10-17T23:40:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。