論文の概要: Neural-Network-Enhanced Metalens Camera for High-Definition, Dynamic Imaging in the Long-Wave Infrared Spectrum
- arxiv url: http://arxiv.org/abs/2411.17139v1
- Date: Tue, 26 Nov 2024 06:09:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-27 13:31:22.027005
- Title: Neural-Network-Enhanced Metalens Camera for High-Definition, Dynamic Imaging in the Long-Wave Infrared Spectrum
- Title(参考訳): 長波長赤外スペクトルにおける高精細ダイナミックイメージングのためのニューラルネットワーク強化メタレンスカメラ
- Authors: Jing-Yang Wei, Hao Huang, Xin Zhang, De-Mao Ye, Yi Li, Le Wang, Yao-Guang Ma, Yang-Hui Li,
- Abstract要約: 我々は、シングルトを用いた長波長赤外線イメージングのための軽量で費用対効果の高いソリューションを開発した。
我々は,高周波化サイクル-GANニューラルネットワークをメタレンスイメージングシステムに統合する。
我々のカメラは、12.58のエンドポイント誤差値で毎秒125フレームのダイナミックイメージングを実現することができる。
- 参考スコア(独自算出の注目度): 14.057686919233646
- License:
- Abstract: To provide a lightweight and cost-effective solution for the long-wave infrared imaging using a singlet, we develop a camera by integrating a High-Frequency-Enhancing Cycle-GAN neural network into a metalens imaging system. The High-Frequency-Enhancing Cycle-GAN improves the quality of the original metalens images by addressing inherent frequency loss introduced by the metalens. In addition to the bidirectional cyclic generative adversarial network, it incorporates a high-frequency adversarial learning module. This module utilizes wavelet transform to extract high-frequency components, and then establishes a high-frequency feedback loop. It enables the generator to enhance the camera outputs by integrating adversarial feedback from the high-frequency discriminator. This ensures that the generator adheres to the constraints imposed by the high-frequency adversarial loss, thereby effectively recovering the camera's frequency loss. This recovery guarantees high-fidelity image output from the camera, facilitating smooth video production. Our camera is capable of achieving dynamic imaging at 125 frames per second with an End Point Error value of 12.58. We also achieve 0.42 for Fr\'echet Inception Distance, 30.62 for Peak Signal to Noise Ratio, and 0.69 for Structural Similarity in the recorded videos.
- Abstract(参考訳): 一重項を用いた長波長赤外線イメージングのための軽量で費用対効果の高いソリューションとして、高周波数化サイクル-GANニューラルネットをメタレンスイメージングシステムに統合してカメラを開発する。
高周波数エンハンシングサイクルGANは、メタレンがもたらす固有の周波数損失に対処することにより、元のメタレン画像の品質を向上させる。
双方向巡回生成逆数ネットワークに加えて、高周波対数学習モジュールが組み込まれている。
このモジュールはウェーブレット変換を利用して高周波成分を抽出し、高周波フィードバックループを確立する。
これにより、高周波ディスクリミネータからの対向フィードバックを統合することにより、カメラ出力を向上させることができる。
これにより、ジェネレータは、高周波対向損失による制約に順応し、これにより、カメラの周波数損失を効果的に回復する。
このリカバリにより、カメラからの高忠実度画像の出力が保証され、スムーズなビデオ制作が容易になる。
我々のカメラは、12.58のエンドポイント誤差値で毎秒125フレームのダイナミックイメージングを実現することができる。
また、Fr'echet Inception Distanceの0.42、Peak Signal to Noise Ratioの30.62、記録ビデオの構造的類似性の0.69を達成した。
関連論文リスト
- Event-Enhanced Snapshot Compressive Videography at 10K FPS [33.20071708537498]
ビデオスナップショット圧縮画像(SCI)は、ターゲットのダイナミックシーンをコンパクトにスナップショットに符号化し、その後、その高速フレームシーケンスを再構成する。
本稿では,イベントカメラをビデオSCI設定に組み込んだハイブリッド"インテンシティ+イベント"イメージング手法を提案する。
高速CMOSイメージセンサを24FPSで動作させることで、0.1msの時間間隔で高品質なビデオ撮影を実現する。
論文 参考訳(メタデータ) (2024-04-11T08:34:10Z) - Sign-Coded Exposure Sensing for Noise-Robust High-Speed Imaging [16.58669052286989]
画素レベル符号符号化露光を用いた高速フレームの光学的圧縮を提案する。
ウォルシュ関数は、高速フレーム再構築時にノイズが増幅されないようにする。
ハードウェアプロトタイプは、周囲の光のみに照らされた移動シーンの4kHzフレームの再構成を実証した。
論文 参考訳(メタデータ) (2023-05-05T01:03:37Z) - Frequency Cam: Imaging Periodic Signals in Real-Time [1.774900701865444]
本稿では,画像画素がフリックする基本周波数を検出するための,効率的で非同期なイベントカメラアルゴリズムを提案する。
フルセンサ・周波数イメージングにおける重要な設計パラメータについて論じる。
ラップトップCPUの単一コア上で,毎秒5000万イベント以上で動作する,ROSノードとしてのオープンソース実装である Frequency Cam について紹介する。
論文 参考訳(メタデータ) (2022-11-01T00:08:35Z) - Aug-NeRF: Training Stronger Neural Radiance Fields with Triple-Level
Physically-Grounded Augmentations [111.08941206369508]
我々は,NeRFトレーニングの正規化にロバストなデータ拡張のパワーを初めてもたらすAugmented NeRF(Aug-NeRF)を提案する。
提案手法では,最悪の場合の摂動を3段階のNeRFパイプラインにシームレスにブレンドする。
Aug-NeRFは、新しいビュー合成と基礎となる幾何再構成の両方において、NeRF性能を効果的に向上させる。
論文 参考訳(メタデータ) (2022-07-04T02:27:07Z) - Ev-NeRF: Event Based Neural Radiance Field [8.78321125097048]
Ev-NeRFは、イベントデータから派生したニューラル放射場である。
Ev-NeRFは、超音環境下での高強度画像再構成において、競合性能を実現する。
論文 参考訳(メタデータ) (2022-06-24T18:27:30Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z) - Focal Frequency Loss for Image Reconstruction and Synthesis [125.7135706352493]
周波数領域の狭さが画像再構成と合成品質をさらに改善できることを示す。
本稿では,合成が難しい周波数成分に適応的に焦点を合わせることのできる,新しい焦点周波数損失を提案する。
論文 参考訳(メタデータ) (2020-12-23T17:32:04Z) - Multi-level Wavelet-based Generative Adversarial Network for Perceptual
Quality Enhancement of Compressed Video [51.631731922593225]
既存の手法は主に、その知覚的品質を無視しながら、圧縮映像の客観的品質を高めることに焦点を当てている。
圧縮ビデオの知覚品質を高めるために,マルチレベルウェーブレットパケット変換(WPT)に基づくGAN(Generative Adversarial Network)を提案する。
論文 参考訳(メタデータ) (2020-08-02T15:01:38Z) - Wavelet Integrated CNNs for Noise-Robust Image Classification [51.18193090255933]
我々は、離散ウェーブレット変換(DWT)により、最大プール、ストライド畳み込み、平均プールを置き換えることでCNNを強化する。
VGG、ResNets、DenseNetのウェーブレット統合バージョンであるWaveCNetsは、バニラバージョンよりも精度が高く、ノイズ・ロバスト性も向上している。
論文 参考訳(メタデータ) (2020-05-07T09:10:41Z) - Blur, Noise, and Compression Robust Generative Adversarial Networks [85.68632778835253]
劣化画像から直接クリーンな画像生成装置を学習するために, ぼかし, ノイズ, 圧縮堅牢なGAN(BNCR-GAN)を提案する。
NR-GANにインスパイアされたBNCR-GANは、画像、ぼやけたカーネル、ノイズ、品質要素ジェネレータで構成される多重ジェネレータモデルを使用する。
CIFAR-10の大規模比較とFFHQの一般性解析によるBNCR-GANの有効性を実証する。
論文 参考訳(メタデータ) (2020-03-17T17:56:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。