論文の概要: A Robust Visual Sampling Model Inspired by Receptive Field
- arxiv url: http://arxiv.org/abs/2201.01030v1
- Date: Tue, 4 Jan 2022 08:14:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 14:05:48.014068
- Title: A Robust Visual Sampling Model Inspired by Receptive Field
- Title(参考訳): 受容場にインスパイアされたロバストな視覚サンプリングモデル
- Authors: Liwen Hu, Lei Ma, Dawei Weng, Tiejun Huang
- Abstract要約: 網膜を模倣したスパイクカメラは、スパイクを発射することでピクセル当たりの輝度の蓄積を報告できる。
現在のスパイクカメラのサンプリングモデルは、量子化やノイズの影響を受けやすいため、オブジェクトのテクスチャの詳細を効果的に捉えることはできない。
本研究では、受容場(RVSM)にインスパイアされた頑健なビジュアルサンプリングモデルを提案する。
- 参考スコア(独自算出の注目度): 34.61947785457023
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Spike camera mimicking the retina fovea can report per-pixel luminance
intensity accumulation by firing spikes. As a bio-inspired vision sensor with
high temporal resolution, it has a huge potential for computer vision. However,
the sampling model in current Spike camera is so susceptible to quantization
and noise that it cannot capture the texture details of objects effectively. In
this work, a robust visual sampling model inspired by receptive field (RVSM) is
proposed where wavelet filter generated by difference of Gaussian (DoG) and
Gaussian filter are used to simulate receptive field. Using corresponding
method similar to inverse wavelet transform, spike data from RVSM can be
converted into images. To test the performance, we also propose a high-speed
motion spike dataset (HMD) including a variety of motion scenes. By comparing
reconstructed images in HMD, we find RVSM can improve the ability of capturing
information of Spike camera greatly. More importantly, due to mimicking
receptive field mechanism to collect regional information, RVSM can filter high
intensity noise effectively and improves the problem that Spike camera is
sensitive to noise largely. Besides, due to the strong generalization of
sampling structure, RVSM is also suitable for other neuromorphic vision sensor.
Above experiments are finished in a Spike camera simulator.
- Abstract(参考訳): 網膜窩を模したスパイクカメラは、発火スパイクによってピクセル当たりの輝度の蓄積を報告できる。
高時間分解能のバイオインスパイアされた視覚センサとして、コンピュータビジョンには大きな可能性を秘めている。
しかし、現在のスパイクカメラのサンプリングモデルは量子化やノイズの影響を受けやすく、オブジェクトのテクスチャの詳細を効果的に捉えることができない。
本研究では、受容場(RVSM)にインスパイアされた頑健な視覚サンプリングモデルを提案し、ガウスフィルタ(DoG)とガウスフィルタ(Gaussian filter)の違いによって生成されたウェーブレットフィルタを用いて受容場をシミュレートする。
逆ウェーブレット変換と同様の手法を用いて、RVSMからのスパイクデータを画像に変換することができる。
また,様々な動きシーンを含む高速モーションスパイクデータセット(HMD)を提案する。
HMDにおける再構成画像を比較することで、RVSMはスパイクカメラの情報収集能力を大幅に向上させることができる。
さらに,地域情報を収集するための受容場機構の模倣により,RVSMは高強度ノイズを効果的にフィルタリングすることができ,Spikeカメラがノイズに敏感であるという問題を改善することができる。
また、サンプリング構造の強い一般化により、RVSMは他のニューロモルフィック視覚センサにも適している。
上記の実験はスパイクカメラシミュレーターで完了する。
関連論文リスト
- SpikMamba: When SNN meets Mamba in Event-based Human Action Recognition [13.426390494116776]
人間の行動認識(HAR)は、ビデオ分析、監視、自律運転、ロボット工学、医療など、様々な分野で重要な役割を果たしている。
ほとんどのHARアルゴリズムは、詳細な視覚情報をキャプチャするRGB画像から開発されている。
イベントカメラは、全画像を撮影することなく、ピクセルレベルでのシーンの明るさ変化をわずかに捉えることで、有望な解決策を提供する。
論文 参考訳(メタデータ) (2024-10-22T07:00:43Z) - Motion-adaptive Separable Collaborative Filters for Blind Motion Deblurring [71.60457491155451]
様々な動きによって生じる画像のぼかしを除去することは、難しい問題である。
本研究では,動き適応型分離型協調フィルタと呼ばれる実世界のデブロアリングフィルタモデルを提案する。
本手法は,実世界の動きのぼかし除去に有効な解法を提供し,最先端の性能を実現する。
論文 参考訳(メタデータ) (2024-04-19T19:44:24Z) - Spike-NeRF: Neural Radiance Field Based On Spike Camera [24.829344089740303]
スパイクデータから導出した最初のニューラルレーダランス場であるSpike-NeRFを提案する。
NeRFと同時に撮影されたマルチビュー画像の代わりに、Spike-NeRFの入力は、非常に短時間で動くスパイクカメラによってキャプチャされた連続的なスパイクストリームである。
その結果,Spike-NeRFは既存の手法や高速シーンで提案したベースラインよりも視覚的に魅力的な結果が得られることがわかった。
論文 参考訳(メタデータ) (2024-03-25T04:05:23Z) - Finding Visual Saliency in Continuous Spike Stream [23.591309376586835]
本稿では,連続スパイク流における視覚的塩分濃度を初めて検討する。
本稿では,フルスパイクニューラルネットワークに基づくRecurrent Spiking Transformerフレームワークを提案する。
我々のフレームワークは、スパイクストリームにおける視覚的サリエンシの強調とキャプチャにおいて、大幅に改善されている。
論文 参考訳(メタデータ) (2024-03-10T15:15:35Z) - DynaMoN: Motion-Aware Fast and Robust Camera Localization for Dynamic Neural Radiance Fields [71.94156412354054]
動的ニューラルラジアンス場(DynaMoN)の高速かつロバストなカメラ位置推定法を提案する。
DynaMoNは、初期のカメラポーズ推定と高速で正確なノベルビュー合成のための静的集光線サンプリングのために動的コンテンツを処理している。
我々は,TUM RGB-DデータセットとBONN RGB-D Dynamicデータセットの2つの実世界の動的データセットに対するアプローチを広く評価した。
論文 参考訳(メタデータ) (2023-09-16T08:46:59Z) - Multi-Modal Neural Radiance Field for Monocular Dense SLAM with a
Light-Weight ToF Sensor [58.305341034419136]
単眼カメラと軽量ToFセンサを備えた初の高密度SLAMシステムを提案する。
本稿では,RGBカメラと軽量ToFセンサの両方の信号のレンダリングをサポートするマルチモーダル暗黙のシーン表現を提案する。
実験により,本システムは軽量なToFセンサの信号をうまく利用し,競合的な結果が得られることが示された。
論文 参考訳(メタデータ) (2023-08-28T07:56:13Z) - Recurrent Spike-based Image Restoration under General Illumination [21.630646894529065]
スパイクカメラは、高時間分解能(2万Hz)のスパイクアレイの形で光強度を記録する、バイオインスパイアされた新しいタイプの視覚センサーである
既存のスパイクベースのアプローチは通常、シーンは十分な光強度を持つと仮定し、雨の日や夕暮れのシーンのような多くの現実のシナリオでは利用できない。
本稿では、一般的な照明下でのスパイクアレイからの鮮明な画像の復元に向けた最初の取り組みである、リカレントスパイクに基づく画像復元(RSIR)ネットワークを提案する。
論文 参考訳(メタデータ) (2023-08-06T04:24:28Z) - Spike Stream Denoising via Spike Camera Simulation [64.11994763727631]
本稿では,スパイクカメラのユニークな回路に基づくシステマティックノイズモデルを提案する。
スパイクストリームをデノナイジングするための最初のベンチマークは、クリアな(ノイズの多い)スパイクストリームを含む。
実験の結果、DnSSは提案されたベンチマークで有望なパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-04-06T14:59:48Z) - Ev-NeRF: Event Based Neural Radiance Field [8.78321125097048]
Ev-NeRFは、イベントデータから派生したニューラル放射場である。
Ev-NeRFは、超音環境下での高強度画像再構成において、競合性能を実現する。
論文 参考訳(メタデータ) (2022-06-24T18:27:30Z) - Wavelet-Based Network For High Dynamic Range Imaging [64.66969585951207]
光学フローベースやエンド・ツー・エンドのディープラーニングベースのソリューションのような既存の方法は、詳細な復元やゴーストを除去する際にエラーを起こしやすい。
本研究では、周波数領域でHDR融合を行うための新しい周波数誘導型エンド・ツー・エンドディープニューラルネットワーク(FNet)を提案し、ウェーブレット変換(DWT)を用いて入力を異なる周波数帯域に分解する。
低周波信号は特定のゴーストアーティファクトを避けるために使用され、高周波信号は詳細を保存するために使用される。
論文 参考訳(メタデータ) (2021-08-03T12:26:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。