論文の概要: The Benefit of Distraction: Denoising Remote Vitals Measurements using
Inverse Attention
- arxiv url: http://arxiv.org/abs/2010.07770v1
- Date: Wed, 14 Oct 2020 13:51:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-07 14:30:19.734559
- Title: The Benefit of Distraction: Denoising Remote Vitals Measurements using
Inverse Attention
- Title(参考訳): トラクションの利点:逆アテンションを用いたリモートバイタル計測
- Authors: Ewa Nowara, Daniel McDuff, Ashok Veeraraghavan
- Abstract要約: 本稿では,雑音の統計を興味のある信号を含む領域間で共有する手法を提案する。
本手法は, 注意マスクの逆数を用いて, 時間的観測をノイズ推定する手法である。
提案手法により, 信号対雑音比を最大5.8dBに向上させることができた。
- 参考スコア(独自算出の注目度): 25.285955440420594
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Attention is a powerful concept in computer vision. End-to-end networks that
learn to focus selectively on regions of an image or video often perform
strongly. However, other image regions, while not necessarily containing the
signal of interest, may contain useful context. We present an approach that
exploits the idea that statistics of noise may be shared between the regions
that contain the signal of interest and those that do not. Our technique uses
the inverse of an attention mask to generate a noise estimate that is then used
to denoise temporal observations. We apply this to the task of camera-based
physiological measurement. A convolutional attention network is used to learn
which regions of a video contain the physiological signal and generate a
preliminary estimate. A noise estimate is obtained by using the pixel
intensities in the inverse regions of the learned attention mask, this in turn
is used to refine the estimate of the physiological signal. We perform
experiments on two large benchmark datasets and show that this approach
produces state-of-the-art results, increasing the signal-to-noise ratio by up
to 5.8 dB, reducing heart rate and breathing rate estimation error by as much
as 30%, recovering subtle pulse waveform dynamics, and generalizing from RGB to
NIR videos without retraining.
- Abstract(参考訳): 注意はコンピュータビジョンにおける強力な概念である。
画像やビデオの領域に選択的にフォーカスすることを学ぶエンドツーエンドネットワークは、しばしば強く機能する。
しかし、他の画像領域は、必ずしも関心のシグナルを含まないが、有用なコンテキストを含むかもしれない。
本稿では,関心のある信号を含む領域とそうでない領域の間で,ノイズの統計情報を共有できるという考え方を生かしたアプローチを提案する。
本手法は, 注意マスクの逆数を用いて, 時間的観測をノイズ推定する手法である。
これをカメラによる生理的計測の課題に適用する。
コンボリューショナルアテンションネットワークを用いて、ビデオのどの領域が生理的信号を含んでいるかを学び、予備推定を生成する。
学習した注目マスクの逆領域の画素強度を用いて雑音推定を行い、これを生理信号の推定を洗練させる。
2つの大きなベンチマークデータセットで実験を行い、この手法が最先端の結果を生成し、信号対雑音比を最大5.8dB、心拍数と呼吸速度推定誤差を最大30%削減し、微妙なパルス波形のダイナミクスを回復し、リトレーニングなしでRGBからNIRビデオに一般化することを示した。
関連論文リスト
- Learning to Enhance Aperture Phasor Field for Non-Line-of-Sight Imaging [22.365437882740657]
本研究の目的は,サンプリングやスキャンエリアの数を削減し,より実用的なNLOSイメージングを実現することである。
本研究では,デノナイズドオートエンコーダ方式を利用して,測定空間におけるリッチでノイズの多い表現を得る。
我々は、ネットワークのスペクトルを周波数範囲に制限するために、ファサーベースパイプラインを導入する。
論文 参考訳(メタデータ) (2024-07-26T07:57:07Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - Compute-first optical detection for noise-resilient visual perception [0.5325390073522079]
本稿では,この問題に対処するために,検出前の光信号処理の概念を提案する。
線形変圧器によって空間的に再分配された光信号は、視覚的知覚タスクの検出ノイズ耐性を高めることができることを示す。
この計算ファースト検出方式は、産業や防衛用途に広く使われている赤外線機械ビジョン技術の進歩の道を開くことができる。
論文 参考訳(メタデータ) (2024-03-14T17:51:38Z) - Differentiable Frequency-based Disentanglement for Aerial Video Action
Recognition [56.91538445510214]
ビデオにおける人間の行動認識のための学習アルゴリズムを提案する。
我々のアプローチは、主に斜めに配置されたダイナミックカメラから取得されるUAVビデオのために設計されている。
我々はUAV HumanデータセットとNEC Droneデータセットについて広範な実験を行った。
論文 参考訳(メタデータ) (2022-09-15T22:16:52Z) - DRNet: Decomposition and Reconstruction Network for Remote Physiological
Measurement [39.73408626273354]
既存の方法は一般に2つのグループに分けられる。
1つ目は、顔ビデオから微妙な音量パルス(BVP)信号を抽出することに焦点を当てているが、顔ビデオコンテンツを支配するノイズを明示的にモデル化することはめったにない。
第二に、ノイズの多いデータを直接モデリングすることに焦点を当てており、これらの厳密なランダムノイズの規則性の欠如により、最適以下の性能が得られる。
論文 参考訳(メタデータ) (2022-06-12T07:40:10Z) - Zero-shot Blind Image Denoising via Implicit Neural Representations [77.79032012459243]
暗黙的ニューラル表現(INR)のアーキテクチャ的帰納的バイアスを利用した代替的認知戦略を提案する。
提案手法は,低雑音シナリオや実雑音シナリオの広い範囲において,既存のゼロショット復調手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-04-05T12:46:36Z) - Deep Impulse Responses: Estimating and Parameterizing Filters with Deep
Networks [76.830358429947]
高雑音および地中設定におけるインパルス応答推定は難しい問題である。
本稿では,ニューラル表現学習の最近の進歩に基づいて,インパルス応答のパラメータ化と推定を行う新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-07T18:57:23Z) - Exploring Inter-frequency Guidance of Image for Lightweight Gaussian
Denoising [1.52292571922932]
本稿では,周波数帯域を低域から高域に漸進的に洗練するために,IGNetと呼ばれる新しいネットワークアーキテクチャを提案する。
この設計では、より周波数間先行と情報を利用するため、モデルサイズは軽量化でき、競争結果も維持できる。
論文 参考訳(メタデータ) (2021-12-22T10:35:53Z) - Amplitude-Phase Recombination: Rethinking Robustness of Convolutional
Neural Networks in Frequency Domain [31.182376196295365]
CNNは、トレーニング画像の高周波成分と密接に関連する局所最適値に収束する傾向にある。
現在の画像の位相スペクトルとイントラクタ画像の振幅スペクトルを再結合して設計されたデータ拡張に関する新しい視点。
論文 参考訳(メタデータ) (2021-08-19T04:04:41Z) - Spatial-Phase Shallow Learning: Rethinking Face Forgery Detection in
Frequency Domain [88.7339322596758]
本論文では,空間画像と位相スペクトルを組み合わせ,顔の偽造のアップサンプリング成果をキャプチャするSPSL(Spatial-Phase Shallow Learning)法を提案する。
SPSLは、クロスデータセット評価における最先端性能とマルチクラス分類を実現し、単一データセット評価において同等の結果を得ることができる。
論文 参考訳(メタデータ) (2021-03-02T16:45:08Z) - ADRN: Attention-based Deep Residual Network for Hyperspectral Image
Denoising [52.01041506447195]
ノイズの多いHSIからクリーンなHSIへのマッピングを学習するために,注目に基づくディープ残差ネットワークを提案する。
実験の結果,提案手法は定量的および視覚的評価において最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2020-03-04T08:36:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。