論文の概要: Stereo Waterdrop Removal with Row-wise Dilated Attention
- arxiv url: http://arxiv.org/abs/2108.03457v1
- Date: Sat, 7 Aug 2021 14:28:30 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-10 15:39:41.129332
- Title: Stereo Waterdrop Removal with Row-wise Dilated Attention
- Title(参考訳): Row-wise Dilated Attention によるステレオ水滴除去
- Authors: Zifan Shi, Na Fan, Dit-Yan Yeung, Qifeng Chen
- Abstract要約: ステレオ画像を用いた水滴除去のための学習モデルを提案する。
本稿では,注目度を増大させるために,新しい行ワイド・アテンション・モジュールを提案する。
我々のモデルは、定量的にも定性的にも最先端の手法より優れている。
- 参考スコア(独自算出の注目度): 41.63068137345622
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing vision systems for autonomous driving or robots are sensitive to
waterdrops adhered to windows or camera lenses. Most recent waterdrop removal
approaches take a single image as input and often fail to recover the missing
content behind waterdrops faithfully. Thus, we propose a learning-based model
for waterdrop removal with stereo images. To better detect and remove
waterdrops from stereo images, we propose a novel row-wise dilated attention
module to enlarge attention's receptive field for effective information
propagation between the two stereo images. In addition, we propose an attention
consistency loss between the ground-truth disparity map and attention scores to
enhance the left-right consistency in stereo images. Because of related
datasets' unavailability, we collect a real-world dataset that contains stereo
images with and without waterdrops. Extensive experiments on our dataset
suggest that our model outperforms state-of-the-art methods both quantitatively
and qualitatively. Our source code and the stereo waterdrop dataset are
available at
\href{https://github.com/VivianSZF/Stereo-Waterdrop-Removal}{https://github.com/VivianSZF/Stereo-Waterdrop-Removal}
- Abstract(参考訳): 既存の自動運転やロボットの視覚システムは、窓やカメラレンズに付着した水滴に敏感である。
最近の水滴除去アプローチでは、単一の画像が入力として取り込まれ、水滴の背後に欠けているコンテンツを忠実に復元できないことが多い。
そこで本稿では,ステレオ画像を用いた水滴除去モデルを提案する。
ステレオ画像から水滴をよりよく検出・除去するために,2つのステレオ画像間の効果的な情報伝達のために,注目領域を拡大する新しい行ワイドアテンションモジュールを提案する。
さらに,ステレオ画像の左右の整合性を高めるため,地中不一致マップとアテンションスコアとのアテンション整合性損失を提案する。
関連するデータセットが利用できないため、ウォータードロップなしでステレオ画像を含む現実世界のデータセットを収集します。
データセットを広範囲に実験した結果,本モデルは定量的および定性的に最先端の手法を上回っていることが示唆された。
我々のソースコードとステレオウォータードロップデータセットは \href{https://github.com/VivianSZF/Stereo-Waterdrop-Removal}{https://github.com/VivianSZF/Stereo-Waterdrop-Removal} で入手できる。
関連論文リスト
- UWStereo: A Large Synthetic Dataset for Underwater Stereo Matching [37.223366825356734]
UWStereoと呼ばれる大規模な合成データセットを導入する。
データセットには,左図に対する高密度かつ高精度な不均一アノテーションを備えた合成ステレオ画像ペアが29,568個含まれている。
既存の水中データセットと比較して、UWStereoはスケール、変動、アノテーション、フォトリアリスティックな画質の点で優れている。
論文 参考訳(メタデータ) (2024-09-03T10:52:27Z) - DerainNeRF: 3D Scene Estimation with Adhesive Waterdrop Removal [12.099886168325012]
水滴により劣化した多視点画像から透明な3Dシーンを暗黙的に再構築する手法を提案する。
本手法は,水滴の位置を予測するためにアテンションネットワークを利用して,暗黙的に3Dシーンを復元するニューラルレージアンスフィールドを訓練する。
NeRFの強いシーン表現機能を活用することで,水滴を除去した高品質なノベルビュー画像をレンダリングすることができる。
論文 参考訳(メタデータ) (2024-03-29T06:58:57Z) - Osmosis: RGBD Diffusion Prior for Underwater Image Restoration [8.06874881862533]
色と深さの結合空間に先立って無条件拡散モデルを訓練する。
クリーン画像の後部サンプルを生成し,水の影響を除去する。
本手法は,難易度の高いシーンにおいて,画像復元のための最先端のベースラインよりも優れる。
論文 参考訳(メタデータ) (2024-03-21T21:13:53Z) - Perceptive self-supervised learning network for noisy image watermark
removal [59.440951785128995]
雑音の多い画像透かし除去のための知覚的自己教師型学習ネットワーク(PSLNet)を提案する。
提案手法は,雑音の多い画像透かし除去のための一般的な畳み込みニューラルネットワーク(CNN)と比較して非常に効果的である。
論文 参考訳(メタデータ) (2024-03-04T16:59:43Z) - Removing Interference and Recovering Content Imaginatively for Visible
Watermark Removal [63.576748565274706]
本研究では,Removing Interference and Recovering Content Imaginatively (RIRCI)フレームワークについて紹介する。
RIRCIは2段階のアプローチを具現化しており、最初のフェーズは透かし成分の識別と分離に焦点を当て、次のフェーズは背景コンテンツの復元に焦点を当てている。
本モデルでは,半透明透かしの下の固有背景情報を完全に探索できるデュアルパスネットワークを用いる。
論文 参考訳(メタデータ) (2023-12-22T02:19:23Z) - Video Waterdrop Removal via Spatio-Temporal Fusion in Driving Scenes [53.16726447796844]
運転中のフロントガラスの水滴は、深刻な視覚障害を引き起こし、自動車事故を引き起こす可能性がある。
本研究では、複数のフレームから表現を融合させて、水滴に隠された視覚情報を復元するアテンションベースのフレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-12T13:47:26Z) - StereoVoxelNet: Real-Time Obstacle Detection Based on Occupancy Voxels
from a Stereo Camera Using Deep Neural Networks [32.7826524859756]
障害物検出は、ステレオマッチングが一般的な視覚ベースのアプローチであるロボットナビゲーションにおいて、安全に重要な問題である。
本稿では,ステレオ画像の占有率を直接検出するために,ディープニューラルネットワークを利用する計算効率のよい手法を提案する。
提案手法は,32mの範囲の障害物を正確に検出し,最新ステレオモデルの計算コストのわずか2%に留まらず,IoU (Intersection over Union) とCD (Chamfer Distance) のスコアが向上する。
論文 参考訳(メタデータ) (2022-09-18T03:32:38Z) - Split then Refine: Stacked Attention-guided ResUNets for Blind Single
Image Visible Watermark Removal [69.92767260794628]
従来の透かし除去方法は,ユーザから透かしの位置を取得したり,マルチタスクネットワークをトレーニングして,背景を無差別に復元する必要があった。
本稿では,注目誘導型ResUNetsを積み重ねた新しい2段階フレームワークを提案し,検出・除去・精錬の過程をシミュレートする。
様々な条件下で4つの異なるデータセット上でアルゴリズムを広範囲に評価し,その手法が他の最先端手法をはるかに上回っていることを示す実験を行った。
論文 参考訳(メタデータ) (2020-12-13T09:05:37Z) - Self-Adaptively Learning to Demoire from Focused and Defocused Image
Pairs [97.67638106818613]
モアレアーティファクトはデジタル写真では一般的であり、高周波シーンコンテンツとカメラのカラーフィルタアレイとの干渉によるものである。
大規模反復で訓練された既存のディープラーニングに基づく復習手法は、様々な複雑なモアレパターンを扱う場合に限られる。
本稿では,高頻度画像の復調のための自己適応学習手法を提案する。
論文 参考訳(メタデータ) (2020-11-03T23:09:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。