論文の概要: Left-right Discrepancy for Adversarial Attack on Stereo Networks
- arxiv url: http://arxiv.org/abs/2401.07188v1
- Date: Sun, 14 Jan 2024 02:30:38 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-17 19:19:41.986668
- Title: Left-right Discrepancy for Adversarial Attack on Stereo Networks
- Title(参考訳): ステレオネットワークにおける敵攻撃の左右差
- Authors: Pengfei Wang, Xiaofei Hui, Beijia Lu, Nimrod Lilith, Jun Liu, Sameer
Alam
- Abstract要約: 本稿では,左画像特徴と右画像特徴との差を最大化するために,摂動雑音を発生させる新しい対向攻撃手法を提案する。
実験により,ステレオニューラルネットワークにおいて予測誤差を増大させる手法の優れた性能を示す。
- 参考スコア(独自算出の注目度): 8.420135490466851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo matching neural networks often involve a Siamese structure to extract
intermediate features from left and right images. The similarity between these
intermediate left-right features significantly impacts the accuracy of
disparity estimation. In this paper, we introduce a novel adversarial attack
approach that generates perturbation noise specifically designed to maximize
the discrepancy between left and right image features. Extensive experiments
demonstrate the superior capability of our method to induce larger prediction
errors in stereo neural networks, e.g. outperforming existing state-of-the-art
attack methods by 219% MAE on the KITTI dataset and 85% MAE on the Scene Flow
dataset. Additionally, we extend our approach to include a proxy network
black-box attack method, eliminating the need for access to stereo neural
network. This method leverages an arbitrary network from a different vision
task as a proxy to generate adversarial noise, effectively causing the stereo
network to produce erroneous predictions. Our findings highlight a notable
sensitivity of stereo networks to discrepancies in shallow layer features,
offering valuable insights that could guide future research in enhancing the
robustness of stereo vision systems.
- Abstract(参考訳): ステレオマッチングニューラルネットワークは、左右の画像から中間的特徴を抽出するシームズ構造を含むことが多い。
これらの中間的な左右の特徴の類似性は、差分推定の精度に大きな影響を及ぼす。
本稿では,左右画像の特徴の相違を最大化するために特別に設計された摂動雑音を生成する新しい攻撃手法を提案する。
例えば、KITTIデータセットでは219%のMAE、Scene Flowデータセットでは85%のMAEで既存の最先端攻撃手法より優れている。
さらに,このアプローチを拡張して,ステレオニューラルネットワークへのアクセスを不要とした,プロキシネットワークブラックボックス攻撃手法も導入した。
この方法は、異なるビジョンタスクから任意のネットワークをプロキシとして活用し、逆ノイズを生成し、ステレオネットワークが誤った予測を効果的に生み出す。
本研究は,立体視システムの強靭性向上に寄与する貴重な知見を提供するため,浅層構造における不一致に対するステレオネットワークの顕著な感度を強調した。
関連論文リスト
- Stereo Risk: A Continuous Modeling Approach to Stereo Matching [110.22344879336043]
我々はコンピュータビジョンにおける古典的ステレオマッチング問題を解決するための新しいディープラーニングアプローチであるStereo Riskを紹介する。
ステレオリスクはディープネットワーク,特にマルチモーダル確率分布の相違に対して,ステレオマッチング性能を向上させることを実証する。
総合的な分析により,提案手法の理論的健全性と,各種ベンチマークデータセットにおける最先端手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-07-03T14:30:47Z) - StereoVoxelNet: Real-Time Obstacle Detection Based on Occupancy Voxels
from a Stereo Camera Using Deep Neural Networks [32.7826524859756]
障害物検出は、ステレオマッチングが一般的な視覚ベースのアプローチであるロボットナビゲーションにおいて、安全に重要な問題である。
本稿では,ステレオ画像の占有率を直接検出するために,ディープニューラルネットワークを利用する計算効率のよい手法を提案する。
提案手法は,32mの範囲の障害物を正確に検出し,最新ステレオモデルの計算コストのわずか2%に留まらず,IoU (Intersection over Union) とCD (Chamfer Distance) のスコアが向上する。
論文 参考訳(メタデータ) (2022-09-18T03:32:38Z) - Bayesian Learning for Disparity Map Refinement for Semi-Dense Active
Stereo Vision [30.330599857204344]
本稿では,ニューラルネットワークを学習し,半高精細能動ステレオビジョンのための高品質なサブピクセル不均質マップを推定する新たな学習手法を提案する。
提案手法は,現在最先端のアクティブステレオモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-09-12T08:33:40Z) - From Environmental Sound Representation to Robustness of 2D CNN Models
Against Adversarial Attacks [82.21746840893658]
本稿では, 各種環境音響表現(スペクトログラム)が, 被害者残差畳み込みニューラルネットワークの認識性能と対角攻撃性に与える影響について検討する。
DWTスペクトログラムでトレーニングしたResNet-18モデルでは高い認識精度が得られたが、このモデルに対する攻撃は敵にとって比較的コストがかかる。
論文 参考訳(メタデータ) (2022-04-14T15:14:08Z) - Stereoscopic Universal Perturbations across Different Architectures and
Datasets [60.021985610201156]
本研究では,画像の逆摂動が不均一性推定タスクの深部ステレオマッチングネットワークに与える影響について検討する。
本稿では,データセット内の任意のステレオ画像対に追加されると,ステレオネットワークを騙すことのできる,単一の摂動セットを構築する方法を提案する。
我々の摂動は、最先端のステレオネットワークのD1エラーを1%から87%に増やすことができる。
論文 参考訳(メタデータ) (2021-12-12T02:11:31Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Stereopagnosia: Fooling Stereo Networks with Adversarial Perturbations [71.00754846434744]
知覚不能な加法的摂動は,差分マップを著しく変更できることを示す。
敵データ拡張に使用すると、我々の摂動はより堅牢なトレーニングされたモデルをもたらすことを示す。
論文 参考訳(メタデータ) (2020-09-21T19:20:09Z) - Learning Stereo Matchability in Disparity Regression Networks [40.08209864470944]
本稿では,画素ワイドマッチング性を考慮したステレオマッチングネットワークを提案する。
提案したDeep stereo Matchability (DSM) フレームワークは、品質を保証しながら、マッチング結果を改善したり、計算を高速化することができる。
論文 参考訳(メタデータ) (2020-08-11T15:55:49Z) - A Lightweight Neural Network for Monocular View Generation with
Occlusion Handling [46.74874316127603]
1枚の画像からビュー合成を行うステレオデータペアに基づいて訓練された,非常に軽量なニューラルネットワークアーキテクチャを提案する。
この作業は、挑戦的なKITTIデータセットにおいて、視覚的および計量的に最先端のアプローチよりも優れています。
論文 参考訳(メタデータ) (2020-07-24T15:29:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。