論文の概要: Towards Adversarially Robust and Domain Generalizable Stereo Matching by
Rethinking DNN Feature Backbones
- arxiv url: http://arxiv.org/abs/2108.00335v1
- Date: Sat, 31 Jul 2021 22:44:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-04 11:04:22.556740
- Title: Towards Adversarially Robust and Domain Generalizable Stereo Matching by
Rethinking DNN Feature Backbones
- Title(参考訳): DNN特徴バックボーンの再考による逆ロバストとドメイン一般化可能なステレオマッチングに向けて
- Authors: Kelvin Cheng, Christopher Healey, Tianfu Wu
- Abstract要約: 本稿では,弱いホワイトボックス攻撃が最先端の手法を失敗させる可能性があることを示す。
提案手法はSceneFlowデータセットとKITTI2015ベンチマークで検証される。
これは、最先端の手法に匹敵する精度を維持しながら、敵の堅牢性を大幅に改善する。
- 参考スコア(独自算出の注目度): 14.569829985753346
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stereo matching has recently witnessed remarkable progress using Deep Neural
Networks (DNNs). But, how robust are they? Although it has been well-known that
DNNs often suffer from adversarial vulnerability with a catastrophic drop in
performance, the situation is even worse in stereo matching. This paper first
shows that a type of weak white-box attacks can fail state-of-the-art methods.
The attack is learned by a proposed stereo-constrained projected gradient
descent (PGD) method in stereo matching. This observation raises serious
concerns for the deployment of DNN-based stereo matching. Parallel to the
adversarial vulnerability, DNN-based stereo matching is typically trained under
the so-called simulation to reality pipeline, and thus domain generalizability
is an important problem. This paper proposes to rethink the learnable DNN-based
feature backbone towards adversarially-robust and domain generalizable stereo
matching, either by completely removing it or by applying it only to the left
reference image. It computes the matching cost volume using the classic
multi-scale census transform (i.e., local binary pattern) of the raw input
stereo images, followed by a stacked Hourglass head sub-network solving the
matching problem. In experiments, the proposed method is tested in the
SceneFlow dataset and the KITTI2015 benchmark. It significantly improves the
adversarial robustness, while retaining accuracy performance comparable to
state-of-the-art methods. It also shows better generalizability from simulation
(SceneFlow) to real (KITTI) datasets when no fine-tuning is used.
- Abstract(参考訳): ステレオマッチングは、最近Deep Neural Networks (DNN)を使用して顕著な進歩をみせた。
でも どれぐらい頑丈なの?
DNNが壊滅的な性能低下を伴う敵意の脆弱性に悩まされることはよく知られているが、ステレオマッチングの状況はさらに悪化している。
本稿ではまず,ホワイトボックス攻撃の一種が最先端の手法に失敗する可能性を示す。
この攻撃はステレオマッチングにおいて提案した立体拘束型射影勾配降下法(PGD)によって学習される。
この観察は、DNNベースのステレオマッチングの展開に対する深刻な懸念を引き起こす。
逆境の脆弱性と並行して、DNNベースのステレオマッチングは一般的に、現実のパイプラインへのシミュレーションの下で訓練される。
本稿では,学習可能なDNNベースの特徴バックボーンを,完全に取り除いたり,左参照画像にのみ適用することで,逆ロスや領域一般化可能なステレオマッチングに再考する。
原入力ステレオ画像の古典的マルチスケール・サーチ変換(ローカルバイナリ・パターン)を用いてマッチングコストを計算し、次いでマッチング問題を解いたHourglassヘッドサブネットワークを積み重ねる。
実験では,提案手法をSceneFlowデータセットとKITTI2015ベンチマークで検証した。
これは、最先端の方法に匹敵する精度を保ちながら、逆のロバスト性を大幅に改善する。
また、微調整を行わない場合、シミュレーション(SceneFlow)からリアル(KITTI)データセットへの一般化性も向上する。
関連論文リスト
- VQUNet: Vector Quantization U-Net for Defending Adversarial Atacks by Regularizing Unwanted Noise [0.5755004576310334]
本稿では,新たなノイズ低減手法であるベクトル量子化U-Net(VQUNet)を導入し,対向雑音を低減し,高忠実度でデータを再構成する。
VQUNetは、ノイズ低減とデータ再構成の両方のためのマルチスケール階層構造を通して、離散潜在表現学習を特徴とする。
これは、Fashion-MNISTとCIFAR10データセットの両方に対する様々な敵攻撃の下で、最先端のノイズ低減ベースの防衛手法より優れている。
論文 参考訳(メタデータ) (2024-06-05T10:10:03Z) - A Geometrical Approach to Evaluate the Adversarial Robustness of Deep
Neural Networks [52.09243852066406]
対向収束時間スコア(ACTS)は、対向ロバストネス指標として収束時間を測定する。
我々は,大規模画像Netデータセットに対する異なる敵攻撃に対して,提案したACTSメトリックの有効性と一般化を検証する。
論文 参考訳(メタデータ) (2023-10-10T09:39:38Z) - Evaluating Similitude and Robustness of Deep Image Denoising Models via
Adversarial Attack [60.40356882897116]
ディープニューラルネットワーク(DNN)は、従来の画像復調アルゴリズムよりも優れたパフォーマンスを示している。
本稿では,現在のディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディープ・ディナイジング・PGD(Denoising-PGD)と名づけられた敵攻撃手法を提案する。
論文 参考訳(メタデータ) (2023-06-28T09:30:59Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - Shuffled Patch-Wise Supervision for Presentation Attack Detection [12.031796234206135]
顔の偽造防止は、写真、ビデオ、マスク、または認証された人の顔の別の代用品を使用することによって、偽の顔認証を防止するために不可欠である。
ほとんどのプレゼンテーションアタック検出システムはオーバーフィッティングに悩まされており、1つのデータセットでほぼ完璧なスコアを得るが、より現実的なデータを持つ別のデータセットでは失敗する。
画素単位のバイナリ管理とパッチベースのCNNを組み合わせた新しいPAD手法を提案する。
論文 参考訳(メタデータ) (2021-09-08T08:14:13Z) - Generalizing RNN-Transducer to Out-Domain Audio via Sparse
Self-Attention Layers [7.025709586759655]
リカレントニューラルネットワークトランスデューサ(RNN-T)は、有望なエンドツーエンド音声認識フレームワークである。
Conformerは、その畳み込み層と自己認識層を通じて、ローカル・グローバルコンテキスト情報を効果的にモデル化することができる。
Conformer RNN-Tのドメインミスマッチ問題は、まだ十分に研究されていない。
論文 参考訳(メタデータ) (2021-08-22T08:06:15Z) - Discriminator-Free Generative Adversarial Attack [87.71852388383242]
生成的ベースの敵攻撃は、この制限を取り除くことができる。
ASymmetric Saliency-based Auto-Encoder (SSAE) は摂動を生成する。
SSAEが生成した敵の例は、広く使われているモデルを崩壊させるだけでなく、優れた視覚的品質を実現する。
論文 参考訳(メタデータ) (2021-07-20T01:55:21Z) - Detect and Defense Against Adversarial Examples in Deep Learning using
Natural Scene Statistics and Adaptive Denoising [12.378017309516965]
本稿では,DNN を敵のサンプルから守るためのフレームワークを提案する。
この検出器は、自然の景観統計を利用してAEを検出することを目的としている。
提案手法は最先端の防御技術より優れている。
論文 参考訳(メタデータ) (2021-07-12T23:45:44Z) - Learning Stereo Matchability in Disparity Regression Networks [40.08209864470944]
本稿では,画素ワイドマッチング性を考慮したステレオマッチングネットワークを提案する。
提案したDeep stereo Matchability (DSM) フレームワークは、品質を保証しながら、マッチング結果を改善したり、計算を高速化することができる。
論文 参考訳(メタデータ) (2020-08-11T15:55:49Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z) - Disp R-CNN: Stereo 3D Object Detection via Shape Prior Guided Instance
Disparity Estimation [51.17232267143098]
ステレオ画像から3次元物体を検出するための新しいシステムDisp R-CNNを提案する。
我々は、LiDAR点雲を必要とせずに、統計的形状モデルを用いて、密度の異なる擬似地下構造を生成する。
KITTIデータセットの実験によると、LiDARの基盤構造がトレーニング時に利用できない場合でも、Disp R-CNNは競争性能を達成し、平均精度で従来の最先端手法を20%上回っている。
論文 参考訳(メタデータ) (2020-04-07T17:48:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。