論文の概要: Local Similarity Pattern and Cost Self-Reassembling for Deep Stereo
Matching Networks
- arxiv url: http://arxiv.org/abs/2112.01011v2
- Date: Sun, 5 Dec 2021 01:38:31 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 12:06:33.814523
- Title: Local Similarity Pattern and Cost Self-Reassembling for Deep Stereo
Matching Networks
- Title(参考訳): 深部ステレオマッチングネットワークにおける局所類似パターンとコスト自己再構成
- Authors: Biyang Liu, Huimin Yu, Yangqi Long
- Abstract要約: LSP(Local similarity Pattern)という,深層ステレオマッチングネットワークのためのペア機能を導入する。
隣接する関係を明確に明らかにすることで、LSPはより識別的な特徴記述を支援するために活用できる豊富な構造情報を含んでいる。
第2に,動的自己組み換え改良戦略を設計し,コスト分布と分散マップにそれぞれ適用する。
- 参考スコア(独自算出の注目度): 3.7384509727711923
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although convolution neural network based stereo matching architectures have
made impressive achievements, there are still some limitations: 1)
Convolutional Feature (CF) tends to capture appearance information, which is
inadequate for accurate matching. 2) Due to the static filters, current
convolution based disparity refinement modules often produce over-smooth
results. In this paper, we present two schemes to address these issues, where
some traditional wisdoms are integrated. Firstly, we introduce a pairwise
feature for deep stereo matching networks, named LSP (Local Similarity
Pattern). Through explicitly revealing the neighbor relationships, LSP contains
rich structural information, which can be leveraged to aid CF for more
discriminative feature description. Secondly, we design a dynamic
self-reassembling refinement strategy and apply it to the cost distribution and
the disparity map respectively. The former could be equipped with the unimodal
distribution constraint to alleviate the over-smoothing problem, and the latter
is more practical. The effectiveness of the proposed methods is demonstrated
via incorporating them into two well-known basic architectures, GwcNet and
GANet-deep. Experimental results on the SceneFlow and KITTI benchmarks show
that our modules significantly improve the performance of the model.
- Abstract(参考訳): 畳み込みニューラルネットワークに基づくステレオマッチングアーキテクチャは素晴らしい成果を上げているが、まだいくつかの制限がある。
1)進化的特徴 (CF) は出現情報を捉える傾向があり, 正確なマッチングには不十分である。
2) 静的フィルタにより, 電流畳み込みに基づく不均質化モジュールはしばしば過度に滑らかな結果をもたらす。
本稿では,これらの問題に対処するための2つのスキームについて述べる。
まず,LSP(Local similarity Pattern)と呼ばれる,深層ステレオマッチングネットワークのためのペア機能を提案する。
隣接する関係を明確に明らかにすることで、LSPはリッチな構造情報を含み、CFをより識別的な特徴記述に役立てることができる。
第2に,動的自己組み換え改良戦略を設計し,コスト分布と分散マップにそれぞれ適用する。
前者は平滑な問題を緩和するために一様分布制約を備えることができ、後者はより実用的なものである。
提案手法の有効性は,gwcnetとganet-deepの2つの基本アーキテクチャに組み込むことにより実証された。
SceneFlow と KITTI のベンチマークによる実験結果から,我々のモジュールはモデルの性能を大幅に向上することがわかった。
関連論文リスト
- A Noise and Edge extraction-based dual-branch method for Shallowfake and Deepfake Localization [15.647035299476894]
従来のCNN機能と手動で設計した特徴雑音を統合したデュアルブランチモデルを開発した。
このモデルは比較において優れており、既存の最先端モデル(SoTA)よりも容易に優れている。
論文 参考訳(メタデータ) (2024-09-02T02:18:34Z) - Double-Shot 3D Shape Measurement with a Dual-Branch Network [14.749887303860717]
我々は、異なる構造光(SL)変調を処理するために、デュアルブランチ畳み込みニューラルネットワーク(CNN)-トランスフォーマーネットワーク(PDCNet)を提案する。
PDCNet内では、Transformerブランチを使用してフリンジイメージのグローバルな認識をキャプチャし、CNNブランチはスペックルイメージのローカル詳細を収集するように設計されている。
提案手法は, 自己生成データセット上で高精度な結果が得られる一方で, フランジオーダーの曖昧さを低減できることを示す。
論文 参考訳(メタデータ) (2024-07-19T10:49:26Z) - A Refreshed Similarity-based Upsampler for Direct High-Ratio Feature Upsampling [54.05517338122698]
本稿では,セマンティック・アウェアとディテール・アウェアの両方の観点から,明示的に制御可能なクエリキー機能アライメントを提案する。
また,モーザイクアーティファクトを緩和するのには単純だが有効であるHR特徴量に対して,きめ細かな近傍選択戦略を開発した。
提案するReSFUフレームワークは,異なるセグメンテーションアプリケーション上での良好な性能を一貫して達成する。
論文 参考訳(メタデータ) (2024-07-02T14:12:21Z) - Trading-off Mutual Information on Feature Aggregation for Face
Recognition [12.803514943105657]
本稿では、2つの最先端(SOTA)深層顔認識(FR)モデルの出力を集約する手法を提案する。
提案手法では,2つの特徴写像の異なる部分間の関係を利用するために,変圧器の注意機構を利用する。
提案手法の有効性を評価するため,一般的なベンチマーク実験を行い,その結果を最先端のアルゴリズムと比較した。
論文 参考訳(メタデータ) (2023-09-22T18:48:38Z) - Adaptive Spot-Guided Transformer for Consistent Local Feature Matching [64.30749838423922]
局所的特徴マッチングのための適応スポットガイド変換器(ASTR)を提案する。
ASTRは、統一された粗いアーキテクチャにおける局所的な一貫性とスケールのバリエーションをモデル化する。
論文 参考訳(メタデータ) (2023-03-29T12:28:01Z) - Semantic Feature Integration network for Fine-grained Visual
Classification [5.182627302449368]
本稿では,これらの課題に対処するためにセマンティック・フィーチャー・インテグレーション・ネットワーク(SFI-Net)を提案する。
不要な特徴を排除し、識別的特徴間の意味関係を再構築することにより、SFI-Netは満足な性能を実現した。
論文 参考訳(メタデータ) (2023-02-13T07:32:25Z) - BCFNet: A Balanced Collaborative Filtering Network with Attention
Mechanism [106.43103176833371]
協調フィルタリング(CF)ベースの推奨方法が広く研究されている。
BCFNet(Balanced Collaborative Filtering Network)という新しい推薦モデルを提案する。
さらに注意機構は、暗黙のフィードバックの中で隠れた情報をよりよく捉え、ニューラルネットワークの学習能力を強化するように設計されている。
論文 参考訳(メタデータ) (2021-03-10T14:59:23Z) - Learning to Generate Content-Aware Dynamic Detectors [62.74209921174237]
サンプル適応型モデルアーキテクチャを自動的に生成する効率的な検出器の設計を新たに導入する。
動的ルーティングの学習を導くために、オブジェクト検出に適したコースツーファインの成層図を紹介します。
MS-COCOデータセットの実験により、CADDetはバニラルーティングに比べて10%少ないFLOPで1.8以上のmAPを達成することが示された。
論文 参考訳(メタデータ) (2020-12-08T08:05:20Z) - Dual-constrained Deep Semi-Supervised Coupled Factorization Network with
Enriched Prior [80.5637175255349]
本稿では、DS2CF-Netと呼ばれる、拡張された事前制約付きDual-Constrained Deep Semi-Supervised Coupled Factorization Networkを提案する。
隠れた深い特徴を抽出するために、DS2CF-Netは、深い構造と幾何学的な構造に制約のあるニューラルネットワークとしてモデル化される。
我々のネットワークは、表現学習とクラスタリングのための最先端の性能を得ることができる。
論文 参考訳(メタデータ) (2020-09-08T13:10:21Z) - The Heterogeneity Hypothesis: Finding Layer-Wise Differentiated Network
Architectures [179.66117325866585]
我々は、通常見過ごされる設計空間、すなわち事前定義されたネットワークのチャネル構成を調整することを検討する。
この調整は、拡張ベースラインネットワークを縮小することで実現でき、性能が向上する。
画像分類、視覚追跡、画像復元のための様々なネットワークとデータセットで実験を行う。
論文 参考訳(メタデータ) (2020-06-29T17:59:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。