論文の概要: Content-Aware Inter-Scale Cost Aggregation for Stereo Matching
- arxiv url: http://arxiv.org/abs/2006.03209v1
- Date: Fri, 5 Jun 2020 02:38:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-25 03:51:47.448149
- Title: Content-Aware Inter-Scale Cost Aggregation for Stereo Matching
- Title(参考訳): ステレオマッチングのためのコンテンツ対応スケール間コストアグリゲーション
- Authors: Chengtang Yao, Yunde Jia, Huijun Di, Yuwei Wu, Lidong Yu
- Abstract要約: 本手法は,異なるスケールで情報収集を行う際に,信頼性の高い詳細回復を実現する。
3次元フィルタ重みを効率的に構築し、3次元コスト容積を集約する新しい分解戦略を提案する。
Scene Flow データセット,KITTI2015 と Middlebury の実験結果から,本手法の有効性が示された。
- 参考スコア(独自算出の注目度): 42.02981855948903
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Cost aggregation is a key component of stereo matching for high-quality depth
estimation. Most methods use multi-scale processing to downsample cost volume
for proper context information, but will cause loss of details when upsampling.
In this paper, we present a content-aware inter-scale cost aggregation method
that adaptively aggregates and upsamples the cost volume from coarse-scale to
fine-scale by learning dynamic filter weights according to the content of the
left and right views on the two scales. Our method achieves reliable detail
recovery when upsampling through the aggregation of information across
different scales. Furthermore, a novel decomposition strategy is proposed to
efficiently construct the 3D filter weights and aggregate the 3D cost volume,
which greatly reduces the computation cost. We first learn the 2D similarities
via the feature maps on the two scales, and then build the 3D filter weights
based on the 2D similarities from the left and right views. After that, we
split the aggregation in a full 3D spatial-disparity space into the aggregation
in 1D disparity space and 2D spatial space. Experiment results on Scene Flow
dataset, KITTI2015 and Middlebury demonstrate the effectiveness of our method.
- Abstract(参考訳): コストアグリゲーションは、高品質な深さ推定のためのステレオマッチングの重要なコンポーネントである。
ほとんどのメソッドは、適切なコンテキスト情報のためにコストボリュームをダウンサンプルするためにマルチスケール処理を使用するが、アップサンプリング時に詳細が失われる。
本稿では,2つのスケールにおける左右のビューの内容に応じて,動的フィルタ重みを学習することにより,コスト量を粗大から細大に適応的に集約・アップする,コンテンツ対応のスケール間コスト集約手法を提案する。
本手法は,異なるスケールで情報収集を行う際に,信頼性の高い詳細回復を実現する。
さらに, 3次元フィルタ重みを効率的に構築し, 3次元コストボリュームを集約する新しい分解戦略を提案し, 計算コストを大幅に削減した。
まず2つのスケールの特徴マップから2Dの類似性を学び、次に左右のビューから2Dの類似性に基づいて3Dフィルタの重みを構築します。
その後, 2次元空間空間と1次元空間空間のアグリゲーションに, 全3次元空間のアグリゲーションを分割した。
Scene Flow データセット,KITTI2015 と Middlebury の実験結果から,本手法の有効性が示された。
関連論文リスト
- Mip-Splatting: Alias-free 3D Gaussian Splatting [52.366815964832426]
3D Gaussian Splattingは素晴らしいビュー合成結果を示し、高い忠実度と効率を実現した。
ストロングアーティファクトは、サンプリングレート、例えば焦点距離やカメラ距離を変えることで観測することができる。
この現象の原因は,3次元周波数制約の欠如と2次元拡張フィルタの利用によると考えられる。
論文 参考訳(メタデータ) (2023-11-27T13:03:09Z) - Image-Coupled Volume Propagation for Stereo Matching [0.24366811507669117]
我々は,共生関係を実現するために,一つのフレームワークに2つの異なる概念をマージする4Dコストボリュームを処理する新しい方法を提案する。
特徴マッチング部は、同一画素対を基準線に沿って識別し、同時画像ボリューム部はモノCNNからの奥行きにインスパイアされる。
エンドツーエンドのトレーニング済みCNNは、KITTI2012とETH3Dベンチマークで2位にランクされ、第1ランクの手法よりもはるかに高速です。
論文 参考訳(メタデータ) (2022-12-30T13:23:25Z) - Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume
Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。
我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-12T14:32:26Z) - Stereo Object Matching Network [78.35697025102334]
本稿では,画像からの2次元コンテキスト情報と3次元オブジェクトレベル情報の両方を利用するステレオオブジェクトマッチング手法を提案する。
コストボリューム空間における3次元オブジェクト性を扱うための新しい方法として, 選択的サンプリング (RoISelect) と 2D-3D 融合がある。
論文 参考訳(メタデータ) (2021-03-23T12:54:43Z) - Displacement-Invariant Matching Cost Learning for Accurate Optical Flow
Estimation [109.64756528516631]
学習のマッチングコストは、最先端のディープステレオマッチング手法の成功に不可欠であることが示されている。
本稿では,5次元特徴量構築の要件を回避できる新しい手法を提案する。
提案手法は,各種データセットにおける最先端の精度を実現し,Sintelベンチマークにおける全光フロー法より優れる。
論文 参考訳(メタデータ) (2020-10-28T09:57:00Z) - Do End-to-end Stereo Algorithms Under-utilize Information? [7.538482310185133]
本稿では,2次元および3次元の畳み込みネットワークに適応フィルタリングと半グローバルアグリゲーションを組み込むことによって,エンドツーエンドのステレオマッチングを実現する方法を示す。
改善は、画像からのRGB情報を信号として利用し、マッチングプロセスを動的にガイドすることによる。
論文 参考訳(メタデータ) (2020-10-14T18:32:39Z) - Reinforced Axial Refinement Network for Monocular 3D Object Detection [160.34246529816085]
モノクロ3次元物体検出は、2次元入力画像から物体の位置と特性を抽出することを目的としている。
従来のアプローチでは、空間から3D境界ボックスをサンプリングし、対象オブジェクトと各オブジェクトの関係を推定するが、有効サンプルの確率は3D空間で比較的小さい。
我々は,まず最初の予測から始めて,各ステップで1つの3dパラメータだけを変えて,基礎的真理に向けて徐々に洗練することを提案する。
これは、いくつかのステップの後に報酬を得るポリシーを設計する必要があるため、最適化するために強化学習を採用します。
論文 参考訳(メタデータ) (2020-08-31T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。