論文の概要: SCV-Stereo: Learning Stereo Matching from a Sparse Cost Volume
- arxiv url: http://arxiv.org/abs/2107.08187v1
- Date: Sat, 17 Jul 2021 05:45:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-20 14:46:28.557904
- Title: SCV-Stereo: Learning Stereo Matching from a Sparse Cost Volume
- Title(参考訳): SCV-Stereo: 少ないコストでステレオマッチングを学習する
- Authors: Hengli Wang, Rui Fan, Ming Liu
- Abstract要約: 畳み込みニューラルネットワーク(CNN)に基づくステレオマッチングアプローチは、一般に、不均一性推定のために高密度なコストボリューム(DCV)を必要とする。
そこで我々は,SCV-Stereoを提案する。SCV-Stereoは,疎コストボリューム表現から高密度ステレオマッチングを学習できる新しいCNNアーキテクチャである。
我々のインスピレーションは、DCV表現がやや冗長であり、SCV表現に置き換えられるという事実から導かれる。
- 参考スコア(独自算出の注目度): 14.801038005597855
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Convolutional neural network (CNN)-based stereo matching approaches generally
require a dense cost volume (DCV) for disparity estimation. However, generating
such cost volumes is computationally-intensive and memory-consuming, hindering
CNN training and inference efficiency. To address this problem, we propose
SCV-Stereo, a novel CNN architecture, capable of learning dense stereo matching
from sparse cost volume (SCV) representations. Our inspiration is derived from
the fact that DCV representations are somewhat redundant and can be replaced
with SCV representations. Benefiting from these SCV representations, our
SCV-Stereo can update disparity estimations in an iterative fashion for
accurate and efficient stereo matching. Extensive experiments carried out on
the KITTI Stereo benchmarks demonstrate that our SCV-Stereo can significantly
minimize the trade-off between accuracy and efficiency for stereo matching. Our
project page is https://sites.google.com/view/scv-stereo.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)に基づくステレオマッチングアプローチは、一般に、不均一性推定に高密度なコストボリューム(DCV)を必要とする。
しかし、そのようなコストボリュームの生成は計算集約的でメモリ消費であり、CNNのトレーニングや推論効率を妨げる。
この問題に対処するために,スパースコストボリューム(SCV)表現から高密度ステレオマッチングを学習可能な,新しいCNNアーキテクチャであるSCV-Stereoを提案する。
我々のインスピレーションは、DCV表現がやや冗長であり、SCV表現に置き換えられるという事実に由来する。
これらのSCV表現を活かして、SCV-Stereoは、精度と効率のよいステレオマッチングのために、反復的に不均一推定を更新できる。
KITTI Stereoベンチマークで行った大規模な実験により、我々のSCV-Stereoはステレオマッチングの精度と効率のトレードオフを著しく最小化できることが示された。
私たちのプロジェクトページはhttps://sites.google.com/view/scv-stereoです。
関連論文リスト
- RomniStereo: Recurrent Omnidirectional Stereo Matching [6.153793254880079]
本稿では,全方向ステレオマッチング (RomniStereo) アルゴリズムを提案する。
我々の最良のモデルは、以前のSOTAベースラインよりも平均MAE値が40.7%向上する。
結果の可視化では, 合成例と実例の両方において, 明らかな優位性を示す。
論文 参考訳(メタデータ) (2024-01-09T04:06:01Z) - Audio classification with Dilated Convolution with Learnable Spacings [10.89964981012741]
学習可能な間隔による拡張畳み込み(DCLS)は、バックプロパゲーションによるトレーニングを通じてカーネル要素の位置を学習する最近の畳み込み法である。
ここでは、AudioSet分類ベンチマークを用いて、DCLSはオーディオタグ付けにも有用であることを示す。
論文 参考訳(メタデータ) (2023-09-25T09:09:54Z) - Uncertainty Guided Adaptive Warping for Robust and Efficient Stereo
Matching [77.133400999703]
相関に基づくステレオマッチングは優れた性能を達成した。
固定モデルによる現在のメソッドは、さまざまなデータセットで均一に動作しない。
本稿では,ロバストなステレオマッチングのための相関を動的に計算する新しい視点を提案する。
論文 参考訳(メタデータ) (2023-07-26T09:47:37Z) - Accurate and Efficient Stereo Matching via Attention Concatenation
Volume [33.615312186946866]
本稿では,注意結合ボリューム(ACV)という新しいコストボリューム構築手法を提案する。
ACVは相関手がかりから注目重みを生成し、余分な情報を抑制し、連結ボリュームにおけるマッチング関連情報を強化する。
ACVの高速バージョンであるFast-ACVを設計し、高い確率差の仮説を生成する。
論文 参考訳(メタデータ) (2022-09-23T08:14:30Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - ACVNet: Attention Concatenation Volume for Accurate and Efficient Stereo
Matching [7.39503547452922]
本稿では,余剰情報を抑制するために,相関情報から注意重みを生成する新しいコストボリューム構築手法を提案する。
信頼性の高い注意重みを生成するため,マッチングコストの特異性を改善するため,マルチレベル適応パッチマッチングを提案する。
提案するコスト容積は、ほとんどのステレオマッチングネットワークにシームレスに組み込むことのできる注意結合容積 (ACV) と命名される。
論文 参考訳(メタデータ) (2022-03-04T06:28:58Z) - Correlate-and-Excite: Real-Time Stereo Matching via Guided Cost Volume
Excitation [65.83008812026635]
本稿では,GCE ( Guided Cost Volume Excitation) を構築し,画像によって誘導されるコストボリュームの簡単なチャネル励磁により,性能が大幅に向上することを示す。
我々はCorrelate-and-Excite(CoEx)と呼ぶエンドツーエンドネットワークを提案する。
論文 参考訳(メタデータ) (2021-08-12T14:32:26Z) - Efficient Training of Visual Transformers with Small-Size Datasets [64.60765211331697]
進化的ネットワーク(CNN)に代わるアーキテクチャパラダイムとして、ビジュアルトランスフォーマー(VT)が登場している。
ImageNetでトレーニングされた場合、同等の精度を持つにもかかわらず、より小さなデータセットでのパフォーマンスは、大きく異なる可能性があることを示す。
本稿では,計算オーバーヘッドの少ない画像から追加情報を抽出できる自己教師型タスクを提案する。
論文 参考訳(メタデータ) (2021-06-07T16:14:06Z) - PVStereo: Pyramid Voting Module for End-to-End Self-Supervised Stereo
Matching [14.603116313499648]
本稿では,ピラミッド投票モジュール(PVM)と,OptStereoと呼ばれる新しいDCNNアーキテクチャからなる,堅牢で効果的な自己監督型ステレオマッチング手法を提案する。
具体的には、OptStereoは最初にマルチスケールのコストボリュームを構築し、その後、繰り返し単位を採用し、高分解能で不一致推定を反復的に更新します。
hkust-driveデータセット(大規模な合成ステレオデータセット)を、異なる照明条件と気象条件下で研究目的で収集した。
論文 参考訳(メタデータ) (2021-03-12T05:27:14Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z) - On Coresets for Support Vector Machines [61.928187390362176]
coresetは、元のデータポイントの小さな、代表的なサブセットである。
我々は,本アルゴリズムを用いて,既製のSVMソルバをストリーミング,分散,動的データ設定に適用可能であることを示す。
論文 参考訳(メタデータ) (2020-02-15T23:25:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。