論文の概要: Level Set Binocular Stereo with Occlusions
- arxiv url: http://arxiv.org/abs/2109.03464v1
- Date: Wed, 8 Sep 2021 07:22:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-09 13:37:33.526675
- Title: Level Set Binocular Stereo with Occlusions
- Title(参考訳): 閉塞を有するレベルセット両眼ステレオ
- Authors: Jialiang Wang, Todd Zickler
- Abstract要約: ステレオ境界の局所化と近傍の格差の予測は、ステレオ境界が一致する手がかりが存在しない閉塞領域を誘導するので困難である。
本稿では,オクルージョン幾何を符号化することによって境界を改良するエネルギーとレベルセットを提案する。
画像パッチの未発の階層の中で、親と子供の間で主に通るメッセージを使って実装することができる。
- 参考スコア(独自算出の注目度): 7.868449549351486
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localizing stereo boundaries and predicting nearby disparities are difficult
because stereo boundaries induce occluded regions where matching cues are
absent. Most modern computer vision algorithms treat occlusions secondarily
(e.g., via left-right consistency checks after matching) or rely on high-level
cues to improve nearby disparities (e.g., via deep networks and large training
sets). They ignore the geometry of stereo occlusions, which dictates that the
spatial extent of occlusion must equal the amplitude of the disparity jump that
causes it. This paper introduces an energy and level-set optimizer that
improves boundaries by encoding occlusion geometry. Our model applies to
two-layer, figure-ground scenes, and it can be implemented cooperatively using
messages that pass predominantly between parents and children in an undecimated
hierarchy of multi-scale image patches. In a small collection of figure-ground
scenes curated from Middlebury and Falling Things stereo datasets, our model
provides more accurate boundaries than previous occlusion-handling stereo
techniques. This suggests new directions for creating cooperative stereo
systems that incorporate occlusion cues in a human-like manner.
- Abstract(参考訳): ステレオ境界の局所化と近傍の格差の予測は、ステレオ境界が一致する手がかりが存在しない閉塞領域を誘導するため困難である。
現代のコンピュータビジョンアルゴリズムの多くは、オクルージョンを二次的に扱う(例えば、マッチング後の左-右一貫性チェック)か、近くの格差(例えば、ディープネットワークや大きなトレーニングセット)を改善するために高レベルな手がかりに依存する。
彼らは立体オクルージョンの幾何学を無視し、オクルージョンの空間的範囲は、それを引き起こす格差ジャンプの振幅と同等でなければならないと規定する。
本稿では,オクルージョン幾何学を符号化することで境界を改善するエネルギー・レベルセットオプティマイザを提案する。
本モデルでは,2階層の図形シーンに適用し,マルチスケール画像パッチの非効率な階層において,親子間を主に通過するメッセージを用いて協調的に実装することができる。
ミドルベリー・アンド・フォールディング・モノのステレオデータセットからキュレートされた図形のシーンの小さなコレクションにおいて、我々のモデルは従来の閉塞処理ステレオ技術よりも正確な境界を提供する。
これは、人間のように咬合の手がかりを組み込んだ協調ステレオシステムを作成するための新しい方向を示唆する。
関連論文リスト
- Bridging Stereo Geometry and BEV Representation with Reliable Mutual Interaction for Semantic Scene Completion [45.171150395915056]
3Dセマンティックシーン補完(SSC)は、限られた観測から密集した3Dシーンを推定する必要がある不適切な認識課題である。
従来のカメラベースの手法は、固有の幾何学的曖昧さと不完全な観察のため、正確なセマンティックシーンを予測するのに苦労した。
我々は,SSCにおけるステレオマッチング技術と鳥眼ビュー(BEV)表現学習を利用して,そのような問題に対処する。
論文 参考訳(メタデータ) (2023-03-24T12:33:44Z) - Revisiting Domain Generalized Stereo Matching Networks from a Feature
Consistency Perspective [65.37571681370096]
両視点にまたがる単純な画素単位のコントラスト学習を提案する。
ドメイン間の立体的特徴一貫性をよりよく維持するために、立体選択的白化損失を導入する。
提案手法は,複数の最先端ネットワークよりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-03-21T11:21:41Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Co-Teaching: An Ark to Unsupervised Stereo Matching [14.801038005597855]
CoT-Stereoは、新しい教師なしステレオマッチングアプローチである。
KITTI Stereoベンチマークの実験は、CoT-Stereoの優れた性能を示している。
論文 参考訳(メタデータ) (2021-07-17T05:33:39Z) - H-Net: Unsupervised Attention-based Stereo Depth Estimation Leveraging
Epipolar Geometry [4.968452390132676]
本稿では,教師なしステレオ深度推定のためのディープラーニングフレームワークであるH-Netを紹介する。
初めて、Siameseオートエンコーダアーキテクチャが深さ推定に使用されます。
本手法は,最先端の非監視ステレオ深度推定法を上回っている。
論文 参考訳(メタデータ) (2021-04-22T19:16:35Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Reversing the cycle: self-supervised deep stereo through enhanced
monocular distillation [51.714092199995044]
多くの分野において、自己教師付き学習ソリューションは急速に進化し、教師付きアプローチでギャップを埋めている。
本稿では,両者の相互関係を逆転する自己教師型パラダイムを提案する。
深層ステレオネットワークを訓練するために,単分子完備ネットワークを通じて知識を抽出する。
論文 参考訳(メタデータ) (2020-08-17T07:40:22Z) - Level Set Stereo for Cooperative Grouping with Occlusion [5.837881923712393]
ステレオ境界の局所化は、隣接する閉鎖領域に一致する手がかりが存在しないため困難である。
我々は、オクルージョンの本質的幾何学を符号化することによって境界を改善するエネルギーとレベルセットの格差を導入する。
論文 参考訳(メタデータ) (2020-06-29T14:51:08Z) - StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization
of Domain Translation and Stereo Matching [56.95846963856928]
大規模な合成データセットはステレオマッチングに有用であるが、通常は既知のドメインバイアスを導入する。
本稿では,ドメイン翻訳とステレオマッチングネットワークを用いたエンドツーエンドのトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-05T03:11:38Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。