論文の概要: Level Set Stereo for Cooperative Grouping with Occlusion
- arxiv url: http://arxiv.org/abs/2006.16094v3
- Date: Fri, 18 Jun 2021 05:16:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-15 14:48:08.927196
- Title: Level Set Stereo for Cooperative Grouping with Occlusion
- Title(参考訳): 閉塞を伴う協調グルーピングのためのレベルセットステレオ
- Authors: Jialiang Wang and Todd Zickler
- Abstract要約: ステレオ境界の局所化は、隣接する閉鎖領域に一致する手がかりが存在しないため困難である。
我々は、オクルージョンの本質的幾何学を符号化することによって境界を改善するエネルギーとレベルセットの格差を導入する。
- 参考スコア(独自算出の注目度): 5.837881923712393
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Localizing stereo boundaries is difficult because matching cues are absent in
the occluded regions that are adjacent to them. We introduce an energy and
level-set optimizer that improves boundaries by encoding the essential geometry
of occlusions: The spatial extent of an occlusion must equal the amplitude of
the disparity jump that causes it. In a collection of figure-ground scenes from
Middlebury and Falling Things stereo datasets, the model provides more accurate
boundaries than previous occlusion-handling techniques.
- Abstract(参考訳): ステレオ境界の局所化は、隣接する閉鎖領域に一致する手がかりが存在しないため困難である。
我々は、オクルージョンの本質的幾何学を符号化することで境界を改善するエネルギーとレベルセットオプティマイザを導入する: オクルージョンの空間的範囲は、それを引き起こす不均一ジャンプの振幅と等しくなる。
MiddleburyとFalling Thingsのステレオデータセットのフィギュアグラウンドシーンのコレクションでは、従来のオクルージョン処理技術よりも正確なバウンダリを提供する。
関連論文リスト
- Boundary Attention: Learning to Find Faint Boundaries at Any Resolution [24.866113908206966]
本モデルでは,境界信号が非常に弱い場合やノイズに浸された場合においても,正確な結果が得られることを示す。
ファイン境界を求める従来の手法と比較して、我々のモデルは微分可能であるという利点がある。
論文 参考訳(メタデータ) (2024-01-01T19:00:55Z) - Global Occlusion-Aware Transformer for Robust Stereo Matching [11.655465312241699]
本稿では,Global Occlusion-Aware Transformer(GOAT)と呼ばれる新しいアテンションベースのステレオマッチングネットワークを提案する。
GOATは、長距離依存とOcclusion-Awarenessグローバルコンテキストを不一致推定に活用する。
提案したGOATは,特に閉鎖領域において,すべてのベンチマークにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-12-22T12:34:58Z) - EtC: Temporal Boundary Expand then Clarify for Weakly Supervised Video
Grounding with Multimodal Large Language Model [63.93372634950661]
不完全な境界を拡大する上で、より価値のある情報を導入しながら、元の時間的内容の整合性を維持する新しい視点を提案する。
ビデオの連続性、すなわち隣接するフレーム間の視覚的類似性により、我々は、初期擬似境界内で各フレームにアノテートするために強力なマルチモーダル大言語モデル(MLLM)を使用する。
論文 参考訳(メタデータ) (2023-12-05T04:15:56Z) - Parallax-Tolerant Unsupervised Deep Image Stitching [57.76737888499145]
本稿では,パララックス耐性の非教師あり深層画像縫合技術であるUDIS++を提案する。
まず,グローバルなホモグラフィから局所的な薄板スプライン運動への画像登録をモデル化するための,頑健で柔軟なワープを提案する。
本研究では, 縫合された画像をシームレスに合成し, シーム駆動合成マスクの教師なし学習を行うことを提案する。
論文 参考訳(メタデータ) (2023-02-16T10:40:55Z) - AdaStereo: An Efficient Domain-Adaptive Stereo Matching Approach [50.855679274530615]
本稿では,AdaStereoというドメイン適応型アプローチを提案する。
我々のモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のベンチマークで最先端のクロスドメイン性能を実現している。
提案手法は,様々なドメイン適応設定に対して堅牢であり,迅速な適応アプリケーションシナリオや実環境展開に容易に組み込むことができる。
論文 参考訳(メタデータ) (2021-12-09T15:10:47Z) - Level Set Binocular Stereo with Occlusions [7.868449549351486]
ステレオ境界の局所化と近傍の格差の予測は、ステレオ境界が一致する手がかりが存在しない閉塞領域を誘導するので困難である。
本稿では,オクルージョン幾何を符号化することによって境界を改良するエネルギーとレベルセットを提案する。
画像パッチの未発の階層の中で、親と子供の間で主に通るメッセージを使って実装することができる。
論文 参考訳(メタデータ) (2021-09-08T07:22:25Z) - SMD-Nets: Stereo Mixture Density Networks [68.56947049719936]
SMD-Nets(Stereo Mixture Density Networks)は、幅広い2Dおよび3Dアーキテクチャに対応したシンプルで効果的な学習フレームワークです。
具体的には,バイモーダル混合密度を出力表現として活用し,不連続近傍の鋭く正確な不一致推定を可能にすることを示す。
我々は8Mpx解像度のステレオペアと現実世界のステレオデータセットからなる、新しい高解像度でリアルな合成ステレオデータセットに関する包括的な実験を行う。
論文 参考訳(メタデータ) (2021-04-08T16:15:46Z) - Field of Junctions: Extracting Boundary Structure at Low SNR [5.584060970507507]
本稿では,輪郭,角,ジャンクションなど,画像内の多くの境界要素を同時に検出するボトムアップ検出器を提案する。
特に、輪郭、角、ジャンクション、および均一領域の分析により、境界検出の他の方法が失敗する高いノイズレベルで成功することができる。
論文 参考訳(メタデータ) (2020-11-27T17:46:08Z) - StereoGAN: Bridging Synthetic-to-Real Domain Gap by Joint Optimization
of Domain Translation and Stereo Matching [56.95846963856928]
大規模な合成データセットはステレオマッチングに有用であるが、通常は既知のドメインバイアスを導入する。
本稿では,ドメイン翻訳とステレオマッチングネットワークを用いたエンドツーエンドのトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-05T03:11:38Z) - AdaStereo: A Simple and Efficient Approach for Adaptive Stereo Matching [50.06646151004375]
AdaStereoと呼ばれる新しいドメイン適応パイプラインは、ディープステレオマッチングネットワークにマルチレベル表現をアライメントすることを目的としている。
我々のAdaStereoモデルは、KITTI、Middlebury、ETH3D、DrivingStereoなど、複数のステレオベンチマークで最先端のクロスドメインパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2020-04-09T16:15:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。