論文の概要: Wasserstein Distances for Stereo Disparity Estimation
- arxiv url: http://arxiv.org/abs/2007.03085v2
- Date: Mon, 29 Mar 2021 09:42:37 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-13 02:00:43.557697
- Title: Wasserstein Distances for Stereo Disparity Estimation
- Title(参考訳): ステレオ不等式推定のためのwasserstein距離
- Authors: Divyansh Garg, Yan Wang, Bharath Hariharan, Mark Campbell, Kilian Q.
Weinberger and Wei-Lun Chao
- Abstract要約: 既定義の離散値の集合上の分布を出力する、奥行き推定や不均一推定への既存のアプローチ。
これにより、真の深さや差がこれらの値と一致しない場合に、不正確な結果をもたらす。
任意の深さの値を出力できる新しいニューラルネットワークアーキテクチャを用いて、これらの問題に対処する。
- 参考スコア(独自算出の注目度): 62.09272563885437
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing approaches to depth or disparity estimation output a distribution
over a set of pre-defined discrete values. This leads to inaccurate results
when the true depth or disparity does not match any of these values. The fact
that this distribution is usually learned indirectly through a regression loss
causes further problems in ambiguous regions around object boundaries. We
address these issues using a new neural network architecture that is capable of
outputting arbitrary depth values, and a new loss function that is derived from
the Wasserstein distance between the true and the predicted distributions. We
validate our approach on a variety of tasks, including stereo disparity and
depth estimation, and the downstream 3D object detection. Our approach
drastically reduces the error in ambiguous regions, especially around object
boundaries that greatly affect the localization of objects in 3D, achieving the
state-of-the-art in 3D object detection for autonomous driving. Our code will
be available at https://github.com/Div99/W-Stereo-Disp.
- Abstract(参考訳): 既定義の離散値の集合上の分布を出力する、奥行き推定や不均一推定への既存のアプローチ。
これにより、真の深さや差がこれらの値と一致しない場合に、不正確な結果をもたらす。
この分布が回帰損失によって間接的に学習されるという事実は、オブジェクト境界周辺の曖昧な領域においてさらなる問題を引き起こす。
本稿では,任意の深さ値の出力が可能なニューラルネットワークアーキテクチャと,実数と予測分布とのワッサーシュタイン距離から導出される新たな損失関数を用いて,これらの問題に対処する。
ステレオ視差や奥行き推定,下流3次元物体検出など,さまざまなタスクにおいて,我々のアプローチを検証する。
提案手法は,不明瞭な領域,特に3次元物体の局所化に大きな影響を及ぼす物体境界の誤差を大幅に低減し,自律走行のための3次元物体検出の最先端を実現する。
私たちのコードはhttps://github.com/Div99/W-Stereo-Disp.comで公開されます。
関連論文リスト
- ORA3D: Overlap Region Aware Multi-view 3D Object Detection [11.58746596768273]
現在の多視点3Dオブジェクト検出法は、しばしば重なり合う領域のオブジェクトを適切に検出できない。
本稿では,(1)弱深度スーパービジョンのステレオ異方性推定と(2)適応オーバーラップ領域判別器の2つの主要なモジュールを提案する。
提案手法は,現在の最先端モデル,すなわちDETR3DとBEVDetより優れている。
論文 参考訳(メタデータ) (2022-07-02T15:28:44Z) - Diversity Matters: Fully Exploiting Depth Clues for Reliable Monocular
3D Object Detection [37.37316176663782]
本研究では,モノクロ3次元画像のサブタスクから視覚的手がかりを完全に探索する深度問題解決システムを提案する。
提案手法は,KITTIの3次元オブジェクト検出ベンチマークにおいて,テスト分割のモードレベルに対して,現行のベストメソッドを20%以上上回っている。
論文 参考訳(メタデータ) (2022-05-19T08:12:55Z) - Homography Loss for Monocular 3D Object Detection [54.04870007473932]
ホログラフィーロス(Homography Loss)と呼ばれる,2次元情報と3次元情報の両方を利用する識別可能なロス関数を提案する。
提案手法は,KITTI 3Dデータセットにおいて,他の最先端技術と比較して高い性能を示す。
論文 参考訳(メタデータ) (2022-04-02T03:48:03Z) - Depth Refinement for Improved Stereo Reconstruction [13.941756438712382]
立体画像からの深度推定の現在の技術は、なおも内蔵の欠点に悩まされている。
簡単な解析により、深度誤差は物体の距離に2乗比例することが明らかになった。
本研究では,深度推定に改良ネットワークを用いた簡易かつ効果的な手法を提案する。
論文 参考訳(メタデータ) (2021-12-15T12:21:08Z) - Object-aware Monocular Depth Prediction with Instance Convolutions [72.98771405534937]
本稿では,特徴集合を避けるために明示的に調整された新しい畳み込み演算子を提案する。
提案手法は,部分ごとの深度をスーパーピクセルで推定する。
NYUv2とiBimsデータセットに対する我々の評価は、インスタンスの畳み込みの優位性を明確に示している。
論文 参考訳(メタデータ) (2021-12-02T18:59:48Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - Categorical Depth Distribution Network for Monocular 3D Object Detection [7.0405916639906785]
モノラル3D検出の重要な課題は、物体の深度を正確に予測することです。
多くの手法は3次元検出を支援するために直接深度を推定しようとするが、深度不正確な結果、限られた性能を示す。
Categorical Depth Distribution Network (CADDN) を提案し、3次元空間の適切な深さ間隔にリッチなコンテキスト特徴情報を投影する。
提案手法をkitti 3d object detection benchmarkで検証し, 単項法のうち1位にランク付けした。
論文 参考訳(メタデータ) (2021-03-01T16:08:29Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。