論文の概要: Modeling Depth Ambiguity: A Mixture-Density Representation for Flying-Point-Free Depth Estimation
- arxiv url: http://arxiv.org/abs/2606.02552v1
- Date: Mon, 01 Jun 2026 17:50:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:32.553576
- Title: Modeling Depth Ambiguity: A Mixture-Density Representation for Flying-Point-Free Depth Estimation
- Title(参考訳): 深さ曖昧さのモデル化:フライングポイント自由深さ推定のための混合密度表現
- Authors: Siyuan Bian, Congrong Xu, Jun Gao,
- Abstract要約: 物体の境界付近では、深度推定器は前景と背景の間の空き空間の3D点をしばしば予測する。
MDAは混合密度の表現で、モデルが各ピクセルに対して多重深度仮説とそれらの関連する確率を予測することができる。
異なるバックボーン全体にわたって、MDAは境界再構築を大幅に改善し、深刻な入力のぼかしの下でも飛行点のアーティファクトを大幅に除去する。
同じ混合密度のフレームワークは自然に透明な物体に拡張され、透明なピクセルで複数の深度層を予測する。
- 参考スコア(独自算出の注目度): 8.804840425287612
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite advances in depth estimation, flying points remain a persistent failure mode: near object boundaries, depth estimators often predict spurious 3D points in the empty space between foreground and background surfaces. We trace this artifact to a standard modeling choice: assigning each pixel a single depth hypothesis. At boundaries, a pixel can straddle a foreground and a background surface, so its true depth is ambiguous between the two. A model that predicts a single depth cannot keep both possibilities, so training instead pulls the prediction toward an intermediate depth that lies on neither surface. We address this with MDA, a mixture-density representation that lets the model predict multiple depth hypotheses and their associated probabilities for each pixel. Near boundaries, different hypotheses can align with different surfaces, and the decoded depth is selected from one of these hypotheses rather than placed in the empty space between them. Across different backbones, MDA substantially improves boundary reconstruction and largely removes flying-point artifacts even under severe input blur, while adding negligible runtime overhead. The same mixture-density framework naturally extends to transparent objects, where it predicts multiple depth layers at transparent pixels, and to sky regions, where a dedicated component separates the unbounded sky from finite-depth regions, producing flying-point-free skylines. Project Page: https://biansy000.github.io/mda-site/.
- Abstract(参考訳): 深度推定の進歩にもかかわらず、フライングポイントは持続的な故障モードのままであり、物体の境界付近では、深度推定器は前景と背景の間の空き空間における急激な3Dポイントを予測する。
このアーティファクトは、各ピクセルに1つの深さ仮説を割り当てるという、標準的なモデリング選択に遡る。
境界において、画素は前景と背景をまたぐことができるので、その真の深さは両者の間にあいまいである。
単一の深さを予測するモデルは両方の可能性を維持することができず、代わりにトレーニングは両方の表面にある中間の深さに向かって予測を引き出す。
MDAは混合密度の表現で、モデルが各ピクセルに対して多重深度仮説とそれらの関連する確率を予測することができる。
境界付近では、異なる仮説は異なる表面と整合し、デコードされた深さはそれらの間の空き空間に置かれるのではなく、これらの仮説のうちの1つから選択される。
異なるバックボーン全体にわたって、MDAはバウンダリ再構築を大幅に改善し、深刻な入力のぼかしの下でもフライポイントアーティファクトを大幅に削除し、無視可能なランタイムオーバーヘッドを追加した。
同じ混合密度のフレームワークは自然に透明な物体に拡張され、透明なピクセルで複数の深度層を予測する。
Project Page: https://biansy000.github.io/mda-site/.com
関連論文リスト
- StarryGazer: Leveraging Monocular Depth Estimation Models for Domain-Agnostic Single Depth Image Completion [56.28564075246147]
StarryGazerは、単一のスパース深度画像とRGB画像から高密度深度画像を予測するフレームワークである。
我々は、相対深度画像を生成するために、事前訓練されたMDEモデルを用いる。
モデルの精度とロバスト性を改善するために、相対深度マップとRGBイメージを組み込んだ合成ペアを用いて改良ネットワークを訓練する。
論文 参考訳(メタデータ) (2025-12-15T09:56:09Z) - Towards Ambiguity-Free Spatial Foundation Model: Rethinking and Decoupling Depth Ambiguity [20.86484181698326]
決定論的予測に限定された既存のモデルは、現実世界の多層深度を見落としている。
単一予測から多仮説空間基盤モデルへのパラダイムシフトを導入する。
論文 参考訳(メタデータ) (2025-03-08T02:33:54Z) - DepthLab: From Partial to Complete [80.58276388743306]
不足する値は、幅広いアプリケーションにわたる深度データにとって共通の課題である。
この作業は、イメージ拡散プリエントを利用した基礎深度塗装モデルであるDepthLabと、このギャップを埋めるものだ。
提案手法は,3Dシーンのインペイント,テキストから3Dシーン生成,DUST3Rによるスパースビュー再構成,LiDAR深度補完など,様々なダウンストリームタスクにおいて有用であることを示す。
論文 参考訳(メタデータ) (2024-12-24T04:16:38Z) - OPA-3D: Occlusion-Aware Pixel-Wise Aggregation for Monocular 3D Object
Detection [51.153003057515754]
OPA-3Dは、Occlusion-Aware Pixel-Wise Aggregationネットワークである。
密集した風景深度と、奥行きのある箱残量と物の境界箱を共同で推定する。
メインカーのカテゴリーでは最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-11-02T14:19:13Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - Depth Completion with Twin Surface Extrapolation at Occlusion Boundaries [16.773787000535645]
前景深度と背景深度の両方を明示的にモデル化するマルチ仮説深度表現を提案する。
この手法の鍵となるのは、新しい双曲面表現で機能する非対称損失関数の利用である。
メソッドを3つの異なるデータセットで検証します。
論文 参考訳(メタデータ) (2021-04-06T02:36:35Z) - Depth Completion using Piecewise Planar Model [94.0808155168311]
深度マップは一連の学習された基底で表現することができ、閉じた解法で効率的に解ける。
しかし、この方法の1つの問題は、色境界が深さ境界と矛盾する場合にアーチファクトを生成することである。
私たちは、より厳密な深度回復モデルを実行します。
論文 参考訳(メタデータ) (2020-12-06T07:11:46Z) - Discontinuous and Smooth Depth Completion with Binary Anisotropic
Diffusion Tensor [0.3166654021990827]
単一画像で誘導されるスパース深度マップから教師なしリアルタイム高密度深度補完を提案する。
本手法は,物体間の不連続性を保ちながら,滑らかな深度マップを生成する。
論文 参考訳(メタデータ) (2020-06-25T13:16:47Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。