論文の概要: SeeGroup: Multi-Layer Depth Estimation of Transparent Surfaces via Self-Determined Grouping
- arxiv url: http://arxiv.org/abs/2605.28735v1
- Date: Wed, 27 May 2026 16:55:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-28 17:38:56.232298
- Title: SeeGroup: Multi-Layer Depth Estimation of Transparent Surfaces via Self-Determined Grouping
- Title(参考訳): SeeGroup: 自己決定的グループ化による透明表面の多層深さ推定
- Authors: Hongyu Wen, Jia Deng,
- Abstract要約: SeeGroupは、事前に定義されたグループ化を避けるための多層深さ推定手法である。
我々は,画素ごとの多層深度をポイントプロセスとして定式化し,深度層を各カメラ線に沿って無秩序なイベントとして扱う。
実験により,本手法は多層深度推定の技術を著しく向上させることが示された。
- 参考スコア(独自算出の注目度): 19.197754623003885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Transparent objects are common in daily life, and it is important to understand their multilayer depth, including the transparent surface and the objects behind it. Existing methods for multilayer depth typically extend single-layer prediction. They define layers by the front-to-back ordering of 3D points and predict the layers sequentially. However, as layered geometry can admit multiple valid groupings of 3D points into layers, a predefined grouping strategy is inherently restrictive. In this work, we propose SeeGroup, a multi-layer depth estimation method that avoids imposing a predefined grouping and allows the model itself to adaptively assign surfaces to depth maps. We formulate per-pixel multi-layer depth as a point process, treating depth layers as unordered events along each camera ray. This induces a permutation-invariant likelihood over the observed depth layers, yielding a loss that naturally supports arbitrary layer groupings. Experiments demonstrate that our method significantly advances the state of the art of multi-layer depth estimation, improving quadruplet relative depth accuracy on LayeredDepth benchmark from 61.34% to 70.09%. Code is available at https://github.com/princeton-vl/SeeGroup.
- Abstract(参考訳): 透明な物体は日常生活において一般的であり、透明な表面や背後にある物体を含む多層的な深度を理解することが重要である。
既存の多層深度法は一般に単層予測を拡張している。
彼らは3Dポイントのフロント・ツー・バック・オーダーでレイヤを定義し、シーケンシャルにレイヤを予測します。
しかし、層状幾何学では、複数の有効3次元点の層へのグルーピングが認められるので、事前に定義されたグルーピング戦略は本質的に制限的である。
本研究では,事前定義されたグループ化を避けるための多層深度推定手法であるSeeeGroupを提案する。
我々は,画素ごとの多層深度をポイントプロセスとして定式化し,深度層を各カメラ線に沿って無秩序なイベントとして扱う。
このことは観測された深さ層に対して置換不変の確率を誘導し、任意の層群を自然に支持する損失をもたらす。
実験により,本手法は多層深度推定の最先端性を著しく向上し,LayeredDepthベンチマークの4重項相対深度精度を61.34%から70.09%に向上させた。
コードはhttps://github.com/princeton-vl/SeeGroupで入手できる。
関連論文リスト
- FreqPDE: Rethinking Positional Depth Embedding for Multi-View 3D Object Detection Transformers [91.59069344768858]
周波数対応位置深度埋め込み (FreqPDE) を導入し, 空間情報と2次元画像特徴を付加して3次元検出変換器デコーダを提案する。
FreqPDEは2D画像特徴と3D位置埋め込みを組み合わせることで、クエリデコーディングのための3D深度認識機能を生成する。
論文 参考訳(メタデータ) (2025-10-17T07:36:54Z) - An End-to-End Room Geometry Constrained Depth Estimation Framework for Indoor Panorama Images [50.84536164535991]
既存の手法ではピクセルレベルの精度に重点を置いており、部屋の角が乱れ、ノイズ感度が低下する。
室内形状制約に基づく奥行き推定フレームワークを提案する。
本フレームワークには,部屋形状に基づく背景深度解決戦略と,背景分割誘導型融合機構の2つの戦略が組み込まれている。
論文 参考訳(メタデータ) (2025-10-09T05:52:48Z) - PacGDC: Label-Efficient Generalizable Depth Completion with Projection Ambiguity and Consistency [63.74016242995453]
PacGDCは、一般化可能な深度補完のための最小限のアノテーションでデータ多様性を向上させるラベル効率のよい手法である。
本稿では,複数の深度基礎モデルをスケールマニピュレータとして利用する新しいデータ合成パイプラインを提案する。
実験により、PacGDCは複数のベンチマークで顕著に一般化可能であることが示された。
論文 参考訳(メタデータ) (2025-07-10T01:56:30Z) - ARAI-MVSNet: A multi-view stereo depth estimation network with adaptive
depth range and depth interval [19.28042366225802]
マルチビューステレオ(MVS)は幾何学的コンピュータビジョンの基本的な問題である。
適応的な全画素深度範囲と深度間隔を実現するために,新しい多段粗大化フレームワークを提案する。
我々のモデルは最先端の性能を達成し、競争一般化能力を得る。
論文 参考訳(メタデータ) (2023-08-17T14:52:11Z) - SwinDepth: Unsupervised Depth Estimation using Monocular Sequences via
Swin Transformer and Densely Cascaded Network [29.798579906253696]
教師付きトレーニングのための深層地下深度ラベルの取得は困難であり,単分子配列を用いた教師なし深度推定が有望な代替手段として出現する。
本稿では,画像特徴抽出器としてコンボリューションフリーのSwin Transformerを用い,局所的幾何学的特徴と大域的意味的特徴の両方を網羅して深度推定を行う。
また,Densely Cascaded Multi-scale Network (DCMNet)を提案する。
論文 参考訳(メタデータ) (2023-01-17T06:01:46Z) - P3Depth: Monocular Depth Estimation with a Piecewise Planarity Prior [133.76192155312182]
本研究では,コプラナー画素からの情報を選択的に活用して予測深度を改善する手法を提案する。
本手法の広範な評価により, 教師付き単分子深度推定法において, 新たな手法の確立が期待できる。
論文 参考訳(メタデータ) (2022-04-05T10:03:52Z) - Attention Aware Cost Volume Pyramid Based Multi-view Stereo Network for
3D Reconstruction [12.728154351588053]
マルチビュー画像から3次元再構成を行うための効率的なマルチビューステレオ(MVS)ネットワークを提案する。
高分解能深度を実現するために粗粒度深度推論戦略を導入する。
論文 参考訳(メタデータ) (2020-11-25T13:34:11Z) - Depth-wise layering of 3d images using dense depth maps: a threshold
based approach [3.9900653843808187]
提案するDepth-wise Layering技術では,静的シーンの1つの深さ画像を複数のレイヤに分割する。
提案手法の有効性を,多くの画像に高密度深度マップとともに適用することにより評価する。
論文 参考訳(メタデータ) (2020-10-05T07:55:18Z) - Occlusion-Aware Depth Estimation with Adaptive Normal Constraints [85.44842683936471]
カラービデオから多フレーム深度を推定する新しい学習手法を提案する。
本手法は深度推定精度において最先端の手法より優れる。
論文 参考訳(メタデータ) (2020-04-02T07:10:45Z) - Depth Edge Guided CNNs for Sparse Depth Upsampling [18.659087667114274]
ガイドされたスパース深度アップサンプリングは、アライメントされた高解像度カラー画像がガイダンスとして与えられるとき、不規則にサンプリングされたスパース深度マップをアップサンプリングすることを目的としている。
奥行き画像を用いたスパース・不規則深度画像から深度を復元するためのガイド付き畳み込み層を提案する。
実世界の屋内および合成屋外データセット上で,本手法を検証するための総合的な実験を行った。
論文 参考訳(メタデータ) (2020-03-23T08:56:32Z) - DiverseDepth: Affine-invariant Depth Prediction Using Diverse Data [110.29043712400912]
本稿では,アフィン変換に至るまでの多様なシーンにおける高品質な深度を予測できるモノクロ画像を用いた深度推定手法を提案する。
実験の結果,提案手法は,ゼロショットテスト設定と大差で8つのデータセットの先行手法より優れていた。
論文 参考訳(メタデータ) (2020-02-03T05:38:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。