論文の概要: Versatile Depth Estimator Based on Common Relative Depth Estimation and
Camera-Specific Relative-to-Metric Depth Conversion
- arxiv url: http://arxiv.org/abs/2303.10991v1
- Date: Mon, 20 Mar 2023 10:19:50 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 16:05:12.635755
- Title: Versatile Depth Estimator Based on Common Relative Depth Estimation and
Camera-Specific Relative-to-Metric Depth Conversion
- Title(参考訳): 共通相対深度推定とカメラ固有相対距離変換に基づく多用途深度推定器
- Authors: Jinyoung Jun, Jae-Han Lee, and Chang-Su Kim
- Abstract要約: 本稿では,共通相対深度推定器 (CRDE) と多重相対測度変換器 (R2MC) を組み合わせた多目的深度推定器 (VDE) を提案する。
提案されたVDEは、屋内シーンと屋外シーンの両方を含む多様なシーンに対応でき、カメラ当たりのパラメータの増加は1.12%に過ぎなかった。
実験により、VDEは複数のカメラを効果的かつ効率的にサポートし、従来の単一カメラシナリオで最先端の性能を達成できることを示した。
- 参考スコア(独自算出の注目度): 36.36012484044768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A typical monocular depth estimator is trained for a single camera, so its
performance drops severely on images taken with different cameras. To address
this issue, we propose a versatile depth estimator (VDE), composed of a common
relative depth estimator (CRDE) and multiple relative-to-metric converters
(R2MCs). The CRDE extracts relative depth information, and each R2MC converts
the relative information to predict metric depths for a specific camera. The
proposed VDE can cope with diverse scenes, including both indoor and outdoor
scenes, with only a 1.12\% parameter increase per camera. Experimental results
demonstrate that VDE supports multiple cameras effectively and efficiently and
also achieves state-of-the-art performance in the conventional single-camera
scenario.
- Abstract(参考訳): 典型的な単眼深度推定器は単一のカメラ用に訓練されているため、異なるカメラで撮影された画像では性能が著しく低下する。
この問題に対処するために,共通相対深度推定器 (CRDE) と多重相対測度変換器 (R2MC) からなる多目的深度推定器 (VDE) を提案する。
CRDEは相対深度情報を抽出し、各R2MCは相対情報を特定のカメラの計量深度を予測する。
提案したVDEは、屋内シーンと屋外シーンの両方を含む多様なシーンに対応でき、カメラ当たりのパラメータの増加は 1.12 % である。
実験により、VDEは複数のカメラを効果的かつ効率的にサポートし、従来の単一カメラシナリオで最先端の性能を達成できることを示した。
関連論文リスト
- SM4Depth: Seamless Monocular Metric Depth Estimation across Multiple Cameras and Scenes by One Model [72.0795843450604]
現在のアプローチでは、さまざまなシーンで一貫した精度を維持する上で、課題に直面している。
これらの手法は、何千万、あるいは数千万のデータからなる広範囲なデータセットに依存している。
本稿では室内と屋外の両方でシームレスに機能するSM$4$Depthについて述べる。
論文 参考訳(メタデータ) (2024-03-13T14:08:25Z) - SDGE: Stereo Guided Depth Estimation for 360$^\circ$ Camera Sets [65.64958606221069]
マルチカメラシステムは、360ドル周の知覚を達成するために、しばしば自律走行に使用される。
360ドル(約3万3000円)のカメラセットは、しばしば制限または低品質のオーバーラップ領域を持ち、画像全体に対してマルチビューステレオメソッドを実現する。
重なりの重なりに多視点ステレオ結果を明示的に利用することにより、全画像の深さ推定を強化するステレオガイド深度推定法(SGDE)を提案する。
論文 参考訳(メタデータ) (2024-02-19T02:41:37Z) - Zero-Shot Metric Depth with a Field-of-View Conditioned Diffusion Model [34.85279074665031]
単眼深度推定法は標準ベンチマークで大きく進歩したが、ゼロショット距離深度推定は未解決のままである。
近年,屋内と屋外のシーンを共同でモデリングするためのマルチヘッドアーキテクチャが提案されている。
我々は、ログスケールの深さパラメータ化などのいくつかの進歩を伴って、汎用的なタスクに依存しない拡散モデルを提案する。
論文 参考訳(メタデータ) (2023-12-20T18:27:47Z) - Robust Self-Supervised Extrinsic Self-Calibration [25.727912226753247]
マルチカメラによるビデオからの単眼深度推定は、環境を判断する上で有望な方法である。
本稿では,自己教師型単眼深度と自我運動学習の原理を基礎として,外因性キャリブレーションの新たな手法を提案する。
論文 参考訳(メタデータ) (2023-08-04T06:20:20Z) - Multi-Camera Collaborative Depth Prediction via Consistent Structure
Estimation [75.99435808648784]
本稿では,新しいマルチカメラ協調深度予測法を提案する。
カメラ間の構造的整合性を維持しながら、大きな重なり合う領域を必要としない。
DDADおよびNuScenesデータセットの実験結果から,本手法の優れた性能を示す。
論文 参考訳(メタデータ) (2022-10-05T03:44:34Z) - Unsupervised Visible-light Images Guided Cross-Spectrum Depth Estimation
from Dual-Modality Cameras [33.77748026254935]
クロススペクトル深度推定は、対のデュアルスペクトル画像を用いて、すべての照明条件で深度マップを提供することを目的としている。
本稿では,教師なし可視光画像ガイド型クロススペクトル(熱・可視光,略してTIR-VIS)の奥行き推定フレームワークを提案する。
提案手法は,既存手法と比較して性能が向上する。
論文 参考訳(メタデータ) (2022-04-30T12:58:35Z) - SurroundDepth: Entangling Surrounding Views for Self-Supervised
Multi-Camera Depth Estimation [101.55622133406446]
本研究では,複数の周囲からの情報を組み込んだSurroundDepth法を提案し,カメラ間の深度マップの予測を行う。
具体的には、周囲のすべてのビューを処理し、複数のビューから情報を効果的に融合するクロスビュー変換器を提案する。
実験において,本手法は,挑戦的なマルチカメラ深度推定データセット上での最先端性能を実現する。
論文 参考訳(メタデータ) (2022-04-07T17:58:47Z) - Robust Consistent Video Depth Estimation [65.53308117778361]
本稿では,単眼映像からカメラのカメラポーズと密集した深度マップを推定するアルゴリズムを提案する。
本手法は,(1)低周波大規模アライメントのためのフレキシブルな変形-スプラインと(2)細部奥行き詳細の高周波アライメントのための幾何認識深度フィルタリングとを組み合わせた手法である。
従来の手法とは対照的に, カメラのポーズを入力として必要とせず, かなりの音量, 揺動, 動きのぼやき, 転がりシャッター変形を含む携帯のハンドヘルドキャプチャに頑健な再構成を実現する。
論文 参考訳(メタデータ) (2020-12-10T18:59:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。