論文の概要: Princeton365: A Diverse Dataset with Accurate Camera Pose
- arxiv url: http://arxiv.org/abs/2506.09035v1
- Date: Tue, 10 Jun 2025 17:57:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-11 15:11:43.06458
- Title: Princeton365: A Diverse Dataset with Accurate Camera Pose
- Title(参考訳): プリンストン365:正確なカメラ・ポースを内蔵したディヴァース・データセット
- Authors: Karhan Kayan, Stamatis Alexandropoulos, Rishabh Jain, Yiming Zuo, Erich Liang, Jia Deng,
- Abstract要約: Princeton365は、365ビデオの大規模な多様なデータセットで、正確なカメラポーズがある。
我々は、新しい真実収集フレームワークを導入することで、現在のSLAMベンチマークにおける精度とデータの多様性のギャップを埋める。
カメラのポーズ推定誤差によって誘導される光の流れに基づいてSLAMのシーンスケールアウェア評価指標を提案する。
- 参考スコア(独自算出の注目度): 26.939047839896766
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce Princeton365, a large-scale diverse dataset of 365 videos with accurate camera pose. Our dataset bridges the gap between accuracy and data diversity in current SLAM benchmarks by introducing a novel ground truth collection framework that leverages calibration boards and a 360-camera. We collect indoor, outdoor, and object scanning videos with synchronized monocular and stereo RGB video outputs as well as IMU. We further propose a new scene scale-aware evaluation metric for SLAM based on the the optical flow induced by the camera pose estimation error. In contrast to the current metrics, our new metric allows for comparison between the performance of SLAM methods across scenes as opposed to existing metrics such as Average Trajectory Error (ATE), allowing researchers to analyze the failure modes of their methods. We also propose a challenging Novel View Synthesis benchmark that covers cases not covered by current NVS benchmarks, such as fully non-Lambertian scenes with 360-degree camera trajectories. Please visit https://princeton365.cs.princeton.edu for the dataset, code, videos, and submission.
- Abstract(参考訳): Princeton365は、365ビデオの大規模な多様なデータセットで、正確なカメラのポーズを示す。
我々のデータセットは、キャリブレーションボードと360度カメラを利用する新しい真実収集フレームワークを導入することで、現在のSLAMベンチマークにおける精度とデータの多様性のギャップを埋める。
室内, 屋外, オブジェクトスキャンビデオは, IMUと同様にモノクロ, ステレオのRGBビデオ出力を同期して収集する。
また、カメラのポーズ推定誤差によって誘導される光の流れに基づいて、SLAMのシーンスケールアウェア評価指標を提案する。
現在のメトリクスとは対照的に、我々の新しいメトリクスは、平均軌道誤差(ATE)のような既存のメトリクスとは対照的に、シーン間でSLAMメソッドのパフォーマンスの比較を可能にし、研究者はメソッドの障害モードを分析することができる。
また,現在のNVSベンチマークではカバーされていないケース,例えば,360度カメラトラジェクトリを備えた完全に非ランバータのシーンを対象とするノベルビュー合成ベンチマークを提案する。
データセット、コード、ビデオ、投稿について、https://princeton365.cs.princeton.eduをご覧ください。
関連論文リスト
- Boost 3D Reconstruction using Diffusion-based Monocular Camera Calibration [34.18403601269181]
DM-Calibは単一の入力画像からピンホールカメラ固有のパラメータを推定するための拡散に基づくアプローチである。
我々は、カメラ画像と呼ばれる新しい画像ベース表現を導入し、数値カメラの内在を無意味に符号化する。
一つのRGB入力からカメラ画像を生成するための安定拡散モデルを微調整することにより、RANSAC操作を介してカメラ固有の特徴を抽出することができる。
論文 参考訳(メタデータ) (2024-11-26T09:04:37Z) - Diversity-Driven View Subset Selection for Indoor Novel View Synthesis [54.468355408388675]
本稿では、包括的多様性に基づく測定と、よく設計されたユーティリティ機能を統合する新しいサブセット選択フレームワークを提案する。
私たちのフレームワークは、データの5~20%しか使用せずに、ベースライン戦略を一貫して上回ります。
論文 参考訳(メタデータ) (2024-09-11T08:36:49Z) - Robust Frame-to-Frame Camera Rotation Estimation in Crowded Scenes [8.061773364318313]
本稿では,携帯型モノクロビデオから,混み合った現実世界のシーンにおけるカメラ回転推定手法を提案する。
我々は、17の動画シーケンスに対して、高精度で厳密に検証された地上真実を持つ新しいデータセットとベンチマークを提供する。
これは、混み合ったシーンに対する強力な新しいパフォーマンスポイントであり、コンピュータビジョンにとって重要な設定である。
論文 参考訳(メタデータ) (2023-09-15T17:44:07Z) - Metric3D: Towards Zero-shot Metric 3D Prediction from A Single Image [85.91935485902708]
ゼロショット単視距離深度モデルの鍵は、大規模データトレーニングと様々なカメラモデルからの距離あいまいさの解消の組合せにあることを示す。
本稿では,あいまいさ問題に明示的に対処し,既存の単分子モデルにシームレスに接続可能な標準カメラ空間変換モジュールを提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2023-07-20T16:14:23Z) - Deep Learning for Camera Calibration and Beyond: A Survey [100.75060862015945]
カメラキャリブレーションでは、キャプチャされたシーケンスから幾何学的特徴を推測するために、カメラパラメータを推定する。
近年の取り組みでは,手動キャリブレーションの繰り返し作業に代えて,学習ベースのソリューションが活用される可能性が示唆されている。
論文 参考訳(メタデータ) (2023-03-19T04:00:05Z) - RELMOBNET: A Robust Two-Stage End-To-End Training Approach For
MOBILENETV3 Based Relative Camera Pose Estimation [0.6193838300896449]
相対カメラポーズ推定は3次元再構成と視覚的位置推定において重要な役割を担っている。
本稿では,MobileNetV3-LargeをベースとしたSiameseネットワークを提案する。
論文 参考訳(メタデータ) (2022-02-25T17:27:26Z) - Camera Calibration through Camera Projection Loss [4.36572039512405]
画像対を用いた固有(焦点長と主点オフセット)パラメータの予測手法を提案する。
従来の手法とは違って,マルチタスク学習フレームワークにおいて,カメラモデル方程式をニューラルネットワークとして組み込んだ新しい表現を提案する。
提案手法は,10パラメータ中7パラメータに対して,ディープラーニングと従来手法の両方に対して,優れた性能を実現する。
論文 参考訳(メタデータ) (2021-10-07T14:03:10Z) - 6D Camera Relocalization in Ambiguous Scenes via Continuous Multimodal
Inference [67.70859730448473]
あいまいさと不確かさを捉えるマルチモーダルカメラ再ローカライズフレームワークを提案する。
我々は、複数のカメラのポーズ仮説を予測し、それぞれの予測の不確実性も予測する。
あいまいな環境下でのカメラローカライゼーション研究を促進するための新しいデータセットを提案する。
論文 参考訳(メタデータ) (2020-04-09T20:55:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。