Fugu-MT 論文翻訳(概要): Extreme Rotation Estimation in the Wild

論文の概要: Extreme Rotation Estimation in the Wild

arxiv url: http://arxiv.org/abs/2411.07096v1
Date: Mon, 11 Nov 2024 16:18:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:46.522433
Title: Extreme Rotation Estimation in the Wild
Title（参考訳）: 野生における極端回転推定
Authors: Hana Bezalel, Dotan Ankri, Ruojin Cai, Hadar Averbuch-Elor,
Abstract要約: 極端に捉えたインターネット画像間の相対的な3次元配向を推定する手法を提案する。シーンレベルのインターネット写真コレクションから収集したExtremeLandmarkPairsデータセットをコントリビュートする。
参考スコア（独自算出の注目度）: 11.5425189881311
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present a technique and benchmark dataset for estimating the relative 3D orientation between a pair of Internet images captured in an extreme setting, where the images have limited or non-overlapping field of views. Prior work targeting extreme rotation estimation assume constrained 3D environments and emulate perspective images by cropping regions from panoramic views. However, real images captured in the wild are highly diverse, exhibiting variation in both appearance and camera intrinsics. In this work, we propose a Transformer-based method for estimating relative rotations in extreme real-world settings, and contribute the ExtremeLandmarkPairs dataset, assembled from scene-level Internet photo collections. Our evaluation demonstrates that our approach succeeds in estimating the relative rotations in a wide variety of extremeview Internet image pairs, outperforming various baselines, including dedicated rotation estimation techniques and contemporary 3D reconstruction methods.
Abstract（参考訳）: 極端に捉えた2つのインターネット画像間の相対的な3次元配向を推定するための手法とベンチマークデータセットを提案する。極端回転推定を目的とした先行作業では、制約された3次元環境を仮定し、パノラマビューから領域を抽出することで視点像をエミュレートする。しかし、野生で撮影された実際の画像は非常に多様であり、外見とカメラの内在性の両方に変化が見られる。本研究では,超現実的な環境下での相対回転を推定するTransformerに基づく手法を提案し,シーンレベルのインターネット写真コレクションから収集したExtremeLandmarkPairsデータセットをコントリビュートする。提案手法は,インターネット画像ペアの相対回転の推定に成功し,専用回転推定技術や現代3次元再構成手法など,様々なベースラインよりも優れていることを示す。

関連論文リスト

ViewMorpher3D: A 3D-aware Diffusion Framework for Multi-Camera Novel View Synthesis in Autonomous Driving [20.935790354765604]
画像拡散モデルに基づく多視点画像拡張フレームワークであるViewMorpher3Dを紹介する。シングルビューのアプローチとは異なり、ViewMorpher3Dはカメラのポーズに条件付けされた一連のレンダリングビュー、幾何学的先行3D、時間的に隣接または空間的に重複する参照ビューを共同で処理する。我々のフレームワークは、様々なカメラとフレキシブルな参照/ターゲットビュー構成に対応しており、多様なセンサー設定に適応できる。
論文参考訳（メタデータ） (2026-01-12T13:44:14Z)
CylinderDepth: Cylindrical Spatial Attention for Multi-View Consistent Self-Supervised Surround Depth Estimation [0.9558392439655014]
自己教師付きサラウンドビュー深度推定は、複数の最小重畳された画像から360視野の高密度で低コストな3D知覚を可能にする。しかし、既存の手法のほとんどは、重なり合う画像の間に矛盾する深さ推定に悩まされている。本稿では,高密度,メートル法,クロスビューに一貫性のある深度を予測できる,時間同期型マルチカメラリグの幾何誘導手法を提案する。
論文参考訳（メタデータ） (2025-11-20T14:55:28Z)
PIS3R: Very Large Parallax Image Stitching via Deep 3D Reconstruction [5.816094524098354]
画像縫合は、異なる視点から撮影された2つの画像を、シームレスで広い1つの画像に整列することを目的としている。既存の縫合法の多くは、このような画像を大きな視差で効果的に扱うのに苦労している。我々は, 深部3次元再構成という新しい概念を基礎として, 非常に大きな視差に対して頑健なPSS3Rを提案する。
論文参考訳（メタデータ） (2025-08-06T09:18:45Z)
Cameras as Rays: Pose Estimation via Ray Diffusion [54.098613859015856]
カメラのポーズを推定することは3D再構成の基本的な課題であり、まばらにサンプリングされたビューを考えると依然として困難である。本稿では,カメラを光束として扱うカメラポーズの分散表現を提案する。提案手法は回帰法と拡散法の両方で,CO3Dのカメラポーズ推定における最先端性能を示す。
論文参考訳（メタデータ） (2024-02-22T18:59:56Z)
Fine Dense Alignment of Image Bursts through Camera Pose and Depth Estimation [45.11207941777178]
本稿では,ハンドヘルドカメラが捉えたバースト内の画像の微細なアライメントに対する新しいアプローチを提案する。提案アルゴリズムは、各画素におけるカメラの動きと表面の深さと向きの両方を最適化することにより、密度の高い対応性を確立する。
論文参考訳（メタデータ） (2023-12-08T17:22:04Z)
Calibrating Panoramic Depth Estimation for Practical Localization and Mapping [20.621442016969976]
周囲環境の絶対深度値は, 局所化, ナビゲーション, 3次元構造推定など, 様々な補助技術にとって重要な手がかりとなる。本研究では,パノラマ画像から推定される精度の高い深度が,3次元情報を必要とする幅広い下流タスクに対して,強力で軽量な入力として機能することを提案する。
論文参考訳（メタデータ） (2023-08-27T04:50:05Z)
FrozenRecon: Pose-free 3D Scene Reconstruction with Frozen Depth Models [67.96827539201071]
本稿では,3次元シーン再構成のための新しいテスト時間最適化手法を提案する。本手法は5つのゼロショットテストデータセット上で,最先端のクロスデータセット再構築を実現する。
論文参考訳（メタデータ） (2023-08-10T17:55:02Z)
RelPose++: Recovering 6D Poses from Sparse-view Observations [66.6922660401558]
スパースビュー画像集合(2-8画像)から6次元カメラポーズを推定する作業に対処する。我々は,画像対上の相対回転よりも分布を推定するネットワークを学習するRelPoseフレームワークを構築した。最終システムは,先行技術よりも6次元ポーズ予測を大幅に改善する。
論文参考訳（メタデータ） (2023-05-08T17:59:58Z)
Extreme Rotation Estimation using Dense Correlation Volumes [73.35119461422153]
本稿では,RGB画像対の相対的な3次元回転を極端に推定する手法を提案する。画像が重なり合わなくても、それらの幾何学的関係に関して豊富な隠れた手がかりがあるかもしれないと観察する。本稿では,2つの入力画像間の全ての点を比較することで,そのような暗黙の手がかりを自動的に学習できるネットワーク設計を提案する。
論文参考訳（メタデータ） (2021-04-28T02:00:04Z)
3D Scene Geometry-Aware Constraint for Camera Localization with Deep Learning [11.599633757222406]
近年、畳み込みニューラルネットワークに基づくエンドツーエンドのアプローチは、従来の3次元幾何学に基づく手法を達成または超えるように研究されている。本研究では,絶対カメラポーズ回帰のためのコンパクトネットワークを提案する。これらの従来の手法から着想を得た3Dシーンの幾何学的制約も、動き、深さ、画像の内容を含むすべての利用可能な情報を活用することによって導入される。
論文参考訳（メタデータ） (2020-05-13T04:15:14Z)
Lightweight Multi-View 3D Pose Estimation through Camera-Disentangled Representation [57.11299763566534]
空間校正カメラで撮影した多視点画像から3次元ポーズを復元する手法を提案する。我々は3次元形状を利用して、入力画像をカメラ視点から切り離したポーズの潜在表現に融合する。アーキテクチャは、カメラプロジェクション演算子に学習した表現を条件付け、ビュー当たりの正確な2次元検出を生成する。
論文参考訳（メタデータ） (2020-04-05T12:52:29Z)
Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。これらの深度マップは、異なるビューを粗く整列するために使用される。本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-03-27T21:28:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。