論文の概要: A Large Scale Homography Benchmark
- arxiv url: http://arxiv.org/abs/2302.09997v1
- Date: Mon, 20 Feb 2023 14:18:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-21 15:15:23.911798
- Title: A Large Scale Homography Benchmark
- Title(参考訳): 大規模ホログラフィーベンチマーク
- Authors: Daniel Barath, Dmytro Mishkin, Michal Polic, Wolfgang F\"orstner, Jiri
Matas
- Abstract要約: 1DSfMデータセットから10万枚の画像から約1000個の平面が観測された3D, Pi3Dの平面の大規模データセットを示す。
また,Pi3Dを利用した大規模ホモグラフィ推定ベンチマークであるHEBを提案する。
- 参考スコア(独自算出の注目度): 52.55694707744518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a large-scale dataset of Planes in 3D, Pi3D, of roughly 1000
planes observed in 10 000 images from the 1DSfM dataset, and HEB, a large-scale
homography estimation benchmark leveraging Pi3D. The applications of the Pi3D
dataset are diverse, e.g. training or evaluating monocular depth, surface
normal estimation and image matching algorithms. The HEB dataset consists of
226 260 homographies and includes roughly 4M correspondences. The homographies
link images that often undergo significant viewpoint and illumination changes.
As applications of HEB, we perform a rigorous evaluation of a wide range of
robust estimators and deep learning-based correspondence filtering methods,
establishing the current state-of-the-art in robust homography estimation. We
also evaluate the uncertainty of the SIFT orientations and scales w.r.t. the
ground truth coming from the underlying homographies and provide codes for
comparing uncertainty of custom detectors. The dataset is available at
\url{https://github.com/danini/homography-benchmark}.
- Abstract(参考訳): 1DSfMデータセットから10万の画像で観測された約1000の平面の3D, Pi3Dにおける平面の大規模データセットと, Pi3Dを利用した大規模ホモグラフィ推定ベンチマークであるHEBを示す。
Pi3Dデータセットの応用は、例えば、単分子深度、表面正規推定および画像マッチングアルゴリズムのトレーニングや評価など、多様である。
HEBデータセットは226の260のホモグラフで構成され、約4Mの対応を含んでいる。
相同性は、しばしば重要な視点と照明の変化を受ける画像をリンクする。
hebの応用として,多種多様なロバスト推定器とディープラーニングに基づく対応フィルタリング手法の厳密な評価を行い,ロバストホモグラフィ推定における現状を確立した。
また,基礎となる相同性から生じる基底的真理をw.r.t.のsift方向とスケールの不確実性を評価し,カスタム検出器の不確実性を比較するためのコードを提供する。
データセットは \url{https://github.com/danini/homography-benchmark} で利用可能である。
関連論文リスト
- Metric3Dv2: A Versatile Monocular Geometric Foundation Model for Zero-shot Metric Depth and Surface Normal Estimation [74.28509379811084]
Metric3D v2は、ゼロショット距離深さと1枚の画像からの表面正規推定のための幾何学的基礎モデルである。
距離深度推定と表面正規度推定の両方の解を提案する。
本手法は, ランダムに収集したインターネット画像上での計測3次元構造の正確な復元を可能にする。
論文 参考訳(メタデータ) (2024-03-22T02:30:46Z) - Fine-Grained Cross-View Geo-Localization Using a Correlation-Aware
Homography Estimator [12.415973198004169]
そこで我々は, 微粒なクロスビューなジオローカライゼーションの新たなアプローチを提案する。
提案手法は,同じ領域をカバーするGPSタグ付き衛星画像と,歪んだ地上画像とを一致させる。
提案手法は30FPSの速度で動作し,最先端技術より優れる。
論文 参考訳(メタデータ) (2023-08-31T17:59:24Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - SATR: Zero-Shot Semantic Segmentation of 3D Shapes [74.08209893396271]
大規模オフザシェルフ2次元画像認識モデルを用いて3次元形状のゼロショットセマンティックセマンティックセマンティックセグメンテーションの課題について検討する。
本研究では、SATRアルゴリズムを開発し、ShapeNetPartと提案したFAUSTベンチマークを用いて評価する。
SATRは最先端のパフォーマンスを達成し、ベースラインアルゴリズムを平均mIoUの1.3%と4%で上回っている。
論文 参考訳(メタデータ) (2023-04-11T00:43:16Z) - Contour Context: Abstract Structural Distribution for 3D LiDAR Loop
Detection and Metric Pose Estimation [31.968749056155467]
本稿では,高精度な3DoF距離ポーズ推定を用いた簡易かつ効果的かつ効率的なトポロジカルループ閉包検出パイプラインを提案する。
我々は,3次元LiDAR点から投影されるBEV像を構造層分布として解釈する。
検索キーは、層状KD木でインデックスされたデータベースの検索を高速化するように設計されている。
論文 参考訳(メタデータ) (2023-02-13T07:18:24Z) - 360 Depth Estimation in the Wild -- The Depth360 Dataset and the SegFuse
Network [35.03201732370496]
全方位画像からの一視点深度推定は、自律運転やシーン再構築といった幅広い応用で人気を博している。
本研究ではまず,トレーニングデータ問題に対処するため,Depth360と呼ばれるさまざまな設定の大規模データセットを構築した。
次に、人間の眼を模倣してデータセットから効果的に学習する、エンドツーエンドのマルチタスク学習ネットワークであるSegFuseを提案する。
論文 参考訳(メタデータ) (2022-02-16T11:56:31Z) - AI-supported Framework of Semi-Automatic Monoplotting for Monocular
Oblique Visual Data Analysis [0.0]
画像間のピクセルレベルの対応とDEM(Digital Elevation Model)を提案する。
画像とDEMのキーポイント検出、ジオレコレーションされた3次元DEMの検索、正規化ポーズ推定、勾配に基づく最適化、画像ピクセルと実世界の座標の識別を含む分析パイプラインを開発した。
論文 参考訳(メタデータ) (2021-11-28T02:03:43Z) - Object Detection in Aerial Images: A Large-Scale Benchmark and
Challenges [124.48654341780431]
航空画像(DOTA)におけるオブジェクトデテクションの大規模データセットとODAIの総合的ベースラインについて述べる。
提案するDOTAデータセットは,11,268個の空中画像から収集した18カテゴリのオブジェクト指向ボックスアノテーションの1,793,658個のオブジェクトインスタンスを含む。
70以上の構成を持つ10の最先端アルゴリズムをカバーするベースラインを構築し,各モデルの速度と精度を評価した。
論文 参考訳(メタデータ) (2021-02-24T11:20:55Z) - MVHM: A Large-Scale Multi-View Hand Mesh Benchmark for Accurate 3D Hand
Pose Estimation [32.12879364117658]
1枚のRGB画像から3Dハンドポーズを推定することは困難である。
我々は、任意のターゲットメッシュ基底真理に一致する剛性メッシュモデルを可能にするスピンマッチングアルゴリズムを設計する。
提案手法は,提案するデータセットを用いて手ポーズ推定器の訓練が性能を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2020-12-06T07:55:08Z) - ETH-XGaze: A Large Scale Dataset for Gaze Estimation under Extreme Head
Pose and Gaze Variation [52.5465548207648]
ETH-XGazeは100万以上の高解像度画像からなる新しい視線推定データセットである。
我々のデータセットは、異なる頭部ポーズと視線角度で視線推定手法のロバスト性を大幅に改善できることを示す。
論文 参考訳(メタデータ) (2020-07-31T04:15:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。