Fugu-MT 論文翻訳(概要): Homographic Navigation: Geometry-Driven Camera Guidance for Deterministic Planar Capture

論文の概要: Homographic Navigation: Geometry-Driven Camera Guidance for Deterministic Planar Capture

arxiv url: http://arxiv.org/abs/2606.22834v1
Date: Mon, 22 Jun 2026 04:15:08 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-25 04:18:53.614163
Title: Homographic Navigation: Geometry-Driven Camera Guidance for Deterministic Planar Capture
Title（参考訳）: ホログラフィーナビゲーション:決定論的平面キャプチャのための幾何学駆動カメラ誘導
Authors: Dominik Kroupa, Marek Vaško, Muh Yuzril Ihza Baharuddin, Adam Herout,
Abstract要約: ホログラフィーナビゲーションは、平面領域の正確な捕捉に向けて、カメラの取得を導くための幾何学中心のフレームワークである。我々は、ホモグラフ拡張による無制限な合成トレーニングデータを生成し、共同認識とローカライゼーションのための単一ショットモデルを訓練する。実験の結果、最小限の監督で正確な平面アライメントが達成できることが示されている。
参考スコア（独自算出の注目度）: 0.9036844836403516
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present homographic navigation, a geometry-centric framework for guiding camera acquisition toward precise capture of planar regions. Rather than treating homography as an output, we use it as an organizing variable that unifies learning, alignment, and evaluation. From a single annotated reference image, we generate unlimited synthetic training data via homographic augmentation and train a single-shot model for joint recognition and localization of multiple artifacts (physical objects with a rectangular planar target) through sparse keypoint prediction. To address precision under limited model input resolution, we introduce a two-pass inference scheme with global detection followed by localized refinement, and a Stable Warp training strategy that significantly improves accuracy, particularly in the high-precision regime. The model also predicts confidence estimates per predicted keypoint and per the whole sample. Experimental results demonstrate that accurate planar alignment can be achieved from minimal supervision, providing a foundation for geometry-driven camera guidance and future learning from in-the-wild video data.
Abstract（参考訳）: 平面領域の正確な取得に向けてカメラの取得を導くための幾何学中心のフレームワークであるホモグラフィックナビゲーションを提案する。ホモグラフィーをアウトプットとして扱うのではなく、学習、アライメント、評価を統一する組織変数として使用する。単一の注釈付き参照画像から、ホモグラフ拡張による無制限な合成訓練データを生成し、スパースキーポイント予測により複数のアーティファクト(長方形平面ターゲットを持つ物理オブジェクト)の連成認識とローカライズのための単一ショットモデルを訓練する。モデル入力解像度が制限された場合の精度を改善するため,大域的検出を伴う2パス推論方式と,特に高精度システムにおいて精度を著しく向上する安定ワープトレーニング方式を導入する。モデルはまた、予測されたキーポイントとサンプル全体の信頼度推定も予測する。実験の結果,最小限の監督によって正確な平面アライメントが達成できることが示され,幾何学駆動型カメラ誘導の基礎と,その周辺ビデオデータからの将来の学習が実現された。

関連論文リスト

Geo-Align: Video Generation Alignment via Metric Geometry Reward [53.65904111864641]
Geo-Alignは、カメラ制御ビデオ再レンダリング用に特別に設計された最初の強化学習フレームワークである。事前訓練されたモデルに基づいて、スケールアウェアの知覚報酬機構を用いてモデルを最適化する。実験により、Geo-Alignは、カメラの正確な制御性と視覚的忠実性の両方において、既存の教師付き学習ベースラインを一貫して上回っていることが示された。
論文参考訳（メタデータ） (2026-05-22T17:59:43Z)
Analytical Modeling and Correction of Distance Error in Homography-Based Ground-Plane Mapping [0.0]
本稿では,ホモグラフィの摂動と結果として生じる距離誤差との明確な関係を導出し,その誤差がカメラからの距離とほぼ2次的に増加することを示す。 1900万以上のサンプルを用いた大規模シミュレーション実験では、モデルが確実に装着された場合、回帰がより高いピーク精度を達成することが示されている。このことは、幾何キャリブレーションの改善が、多くの実用システムにおいてモデル複雑性を増大させるよりも大きな性能向上をもたらすことを示唆している。
論文参考訳（メタデータ） (2026-04-12T20:33:09Z)
HOLO: Homography-Guided Pose Estimator Network for Fine-Grained Visual Localization on SD Maps [13.643067075619841]
マルチビュー画像と標準定義(SD)マップ間の視覚的微粒化のための,新しいホモグラフィ誘導ポーズ推定ネットワークを提案する。我々の知る限りでは、画像からマップへのローカライゼーションのためのホモグラフィ学習とBEVセマンティック推論を統合化するための最初の試みである。
論文参考訳（メタデータ） (2026-01-06T05:48:47Z)
ShelfRectNet: Single View Shelf Image Rectification with Homography Estimation [0.0]
任意の角度から取得した棚画像の修正のために, 4点パラメタライズド・ホモグラフィ行列を推定する深層学習フレームワークを提案する。本手法は,テストセット上の1.298ピクセルの平均角誤差を実現する。この領域でのさらなる研究を促進するため、データセット、ShelfRectSet、およびコードを公開します。
論文参考訳（メタデータ） (2025-11-25T14:14:17Z)
Loc$^2$: Interpretable Cross-View Localization via Depth-Lifted Local Feature Matching [80.57282092735991]
本稿では,高精度かつ解釈可能なクロスビューローカライズ手法を提案する。地上画像の3自由度(DoF)のポーズを、その局所的な特徴と基準空中画像とをマッチングすることによって推定する。実験では、クロスエリアテストや未知の向きといった挑戦的なシナリオにおいて、最先端の精度を示す。
論文参考訳（メタデータ） (2025-09-11T18:52:16Z)
Orient Anything: Learning Robust Object Orientation Estimation from Rendering 3D Models [79.96917782423219]
オリエント・アプライシング(Orient Anything)は、1つの画像でオブジェクトの向きを推定するために設計された最初のエキスパートで基礎的なモデルである。 3Dオブジェクトの前面にアノテートするパイプラインを開発することで、正確な向きのアノテーションで2Mイメージを収集する。本モデルでは,レンダリング画像と実画像の両方において,最先端の向き推定精度を実現する。
論文参考訳（メタデータ） (2024-12-24T18:58:43Z)
View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文参考訳（メタデータ） (2023-08-16T02:51:52Z)
Towards Zero-Shot Scale-Aware Monocular Depth Estimation [28.42580603643096]
任意のテスト画像の計量スケールを予測できる新しい単眼深度推定フレームワークであるZeroDepthを紹介する。これは、(i)入力レベルの幾何学的埋め込みを使用して、オブジェクトの前のスケールを学習し、(ii)エンコーダとデコーダのステージをデカップリングすることで実現される。
論文参考訳（メタデータ） (2023-06-29T18:46:11Z)
An Adaptive Framework for Learning Unsupervised Depth Completion [59.17364202590475]
カラー画像から高密度深度マップとそれに伴うスパース深度測定を推定する手法を提案する。正規化とコビジュアライゼーションは、モデルの適合度とデータによって関連付けられており、単一のフレームワークに統合可能であることを示す。
論文参考訳（メタデータ） (2021-06-06T02:27:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。