論文の概要: Comparative Study of Vision-Based Metric Measurement for Large-Scale Planar Scenes
- arxiv url: http://arxiv.org/abs/2605.26475v1
- Date: Tue, 26 May 2026 02:32:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-27 17:51:41.58557
- Title: Comparative Study of Vision-Based Metric Measurement for Large-Scale Planar Scenes
- Title(参考訳): 大規模平面シーンにおける視力測定の比較検討
- Authors: ZhiXin Sun,
- Abstract要約: 本研究は, 実世界の貯水池における平面計測をカメラを用いて検討し, 3つのアプローチを比較した。
単分子領域では、カメラ形状から平面局在モデルが導出され、カメラピッチ角の影響が解析される。
モノクロレンジは十分なピッチ角下でメートルレベルの精度を達成し、ステレオベースレンジはピッチ変動に対する感度を低減してデシメータレベルの精度を達成し、画像縫合は小規模シーンでは有効であるが、シーンサイズが大きくなるにつれて安定性とスケーラビリティが低下する。
- 参考スコア(独自算出の注目度): 4.484170173286332
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Vision-based metric distance and area measurement remains challenging in large-scale outdoor environments due to long-range sensing, camera zoom, and unstable imaging conditions. This work studies planar metric measurement in a real-world reservoir monitoring scenario using PTZ cameras and compares three representative approaches: geometry-based monocular ranging, image stitching with birds-eye-view transformation, and stereo-based ranging using two jointly calibrated monocular cameras. For monocular ranging, planar localization models are derived from camera geometry and the effect of camera pitch angle is analyzed. Image stitching is investigated for large-area mapping, while a stereo-based scheme is developed for long-range measurement without dedicated stereo hardware. Experiments show clear trade-offs: monocular ranging achieves meter-level accuracy under sufficiently large pitch angles, stereo-based ranging achieves decimeter-level accuracy with reduced sensitivity to pitch variations, and image stitching is effective for small-scale scenes but degrades in stability and scalability as scene size increases.
- Abstract(参考訳): 遠距離センシング、カメラズーム、不安定な撮像条件により、大規模屋外環境では、視覚に基づく距離と面積の測定は依然として困難である。
本研究は,PTZカメラを用いた実世界の貯水池モニタリングシナリオにおける平面距離測定について検討し,幾何学に基づくモノクラーレンジ,鳥眼ビュー変換による画像縫合,および2つの共同校正モノクラーカメラを用いたステレオベースレンジの3つの代表的なアプローチを比較した。
単分子領域では、カメラ形状から平面局在モデルが導出され、カメラピッチ角の影響が解析される。
画像縫合を大面積マッピングのために検討し, ステレオハードウェアを使わずに長距離計測のためのステレオベーススキームを開発した。
モノクロレンジは十分なピッチ角下でメートルレベルの精度を達成し、ステレオベースレンジはピッチ変動に対する感度を低減してデシメータレベルの精度を達成し、画像縫合は小規模シーンでは有効であるが、シーンサイズが大きくなるにつれて安定性とスケーラビリティが低下する。
関連論文リスト
- CalibAnyView: Beyond Single-View Camera Calibration in the Wild [59.66873936532375]
カメラキャリブレーションは、信頼性の高い幾何学的知覚の基本的な前提条件である。
近年の学習に基づく手法では、単一ビューの校正には有望な結果が得られたが、本質的に複数のビューにまたがる幾何的整合性は無視されている。
任意の数の入力ビューをサポートする統一的な定式化であるCalibAnyViewを紹介します。
論文 参考訳(メタデータ) (2026-05-14T09:32:12Z) - PicoEyes: Unified Gaze Estimation Framework for Mixed Reality with a Large-Scale Multi-View Dataset [1.7596293300635233]
PicoEyesは、視線のすべての重要な特性を直接予測する統合された視線推定フレームワークである。
キャリブレーション、視線予測、さまざまなデバイス姿勢を同時に処理する。
眼のパラメータと深度マップをエンドツーエンドで共同で推定することで、三次元眼の再構成をサポートする。
論文 参考訳(メタデータ) (2026-05-08T03:34:09Z) - Two-Stage Camera Calibration Method for Multi-Camera Systems Using Scene Geometry [52.27010615715154]
本稿では,マルチカメラトラッキングシステムのための2段階キャリブレーション手法を提案する。
第1段階では、自然幾何学的プリミティブの演算子のアノテーションに基づいて、個々のカメラの部分校正を行う。
第2段階では、投影された有効視野のインタラクティブな操作により、正確なシステム校正を行う。
論文 参考訳(メタデータ) (2025-12-04T16:47:39Z) - Gamma-from-Mono: Road-Relative, Metric, Self-Supervised Monocular Geometry for Vehicular Applications [2.9457242478147503]
本稿では,軽量な単分子幾何推定法であるGamma-from-Mono (GfM)を紹介する。
GfMはガンマで表される残差とともに支配的な道路面を予測する。
地上のカメラの高さだけで、GfMは決定論的に閉じた形を通してメートル法的な深さを回復する。
論文 参考訳(メタデータ) (2025-12-03T22:37:38Z) - Visual Odometry with Transformers [68.453547770334]
特徴抽出により単眼フレームのシーケンスを処理するビジュアル・オドメトリ・トランスフォーマ(VoT)を導入する。
従来の方法とは異なり、VoTは密度の高い幾何学を推定することなくカメラの動きを直接予測し、監視のためにカメラのポーズのみに依存する。
VoTは、より大きなデータセットで効果的にスケールし、より強力なトレーニング済みバックボーンの恩恵を受け、多様なカメラモーションとキャリブレーション設定を一般化し、従来のメソッドよりも3倍以上高速に動作しながらパフォーマンスを向上する。
論文 参考訳(メタデータ) (2025-10-02T17:00:14Z) - MapAnything: Universal Feed-Forward Metric 3D Reconstruction [63.79151976126576]
MapAnythingは1つ以上の画像を取り込み、カメラの内在性、ポーズ、深さ、部分的な再構築など、任意の幾何学的入力を行う。
そして、メーター3Dシーンの幾何学とカメラを直接補強する。
MapAnythingは、単一のフィードフォワードパスで幅広い3Dビジョンタスクに対処する。
論文 参考訳(メタデータ) (2025-09-16T18:00:14Z) - AlignDiff: Learning Physically-Grounded Camera Alignment via Diffusion [0.5277756703318045]
本稿では,カメラ内在パラメータと外在パラメータをジェネリック・レイ・カメラ・モデルを用いて扱う新しいフレームワークを提案する。
従来のアプローチとは異なり、AlignDiffは意味論から幾何学的特徴へ焦点を移し、局所歪みのより正確なモデリングを可能にした。
実験により,提案手法は,推定光束の角誤差を8.2度,全体のキャリブレーション精度で著しく低減し,課題のある実世界のデータセットに対する既存手法よりも優れていることを示した。
論文 参考訳(メタデータ) (2025-03-27T14:59:59Z) - Baseline and Triangulation Geometry in a Standard Plenoptic Camera [6.719751155411075]
レンズカメラに三角測量を適用可能な幾何学的光場モデルを提案する。
提案手法から推定した距離は,カメラの前に設置した実物の距離と一致している。
論文 参考訳(メタデータ) (2020-10-09T15:31:14Z) - Multi-View Photometric Stereo: A Robust Solution and Benchmark Dataset
for Spatially Varying Isotropic Materials [65.95928593628128]
多視点光度ステレオ技術を用いて3次元形状と空間的に異なる反射率の両方をキャプチャする手法を提案する。
我々のアルゴリズムは、遠近点光源と遠近点光源に適している。
論文 参考訳(メタデータ) (2020-01-18T12:26:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。