論文の概要: AI-supported Framework of Semi-Automatic Monoplotting for Monocular
Oblique Visual Data Analysis
- arxiv url: http://arxiv.org/abs/2111.14021v1
- Date: Sun, 28 Nov 2021 02:03:43 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 14:52:41.504073
- Title: AI-supported Framework of Semi-Automatic Monoplotting for Monocular
Oblique Visual Data Analysis
- Title(参考訳): 単眼斜視データ解析のための半自動モノプローティングのAI支援フレームワーク
- Authors: Behzad Golparvar, Ruo-Qian Wang
- Abstract要約: 画像間のピクセルレベルの対応とDEM(Digital Elevation Model)を提案する。
画像とDEMのキーポイント検出、ジオレコレーションされた3次元DEMの検索、正規化ポーズ推定、勾配に基づく最適化、画像ピクセルと実世界の座標の識別を含む分析パイプラインを開発した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: In the last decades, the development of smartphones, drones, aerial patrols,
and digital cameras enabled high-quality photographs available to large
populations and, thus, provides an opportunity to collect massive data of the
nature and society with global coverage. However, the data collected with new
photography tools is usually oblique - they are difficult to be georeferenced,
and huge amounts of data is often obsolete. Georeferencing oblique imagery data
may be solved by a technique called monoplotting, which only requires a single
image and Digital Elevation Model (DEM). In traditional monoplotting, a human
user has to manually choose a series of ground control point (GCP) pairs in the
image and DEM and then determine the extrinsic and intrinsic parameters of the
camera to establish a pixel-level correspondence between photos and the DEM to
enable the mapping and georeferencing of objects in photos. This traditional
method is difficult to scale due to several challenges including the
labor-intensive inputs, the need of rich experience to identify well-defined
GCPs, and limitations in camera pose estimation. Therefore, existing
monoplotting methods are rarely used in analyzing large-scale databases or
near-real-time warning systems. In this paper, we propose and demonstrate a
novel semi-automatic monoplotting framework that provides pixel-level
correspondence between photos and DEMs requiring minimal human interventions. A
pipeline of analyses was developed including key point detection in images and
DEM rasters, retrieving georeferenced 3D DEM GCPs, regularized gradient-based
optimization, pose estimation, ray tracing, and the correspondence
identification between image pixels and real world coordinates. Two numerical
experiments show that the framework is superior in georeferencing visual data
in 3-D coordinates, paving a way toward fully automatic monoplotting
methodology.
- Abstract(参考訳): 過去数十年間、スマートフォン、ドローン、空中パトロール、デジタルカメラの開発により、多くの人々が利用できる高品質な写真が提供され、世界規模で自然と社会の膨大なデータを収集する機会となった。
しかし、新しい写真ツールで収集されたデータは概して斜めであり、ジオレファレンスすることは困難であり、大量のデータはしばしば時代遅れである。
斜め画像データのジオレファレンスは、単一の画像とDEM(Digital Elevation Model)のみを必要とするモノプロットと呼ばれる手法によって解決される。
従来のモノプロットでは、画像とDEM内の一連の接地制御点(GCP)ペアを手動で選択し、カメラの外在的および内在的パラメータを決定して、写真とDEMの間のピクセルレベルの対応を確立し、写真内のオブジェクトのマッピングとジオレファレンスを可能にする。
この従来の方法は、労働集約的な入力、明確に定義されたGCPを特定するためのリッチなエクスペリエンスの必要性、カメラポーズ推定の制限など、いくつかの課題のためにスケールアップが困難である。
したがって、大規模データベースや準リアルタイム警告システムの分析に既存のモノプローティング手法はめったに使われない。
本稿では,画像とdemのピクセルレベル対応を最小限の介入で実現する,新しい半自動モノプロットフレームワークの提案と実証を行う。
画像およびdemラスターにおけるキーポイント検出、ジオリファレンスされた3d dem gcpの検索、正規化勾配に基づく最適化、ポーズ推定、レイトレーシング、画像画素と実世界の座標間の対応識別を含む分析パイプラインを開発した。
2つの数値実験により、このフレームワークは3次元座標における視覚データのジオレファレンスに優れており、完全な自動単発法への道を開いた。
関連論文リスト
- 3D Human Reconstruction in the Wild with Synthetic Data Using Generative Models [52.96248836582542]
本稿では,人間の画像とそれに対応する3Dメッシュアノテーションをシームレスに生成できるHumanWildという,最近の拡散モデルに基づく効果的なアプローチを提案する。
生成モデルを排他的に活用することにより,大規模な人体画像と高品質なアノテーションを生成し,実世界のデータ収集の必要性を解消する。
論文 参考訳(メタデータ) (2024-03-17T06:31:16Z) - Cross-domain and Cross-dimension Learning for Image-to-Graph
Transformers [50.576354045312115]
直接画像からグラフへの変換は、単一のモデルにおけるオブジェクトの検出と関係予測を解決するための課題である。
画像-グラフ変換器のクロスドメインおよびクロス次元変換学習を可能にする一連の手法を提案する。
そこで我々は,2次元の衛星画像上でモデルを事前学習し,それを2次元および3次元の異なるターゲット領域に適用する。
論文 参考訳(メタデータ) (2024-03-11T10:48:56Z) - Towards Hard-pose Virtual Try-on via 3D-aware Global Correspondence
Learning [70.75369367311897]
3D対応のグローバルな対応は、グローバルな意味的相関、局所的な変形、および3D人体の幾何学的先行を共同でエンコードする信頼性のあるフローである。
対向ジェネレータは、3D認識フローによって歪んだ衣服と、対象者の画像とを入力として、フォトリアリスティックな試着結果を合成する。
論文 参考訳(メタデータ) (2022-11-25T12:16:21Z) - Towards Model Generalization for Monocular 3D Object Detection [57.25828870799331]
我々は,Mono3Dオブジェクト検出に有効な統合カメラ一般化パラダイム(CGP)を提案する。
また,インスタンスレベルの拡張によりギャップを埋める2D-3D幾何一貫性オブジェクトスケーリング戦略(GCOS)を提案する。
DGMono3Dと呼ばれる手法は、評価された全てのデータセットに対して顕著な性能を達成し、SoTAの教師なしドメイン適応スキームを上回ります。
論文 参考訳(メタデータ) (2022-05-23T23:05:07Z) - Feature matching for multi-epoch historical aerial images [0.0]
本研究では,異なるタイミングで撮影された歴史的画像の特徴対応を検出するための完全自動アプローチを提案する。
現状と比較すると,画像のジオレファレンス精度は2。
論文 参考訳(メタデータ) (2021-12-08T12:28:24Z) - Conditional Generation of Synthetic Geospatial Images from Pixel-level
and Feature-level Inputs [0.0]
画素レベル条件 (PLC) と特徴レベル条件 (FLC) を同時に条件付きで合成する条件生成モデル VAE-Info-cGAN を提案する。
提案モデルでは,道路網の時間的表現のみを条件に,異なる地理的位置をまたいだ様々な形態のマクロアグリゲーションを高精度に生成することができる。
論文 参考訳(メタデータ) (2021-09-11T06:58:19Z) - Depth-Aware Multi-Grid Deep Homography Estimation with Contextual
Correlation [38.95610086309832]
ホログラフィー推定は、画像ステッチ、ビデオ安定化、カメラキャリブレーションなどのコンピュータビジョンにおいて重要なタスクである。
従来のホモグラフィー推定法は特徴点の量と分布に依存するため、テクスチャレスシーンではロバスト性が低い。
特徴写像上の長距離相関を捉えることができ、学習フレームワークに柔軟にブリッジできるコンテキスト相関層を提案する。
我々は,新しい深度認識型形状保存損失を導入することで,ネットワークに深度知覚能力を持たせる。
論文 参考訳(メタデータ) (2021-07-06T10:33:12Z) - Self-supervised Human Detection and Segmentation via Multi-view
Consensus [116.92405645348185]
本稿では,トレーニング中に幾何学的制約を多視点一貫性という形で組み込むマルチカメラフレームワークを提案する。
本手法は,標準ベンチマークから視覚的に外れた画像に対して,最先端の自己監視的人物検出とセグメンテーション技術に勝ることを示す。
論文 参考訳(メタデータ) (2020-12-09T15:47:21Z) - VAE-Info-cGAN: Generating Synthetic Images by Combining Pixel-level and
Feature-level Geospatial Conditional Inputs [0.0]
画素レベル(PLC)と特徴レベル(FLC)を同時に条件付けした意味的リッチな画像を合成するための条件生成モデルを提案する。
GPSデータセットを用いた実験では,提案モデルが地理的に異なる場所にまたがる様々な形態のマクロアグリゲーションを正確に生成できることが示されている。
論文 参考訳(メタデータ) (2020-12-08T03:46:19Z) - Single View Metrology in the Wild [94.7005246862618]
本研究では,物体の3次元の高さや地上のカメラの高さで表現されるシーンの絶対的なスケールを再現する,単一ビューメロジに対する新しいアプローチを提案する。
本手法は,被写体の高さなどの3Dエンティティによる未知のカメラとの相互作用から,弱い教師付き制約を抑えるために設計されたディープネットワークによって学習されたデータ駆動の先行情報に依存する。
いくつかのデータセットと仮想オブジェクト挿入を含むアプリケーションに対して、最先端の定性的かつ定量的な結果を示す。
論文 参考訳(メタデータ) (2020-07-18T22:31:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。