論文の概要: A Novel Recurrent Encoder-Decoder Structure for Large-Scale Multi-view
Stereo Reconstruction from An Open Aerial Dataset
- arxiv url: http://arxiv.org/abs/2003.00637v3
- Date: Mon, 16 Mar 2020 04:27:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:15:01.831908
- Title: A Novel Recurrent Encoder-Decoder Structure for Large-Scale Multi-view
Stereo Reconstruction from An Open Aerial Dataset
- Title(参考訳): オープン空中データセットを用いた大規模マルチビューステレオ再構成のための新しいリカレントエンコーダ・デコーダ構造
- Authors: Jin Liu and Shunping Ji
- Abstract要約: 我々は、WHUデータセットと呼ばれる合成空中データセットを提案し、これが最初の大規模多視点空中データセットである。
広帯域深度推定のための新しいネットワークRED-Netについても紹介する。
実験の結果,提案手法は現在のMVS法を50%以上の平均絶対誤差(MAE)で上回り,メモリと計算コストを削減できた。
- 参考スコア(独自算出の注目度): 6.319667056655425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: A great deal of research has demonstrated recently that multi-view stereo
(MVS) matching can be solved with deep learning methods. However, these efforts
were focused on close-range objects and only a very few of the deep
learning-based methods were specifically designed for large-scale 3D urban
reconstruction due to the lack of multi-view aerial image benchmarks. In this
paper, we present a synthetic aerial dataset, called the WHU dataset, we
created for MVS tasks, which, to our knowledge, is the first large-scale
multi-view aerial dataset. It was generated from a highly accurate 3D digital
surface model produced from thousands of real aerial images with precise camera
parameters. We also introduce in this paper a novel network, called RED-Net,
for wide-range depth inference, which we developed from a recurrent
encoder-decoder structure to regularize cost maps across depths and a 2D fully
convolutional network as framework. RED-Net's low memory requirements and high
performance make it suitable for large-scale and highly accurate 3D Earth
surface reconstruction. Our experiments confirmed that not only did our method
exceed the current state-of-the-art MVS methods by more than 50% mean absolute
error (MAE) with less memory and computational cost, but its efficiency as
well. It outperformed one of the best commercial software programs based on
conventional methods, improving their efficiency 16 times over. Moreover, we
proved that our RED-Net model pre-trained on the synthetic WHU dataset can be
efficiently transferred to very different multi-view aerial image datasets
without any fine-tuning. Dataset are available at http://gpcv.whu.edu.cn/data.
- Abstract(参考訳): 近年,多視点ステレオ(mvs)マッチングがディープラーニング手法で解決できることが実証されている。
しかし、これらの取り組みは近距離物体に焦点を当てており、多視点空中画像ベンチマークが欠如しているため、大規模3次元都市再建のために特に設計された深層学習に基づく手法はごくわずかであった。
本稿では,mvsタスク用に開発したwhuデータセットという合成空中データセットを提案する。
正確なカメラパラメータを持つ何千もの実際の空中画像から生成された高精度な3Dデジタルサーフェスモデルから生成された。
また,本論文では,奥行き間のコストマップを定式化する再帰エンコーダ・デコーダ構造と,2次元完全畳み込みネットワークをフレームワークとして開発した,red-netと呼ばれる新しい深み推定ネットワークについても紹介する。
RED-Netの低メモリ要件と高性能により、大規模かつ高精度な3次元地球表面再構成に適している。
実験により,本手法が現在のmvs法を50%以上超えただけでなく,メモリと計算コストを削減し,その効率も向上したことを確認した。
従来の方法に基づく最高の商用ソフトウェアプログラムの1つを上回り、効率を16倍改善した。
さらに, 合成WHUデータセット上で事前学習したRED-Netモデルを, 微調整なしで, 非常に異なる多視点空中画像データセットに効率的に転送できることを実証した。
データセットはhttp://gpcv.whu.edu.cn/dataで入手できる。
関連論文リスト
- CULTURE3D: Cultural Landmarks and Terrain Dataset for 3D Applications [11.486451047360248]
世界中から撮影された高解像度画像を用いた大規模きめ細粒度データセットを提案する。
われわれのデータセットはドローンで撮影した空中画像を使って構築されており、現実世界のサイトレイアウトや建築構造をより正確に把握することができる。
このデータセットは、アーキテクチャ再構築から仮想観光まで、さまざまな3Dアプリケーションをサポートするマルチモーダルデータとのシームレスな統合を可能にする。
論文 参考訳(メタデータ) (2025-01-12T20:36:39Z) - WiLoR: End-to-end 3D Hand Localization and Reconstruction in-the-wild [53.288327629960364]
野生における効率的なマルチハンド再構築のためのデータ駆動パイプラインを提案する。
提案するパイプラインは、リアルタイム完全畳み込みハンドローカライゼーションと、高忠実度トランスフォーマーに基づく3Dハンド再構成モデルという2つのコンポーネントで構成されている。
提案手法は, 一般的な2次元および3次元のベンチマークにおいて, 効率と精度の両方において, 従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2024-09-18T18:46:51Z) - CMAR-Net: Accurate Cross-Modal 3D SAR Reconstruction of Vehicle Targets with Sparse Multi-Baseline Data [5.6680936716261705]
マルチベースライン合成開口レーダ(SAR)3次元トモグラフィは重要なリモートセンシング技術である。
限られた開口部のデータに依存したスパース3D SARの最近の進歩は、費用対効果の代替手段として注目されている。
異種情報を統合することで3次元SAR画像の高精細化を実現する3D-SAR再構成ネットワーク(CMAR-Net)を提案する。
論文 参考訳(メタデータ) (2024-06-06T15:18:59Z) - Efficient Physics-Based Learned Reconstruction Methods for Real-Time 3D
Near-Field MIMO Radar Imaging [0.0]
近距離場多重出力多重出力レーダイメージングシステム(MIMO)は近年注目されている。
本稿では,リアルタイム近接場イメージングのための非定位深層学習に基づく新しい再構成手法を提案する。
ゴールは、設定時の計算コストを低くして、高画質を実現することである。
論文 参考訳(メタデータ) (2023-12-28T11:05:36Z) - Neural Progressive Meshes [54.52990060976026]
本稿では,共有学習空間を用いた3次元メッシュの伝送手法を提案する。
分割型エンコーダ・デコーダアーキテクチャを用いて,この空間を学習する。
本手法は複雑な3次元形状を多種多様な形状で評価し, 圧縮率と復元品質の点で, ベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-10T17:58:02Z) - UAVStereo: A Multiple Resolution Dataset for Stereo Matching in UAV
Scenarios [0.6524460254566905]
本稿では,UAVStereoと呼ばれる多解像度UAVシナリオデータセットを構築し,34k以上のステレオ画像ペアが3つの典型的なシーンをカバーしている。
本稿では,UAVシナリオにおける課題に対処する際の限界を明らかにするとともに,従来型および最先端のディープラーニング手法の評価を行う。
論文 参考訳(メタデータ) (2023-02-20T16:45:27Z) - Simple and Effective Synthesis of Indoor 3D Scenes [78.95697556834536]
1枚以上の画像から3D屋内シーンを没入する問題について検討する。
我々の狙いは、新しい視点から高解像度の画像とビデオを作成することである。
本稿では,不完全点雲の再投影から高解像度のRGB-D画像へ直接マップするイメージ・ツー・イメージのGANを提案する。
論文 参考訳(メタデータ) (2022-04-06T17:54:46Z) - 3DVNet: Multi-View Depth Prediction and Volumetric Refinement [68.68537312256144]
3DVNetは、新しいマルチビューステレオ(MVS)深度予測法である。
私たちのキーとなるアイデアは、粗い深度予測を反復的に更新する3Dシーンモデリングネットワークを使用することです。
本手法は, 深度予測と3次元再構成の両指標において, 最先端の精度を超えることを示す。
論文 参考訳(メタデータ) (2021-12-01T00:52:42Z) - Ground material classification and for UAV-based photogrammetric 3D data
A 2D-3D Hybrid Approach [1.3359609092684614]
近年,物理環境を表す3次元仮想データを作成するために,多くの領域でフォトグラム法が広く用いられている。
これらの最先端技術は、迅速な3D戦場再建、仮想訓練、シミュレーションを目的として、アメリカ陸軍と海軍の注意を引き付けている。
論文 参考訳(メタデータ) (2021-09-24T22:29:26Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。