Fugu-MT 論文翻訳(概要): 3D Building Reconstruction from Monocular Remote Sensing Images with Multi-level Supervisions

論文の概要: 3D Building Reconstruction from Monocular Remote Sensing Images with Multi-level Supervisions

arxiv url: http://arxiv.org/abs/2404.04823v1
Date: Sun, 7 Apr 2024 06:17:10 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-09 19:30:39.095694
Title: 3D Building Reconstruction from Monocular Remote Sensing Images with Multi-level Supervisions
Title（参考訳）: 多レベルスーパービジョンを用いた単眼リモートセンシング画像からの3次元構造復元
Authors: Weijia Li, Haote Yang, Zhenghao Hu, Juepeng Zheng, Gui-Song Xia, Conghui He,
Abstract要約: 既存の方法は、完全に教師されたトレーニングのために高価な3Dアノテートされたサンプルに依存している。 MLS-BRNは,異なるアノテーションレベルのトレーニングサンプルを柔軟に活用できる多層構造再構築ネットワークである。
参考スコア（独自算出の注目度）: 34.14373229176196
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: 3D building reconstruction from monocular remote sensing images is an important and challenging research problem that has received increasing attention in recent years, owing to its low cost of data acquisition and availability for large-scale applications. However, existing methods rely on expensive 3D-annotated samples for fully-supervised training, restricting their application to large-scale cross-city scenarios. In this work, we propose MLS-BRN, a multi-level supervised building reconstruction network that can flexibly utilize training samples with different annotation levels to achieve better reconstruction results in an end-to-end manner. To alleviate the demand on full 3D supervision, we design two new modules, Pseudo Building Bbox Calculator and Roof-Offset guided Footprint Extractor, as well as new tasks and training strategies for different types of samples. Experimental results on several public and new datasets demonstrate that our proposed MLS-BRN achieves competitive performance using much fewer 3D-annotated samples, and significantly improves the footprint extraction and 3D reconstruction performance compared with current state-of-the-art. The code and datasets of this work will be released at https://github.com/opendatalab/MLS-BRN.git.
Abstract（参考訳）: モノクルリモートセンシング画像からの3Dビルディング再構築は、大規模アプリケーションにおけるデータ取得と可用性の低さから、近年注目を集めている重要かつ困難な研究課題である。しかし、既存の手法では、完全に教師されたトレーニングのために高価な3Dアノテートサンプルを頼りにしており、大規模なクロスシティシナリオにアプリケーションを制限している。そこで本研究では,多層構造再構築ネットワークであるMLS-BRNを提案する。 Pseudo Building Bbox CalculatorとRoof-Offsetガイド付きフットプリントエクストラクタの2つの新しいモジュールと、さまざまなタイプのサンプルに対する新しいタスクとトレーニング戦略を設計する。提案したMLS-BRNは,より少ない3Dアノテートサンプルを用いて,競争性能を向上し,足跡抽出と3D再構成性能を現状と比較して有意に向上することを示した。この作業のコードとデータセットはhttps://github.com/opendatalab/MLS-BRN.gitで公開される。

関連論文リスト

tttLRM: Test-Time Training for Long Context and Autoregressive 3D Reconstruction [47.43504457409347]
tttLRMは、テストタイムトレーニング層を利用する新しい大型3D再構成モデルである。本フレームワークは,TTT層の高速な重み付けに複数の画像観測を効率よく圧縮する。オンライン学習モデルの変種は,ストリーミング観測による進行的な3次元再構成と改善を支援する。
論文参考訳（メタデータ） (2026-02-23T18:59:45Z)
From Flight to Insight: Semantic 3D Reconstruction for Aerial Inspection via Gaussian Splatting and Language-Guided Segmentation [3.0477617036157136]
高忠実度3D再構成は, インフラ監視, 構造評価, 環境調査などの航空検査業務において重要である。従来のフォトグラム法は幾何学的モデリングを可能にするが、意味論的解釈性に欠け、自動検査の有効性を制限している。ニューラルレンダリングと3Dガウススプラッティング(3DGS)の最近の進歩は、効率的でフォトリアリスティックな再構築を提供するが、同様にシーンレベルの理解が欠如している。言語誘導型3DセグメンテーションのためにFeature-3DGSを拡張するUAVベースのパイプラインを提案する。
論文参考訳（メタデータ） (2025-05-23T02:35:46Z)
Beyond Existance: Fulfill 3D Reconstructed Scenes with Pseudo Details [12.167127919679022]
本研究では,拡散モデルと擬似地下構造データを用いたマルチスケールトレーニングを統合する新しいトレーニング手法を提案する。提案手法は,各種ベンチマークにおける最先端性能を実現し,トレーニングデータセットを超えて3次元再構成機能を拡張する。
論文参考訳（メタデータ） (2025-03-06T02:46:10Z)
UVRM: A Scalable 3D Reconstruction Model from Unposed Videos [68.34221167200259]
従来の2次元視覚データを用いた3D再構成モデルのトレーニングには、トレーニングサンプルのカメラポーズに関する事前知識が必要である。 UVRMは、ポーズに関する情報を必要とせず、単眼ビデオでトレーニングし、評価できる新しい3D再構成モデルである。
論文参考訳（メタデータ） (2025-01-16T08:00:17Z)
HandBooster: Boosting 3D Hand-Mesh Reconstruction by Conditional Synthesis and Sampling of Hand-Object Interactions [68.28684509445529]
HandBoosterは、データの多様性を向上し、3Dハンド・ミーシュ・リコンストラクションのパフォーマンスを向上する新しいアプローチである。まず,多様な手やポーズ,ビュー,背景を持つリアルな画像を生成するために,拡散モデルを誘導する多目的コンテンツ認識条件を構築した。そこで我々は,我々の類似性を考慮した分布サンプリング戦略に基づく新しい条件作成手法を設計し,トレーニングセットとは異なる,斬新で現実的なインタラクションのポーズを意図的に見つける。
論文参考訳（メタデータ） (2024-03-27T13:56:08Z)
Elevation Estimation-Driven Building 3D Reconstruction from Single-View Remote Sensing Imagery [20.001807614214922]
リモートセンシング画像からの3D再構築は、スマートシティやフォトグラムなどの分野に幅広い応用がある。入力単視点リモートセンシング画像から3次元ビルディングモデルを再構築するための効率的なDSM推定駆動再構築フレームワーク(Building3D)を提案する。我々のビル3Dは高度予測のためのSFFDEネットワークに根ざし、マスク構築のためのビル抽出ネットワークと同期し、点雲再構成、表面再構成(シティGMLモデル再構成)を順次実施する。
論文参考訳（メタデータ） (2023-01-11T17:20:30Z)
BS3D: Building-scale 3D Reconstruction from RGB-D Images [25.604775584883413]
本稿では,消費者向け深度カメラを用いた大規模3次元再構築のための使い易いフレームワークを提案する。複雑で高価な買収設定とは異なり、当社のシステムはクラウドソーシングを可能にする。
論文参考訳（メタデータ） (2023-01-03T11:46:14Z)
Semi-Supervised Single-View 3D Reconstruction via Prototype Shape Priors [79.80916315953374]
本研究では,3次元再構成のための半教師付きフレームワークであるSSP3Dを提案する。本稿では,現実的なオブジェクト再構成を導くために,注意誘導型プロトタイプ形状先行モジュールを提案する。実世界のPix3Dデータセットに10%のラベリング比で転送する場合も,本手法は良好に機能する。
論文参考訳（メタデータ） (2022-09-30T11:19:25Z)
Sparse-view Cone Beam CT Reconstruction using Data-consistent Supervised and Adversarial Learning from Scarce Training Data [27.325532306485755]
利用可能なプロジェクションの数が減少するにつれて、従来の再建技術は不十分に機能する。ディープラーニングベースの再構築は、十分なトレーニングデータが利用可能であればパフォーマンスが向上するので、アプリケーションにおいて多くの注目を集めています。本研究は,CT投影数とトレーニングデータの両方が極端に限られている場合に,画像再構成に焦点をあてる。
論文参考訳（メタデータ） (2022-01-23T17:08:52Z)
Advancing 3D Medical Image Analysis with Variable Dimension Transform based Supervised 3D Pre-training [45.90045513731704]
本稿では,革新的でシンプルな3Dネットワーク事前学習フレームワークを再考する。再設計された3Dネットワークアーキテクチャにより、データ不足の問題に対処するために、修正された自然画像が使用される。 4つのベンチマークデータセットに関する総合的な実験により、提案した事前学習モデルが収束を効果的に加速できることが示されている。
論文参考訳（メタデータ） (2022-01-05T03:11:21Z)
The Devil is in the Task: Exploiting Reciprocal Appearance-Localization Features for Monocular 3D Object Detection [62.1185839286255]
低コストのモノクル3D物体検出は、自律運転において基本的な役割を果たす。 DFR-Netという動的特徴反射ネットワークを導入する。我々は、KITTIテストセットの全ての単分子3D物体検出器の中で、第1位にランク付けする。
論文参考訳（メタデータ） (2021-12-28T07:31:18Z)
Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文参考訳（メタデータ） (2021-03-30T17:57:01Z)
PointContrast: Unsupervised Pre-training for 3D Point Cloud Understanding [107.02479689909164]
本研究では,3次元表現学習の研究を支援することを目的とする。教師なし事前学習が3Dシーンの大規模なソースセットに与える影響を計測する。
論文参考訳（メタデータ） (2020-07-21T17:59:22Z)
Segmentation of Macular Edema Datasets with Small Residual 3D U-Net Architectures [5.881334886616738]
本稿では, 深部畳み込み型ニューラルネットワークの黄斑浮腫セグメンテーション問題への応用について検討する。一般的な信念とは対照的に、このアプリケーション設定内のニューラルアーキテクチャは、大量のトレーニングサンプルを必要とせずに、目に見えないテストイメージ上での人間レベルのパフォーマンスに近いパフォーマンスを達成することができる。
論文参考訳（メタデータ） (2020-05-10T15:34:46Z)
Exemplar Fine-Tuning for 3D Human Model Fitting Towards In-the-Wild 3D Human Pose Estimation [107.07047303858664]
3次元の地平線アノテーションを持つ大規模な人的データセットは、野生では入手が困難である。既存の2Dデータセットを高品質な3Dポーズマッチングで拡張することで、この問題に対処する。結果として得られるアノテーションは、3Dのプロシージャネットワークをスクラッチからトレーニングするのに十分である。
論文参考訳（メタデータ） (2020-04-07T20:21:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。