Fugu-MT 論文翻訳(概要): Multi-task deep learning for large-scale building detail extraction from high-resolution satellite imagery

論文の概要: Multi-task deep learning for large-scale building detail extraction from high-resolution satellite imagery

arxiv url: http://arxiv.org/abs/2310.18899v1
Date: Sun, 29 Oct 2023 04:43:30 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-31 15:39:50.306725
Title: Multi-task deep learning for large-scale building detail extraction from high-resolution satellite imagery
Title（参考訳）: 高分解能衛星画像からの大規模建物ディテール抽出のためのマルチタスクディープラーニング
Authors: Zhen Qian, Min Chen, Zhuo Sun, Fan Zhang, Qingsong Xu, Jinzhao Guo, Zhiwei Xie, Zhixin Zhang
Abstract要約: MT-BR(Multi-task Building Refiner)は、衛星画像から構築の詳細を同時抽出するための適応型ニューラルネットワークである。大規模アプリケーションでは,限定的だが代表的画像サンプルを戦略的に選択する新しい空間サンプリング方式を考案する。 MT-BRは、様々なメトリクスをまたいだ詳細の構築において、他の最先端の手法よりも一貫して優れている。
参考スコア（独自算出の注目度）: 13.544826927121992
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Understanding urban dynamics and promoting sustainable development requires comprehensive insights about buildings. While geospatial artificial intelligence has advanced the extraction of such details from Earth observational data, existing methods often suffer from computational inefficiencies and inconsistencies when compiling unified building-related datasets for practical applications. To bridge this gap, we introduce the Multi-task Building Refiner (MT-BR), an adaptable neural network tailored for simultaneous extraction of spatial and attributional building details from high-resolution satellite imagery, exemplified by building rooftops, urban functional types, and roof architectural types. Notably, MT-BR can be fine-tuned to incorporate additional building details, extending its applicability. For large-scale applications, we devise a novel spatial sampling scheme that strategically selects limited but representative image samples. This process optimizes both the spatial distribution of samples and the urban environmental characteristics they contain, thus enhancing extraction effectiveness while curtailing data preparation expenditures. We further enhance MT-BR's predictive performance and generalization capabilities through the integration of advanced augmentation techniques. Our quantitative results highlight the efficacy of the proposed methods. Specifically, networks trained with datasets curated via our sampling method demonstrate improved predictive accuracy relative to those using alternative sampling approaches, with no alterations to network architecture. Moreover, MT-BR consistently outperforms other state-of-the-art methods in extracting building details across various metrics. The real-world practicality is also demonstrated in an application across Shanghai, generating a unified dataset that encompasses both the spatial and attributional details of buildings.
Abstract（参考訳）: 都市のダイナミクスを理解し、持続可能な開発を促進するには、建物に関する包括的な洞察が必要です。地理空間人工知能は、地球観測データからそのような詳細の抽出を進歩させたが、既存の手法は、実用的な用途のために統一されたビル関連データセットをコンパイルする場合、計算上の非効率と不整合に苦しむことが多い。このギャップを埋めるために,高解像度衛星画像から空間的および属性的な建物の詳細を同時抽出するための適応型ニューラルネットワークであるMulti-task Building Refiner (MT-BR)を導入する。特に、MT-BRは、追加の建築詳細を組み込むことで、適用性を高めることができる。大規模アプリケーションでは,限られた画像サンプルを戦略的に選択する空間サンプリング方式を考案する。このプロセスはサンプルの空間分布とそれらを含む都市環境特性の両方を最適化し、データ作成費を削減しながら抽出効率を向上する。 MT-BRの予測性能と一般化能力は,高度拡張技術の統合によりさらに向上する。提案手法の有効性を定量的に評価した。特に,本手法を用いて学習したネットワークは,ネットワークアーキテクチャの変更を伴わずに,代替サンプリング手法と比較して予測精度が向上した。さらに、mt-brは他の最先端メソッドよりも一貫して優れており、様々なメトリクスにまたがって構築の詳細を抽出する。実世界の実用性は上海全域のアプリケーションでも実証されており、建物の空間的および帰属的詳細の両方を包含する統一データセットを生成する。

関連論文リスト

Synthetic Data Matters: Re-training with Geo-typical Synthetic Labels for Building Detection [13.550020274133866]
対象地域の都市配置に合わせた合成データを用いて,テスト時に再学習モデルを提案する。対象地域の都市構造を忠実に再現する地球型合成データを生成する。実験では、ドメインギャップに応じて、パフォーマンスが大幅に向上し、中央値の12%が改善された。
論文参考訳（メタデータ） (2025-07-22T14:53:13Z)
Knowledge-guided Complex Diffusion Model for PolSAR Image Classification in Contourlet Domain [58.46450049579116]
本稿では,Contourlet領域におけるPolSAR画像分類のための知識誘導複合拡散モデルを提案する。具体的には、まずデータを低周波サブバンドと高周波サブバンドに分解するためにContourlet変換を適用する。次に、低周波成分の統計特性をモデル化するために、知識誘導複合拡散ネットワークを設計する。
論文参考訳（メタデータ） (2025-07-08T04:50:28Z)
Spatial Understanding from Videos: Structured Prompts Meet Simulation Data [79.52833996220059]
本稿では,事前学習された視覚言語モデルにおける3次元空間推論を,アーキテクチャを変更することなく拡張するための統一的なフレームワークを提案する。このフレームワークは、複雑なシーンと質問を解釈可能な推論ステップに分解する構造化プロンプト戦略であるSpatialMindと、多様な3Dシミュレーションシーンから構築されたスケーラブルな質問応答データセットであるScanForgeQAを組み合わせる。
論文参考訳（メタデータ） (2025-06-04T07:36:33Z)
A Novel Shape-Aware Topological Representation for GPR Data with DNN Integration [3.367318729981566]
地中貫入レーダ(GPR)は地下探査に広く用いられている非破壊試験(NDT)技術である。本研究では,地下施設,特にパイプラインの発見を促進する新しい枠組みを提案する。本研究では, 入力データの構造的特徴を増幅し, 埋設物の幾何学的特徴に対するモデルの応答性を向上する新しい形状対応トポロジ表現を提案する。
論文参考訳（メタデータ） (2025-05-26T10:43:34Z)
Latent Diffusion Planning for Imitation Learning [78.56207566743154]
Latent Diffusion Planning (LDP) は、プランナーと逆ダイナミクスモデルからなるモジュラーアプローチである。行動予測からプランニングを分離することにより、LDPは最適なデータと行動自由データのより密集した監視信号の恩恵を受けることができる。シミュレーションされた視覚ロボット操作タスクにおいて、LDPは最先端の模倣学習アプローチより優れている。
論文参考訳（メタデータ） (2025-04-23T17:53:34Z)
Towards Scalable Foundation Model for Multi-modal and Hyperspectral Geospatial Data [14.104497777255137]
本稿では,3つのイノベーションを取り入れた高効率空間スペクトル変換器について紹介する。位置マスキングとチャネルマスキングを統合したHyperspectral Masked Autoencoderフレームワークを用いたLESS ViTの事前訓練を行った。実験により, 提案手法は, 最先端のマルチモーダル地空間基盤モデルと競合する性能を示す。
論文参考訳（メタデータ） (2025-03-17T05:42:19Z)
Classification of residential and non-residential buildings based on satellite data using deep learning [0.0]
本稿では,高分解能衛星データとベクトルデータを組み合わせて,高性能なビルディング分類を実現する新しいディープラーニング手法を提案する。大規模データセットによる実験結果から,F1スコアの0.9936が得られた。
論文参考訳（メタデータ） (2024-11-11T11:23:43Z)
Fine-Grained Building Function Recognition from Street-View Images via Geometry-Aware Semi-Supervised Learning [18.432786227782803]
細粒度建物機能認識のための幾何対応半教師付きフレームワークを提案する。半教師あり学習における擬似ラベルの精度を高めるために,マルチソースデータ間の幾何学的関係を利用する。提案手法は, 建築物のきめ細かい機能認識において, 優れた性能を示す。
論文参考訳（メタデータ） (2024-08-18T12:48:48Z)
IsUMap: Manifold Learning and Data Visualization leveraging Vietoris-Rips filtrations [0.08796261172196743]
局所的に歪んだ距離空間に対する距離表現の体系的かつ詳細な構成を示す。提案手法は,非一様データ分布と複雑な局所的ジオメトリの調整により,既存の手法の制約に対処する。
論文参考訳（メタデータ） (2024-07-25T07:46:30Z)
Hierarchical Features Matter: A Deep Exploration of GAN Priors for Improved Dataset Distillation [51.44054828384487]
階層的生成潜在蒸留(H-GLaD)と呼ばれる新しいパラメータ化法を提案する。本手法はGAN内の階層層を系統的に探索する。さらに,合成データセット評価に伴う計算負担を軽減するために,新しいクラス関連特徴距離尺度を導入する。
論文参考訳（メタデータ） (2024-06-09T09:15:54Z)
Mechanistic Design and Scaling of Hybrid Architectures [114.3129802943915]
我々は、様々な計算プリミティブから構築された新しいハイブリッドアーキテクチャを特定し、テストする。本研究では,大規模計算最適法則と新しい状態最適スケーリング法則解析を用いて,結果のアーキテクチャを実験的に検証する。我々は,MAD合成法と計算-最適パープレキシティを相関させ,新しいアーキテクチャの正確な評価を可能にする。
論文参考訳（メタデータ） (2024-03-26T16:33:12Z)
GBSS:a global building semantic segmentation dataset for large-scale remote sensing building extraction [10.39943244036649]
我々は6大陸から116.9kのサンプル(約742kの建物)からなるグローバル・ビルディング・セマンティック・データセット(データセットを公開予定)を構築した。サイズとスタイルの点で、ビルドサンプルには大きなバリエーションがあるため、セマンティックセグメンテーションモデルの構築の一般化と堅牢性を評価する上で、データセットはより難しいベンチマークになり得る。
論文参考訳（メタデータ） (2024-01-02T12:13:35Z)
Semantic Segmentation of Vegetation in Remote Sensing Imagery Using Deep Learning [77.34726150561087]
本稿では,公開されているリモートセンシングデータからなるマルチモーダル・大規模時間データセットを作成するためのアプローチを提案する。我々は、異なる種類の植生を分離できる畳み込みニューラルネットワーク(CNN)モデルを使用する。
論文参考訳（メタデータ） (2022-09-28T18:51:59Z)
A diverse large-scale building dataset and a novel plug-and-play domain generalization method for building extraction [2.578242050187029]
リモートセンシング画像からのビルディング抽出の開発を容易にするために,新しいビルディングデータセットを導入し,新しい領域一般化手法を提案する。 WHU-Mixビルディングデータセットは、世界中から収集された43,727の多様な画像を含むトレーニング/検証セットと、5大陸5都市からの8402の画像を含むテストセットで構成されている。建物抽出モデルの一般化能力をさらに向上するために,バッチ型混合(BSM)というドメイン一般化手法を提案する。
論文参考訳（メタデータ） (2022-08-22T01:43:13Z)
CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文参考訳（メタデータ） (2022-03-03T05:58:49Z)
Shared Space Transfer Learning for analyzing multi-site fMRI data [83.41324371491774]
マルチボクセルパターン解析(MVPA)は、タスクベース機能磁気共鳴画像(fMRI)データから予測モデルを学習する。 MVPAはよく設計された機能セットと十分なサンプルサイズで機能する。ほとんどのfMRIデータセットはノイズが多く、高次元で、収集するのに高価で、サンプルサイズも小さい。本稿では,新しい伝達学習手法として共有空間移動学習(SSTL)を提案する。
論文参考訳（メタデータ） (2020-10-24T08:50:26Z)
Spatial-Spectral Residual Network for Hyperspectral Image Super-Resolution [82.1739023587565]
ハイパースペクトル画像超解像のための新しいスペクトル空間残差ネットワーク(SSRNet)を提案する。提案手法は,2次元畳み込みではなく3次元畳み込みを用いて空間スペクトル情報の探索を効果的に行うことができる。各ユニットでは空間的・時間的分離可能な3次元畳み込みを用いて空間的・スペクトル的な情報を抽出する。
論文参考訳（メタデータ） (2020-01-14T03:34:55Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。