論文の概要: A diverse large-scale building dataset and a novel plug-and-play domain
generalization method for building extraction
- arxiv url: http://arxiv.org/abs/2208.10004v1
- Date: Mon, 22 Aug 2022 01:43:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-23 13:30:34.044144
- Title: A diverse large-scale building dataset and a novel plug-and-play domain
generalization method for building extraction
- Title(参考訳): 多様な大規模建物データセットと新しい建物抽出用プラグ・アンド・プレイドメイン一般化法
- Authors: Muying Luo, Shunping Ji, Shiqing Wei
- Abstract要約: リモートセンシング画像からのビルディング抽出の開発を容易にするために,新しいビルディングデータセットを導入し,新しい領域一般化手法を提案する。
WHU-Mixビルディングデータセットは、世界中から収集された43,727の多様な画像を含むトレーニング/検証セットと、5大陸5都市からの8402の画像を含むテストセットで構成されている。
建物抽出モデルの一般化能力をさらに向上するために,バッチ型混合(BSM)というドメイン一般化手法を提案する。
- 参考スコア(独自算出の注目度): 2.578242050187029
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we introduce a new building dataset and propose a novel domain
generalization method to facilitate the development of building extraction from
high-resolution remote sensing images. The problem with the current building
datasets involves that they lack diversity, the quality of the labels is
unsatisfactory, and they are hardly used to train a building extraction model
with good generalization ability, so as to properly evaluate the real
performance of a model in practical scenes. To address these issues, we built a
diverse, large-scale, and high-quality building dataset named the WHU-Mix
building dataset, which is more practice-oriented. The WHU-Mix building dataset
consists of a training/validation set containing 43,727 diverse images
collected from all over the world, and a test set containing 8402 images from
five other cities on five continents. In addition, to further improve the
generalization ability of a building extraction model, we propose a domain
generalization method named batch style mixing (BSM), which can be embedded as
an efficient plug-and-play module in the frond-end of a building extraction
model, providing the model with a progressively larger data distribution to
learn data-invariant knowledge. The experiments conducted in this study
confirmed the potential of the WHU-Mix building dataset to improve the
performance of a building extraction model, resulting in a 6-36% improvement in
mIoU, compared to the other existing datasets. The adverse impact of the
inaccurate labels in the other datasets can cause about 20% IoU decrease. The
experiments also confirmed the high performance of the proposed BSM module in
enhancing the generalization ability and robustness of a model, exceeding the
baseline model without domain generalization by 13% and the recent domain
generalization methods by 4-15% in mIoU.
- Abstract(参考訳): 本稿では,新しい建物データセットを導入し,高分解能リモートセンシング画像からの建物抽出を容易にする新しいドメイン一般化手法を提案する。
現在のビルディングデータセットの問題点は、多様性が欠如していること、ラベルの品質が不十分であること、一般化能力の優れた建物抽出モデルのトレーニングにはあまり使われていないこと、実際のシーンでモデルの実際のパフォーマンスを適切に評価することである。
これらの問題を解決するために、whu-mix building datasetという、より実践指向の多様で大規模で高品質なビルディングデータセットを構築しました。
WHU-Mixビルディングデータセットは、世界中から収集された43,727の多様な画像を含むトレーニング/検証セットと、5大陸5都市からの8402の画像を含むテストセットで構成されている。
さらに,建物抽出モデルの一般化能力をさらに向上するため,建物抽出モデルのフロンドエンドに効率的なプラグアンドプレイモジュールとして組み込むことができる領域一般化手法であるバッチスタイル混合(BSM)を提案する。
本研究により, 建物抽出モデルの性能向上を図るため, WHU-Mixビルディングデータセットの可能性を確認し, 他の既存データセットと比較してmIoUが6~36%改善した。
他のデータセットにおける不正確なラベルの悪影響は、約20%のIoU減少を引き起こす可能性がある。
また,提案するbsmモジュールの性能は,13%のドメイン一般化のないベースラインモデルと,miouの最近のドメイン一般化法を4~15%上回って,モデルの一般化能力とロバスト性を高めることが確認された。
関連論文リスト
- D$^4$M: Dataset Distillation via Disentangled Diffusion Model [4.568710926635445]
遠方拡散モデル(D$4$M)によるデータセット蒸留のための効率的なフレームワークを提案する。
アーキテクチャに依存した手法と比較して、D$4$Mは一貫性を保証するために遅延拡散モデルを採用し、ラベル情報をカテゴリのプロトタイプに組み込む。
D$4$Mは優れた性能とロバストな一般化を示し、多くの面においてSOTAメソッドを上回っている。
論文 参考訳(メタデータ) (2024-07-21T12:16:20Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - GBSS:a global building semantic segmentation dataset for large-scale
remote sensing building extraction [10.39943244036649]
我々は6大陸から116.9kのサンプル(約742kの建物)からなるグローバル・ビルディング・セマンティック・データセット(データセットを公開予定)を構築した。
サイズとスタイルの点で、ビルドサンプルには大きなバリエーションがあるため、セマンティックセグメンテーションモデルの構築の一般化と堅牢性を評価する上で、データセットはより難しいベンチマークになり得る。
論文 参考訳(メタデータ) (2024-01-02T12:13:35Z) - Multi-task deep learning for large-scale building detail extraction from
high-resolution satellite imagery [13.544826927121992]
MT-BR(Multi-task Building Refiner)は、衛星画像から構築の詳細を同時抽出するための適応型ニューラルネットワークである。
大規模アプリケーションでは,限定的だが代表的画像サンプルを戦略的に選択する新しい空間サンプリング方式を考案する。
MT-BRは、様々なメトリクスをまたいだ詳細の構築において、他の最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2023-10-29T04:43:30Z) - StableLLaVA: Enhanced Visual Instruction Tuning with Synthesized
Image-Dialogue Data [129.92449761766025]
本稿では,視覚的インストラクションチューニングのための画像と対話を同期的に合成する新しいデータ収集手法を提案する。
このアプローチは生成モデルのパワーを活用し、ChatGPTとテキスト・ツー・イメージ生成モデルの能力とを結合する。
本研究は,各種データセットを対象とした総合的な実験を含む。
論文 参考訳(メタデータ) (2023-08-20T12:43:52Z) - Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone [13.09940764764909]
本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
論文 参考訳(メタデータ) (2023-08-10T05:54:57Z) - T1: Scaling Diffusion Probabilistic Fields to High-Resolution on Unified
Visual Modalities [69.16656086708291]
拡散確率場(DPF)は、距離空間上で定義された連続関数の分布をモデル化する。
本稿では,局所構造学習に着目したビューワイズサンプリングアルゴリズムによる新しいモデルを提案する。
モデルは、複数のモダリティを統一しながら、高解像度のデータを生成するためにスケールすることができる。
論文 参考訳(メタデータ) (2023-05-24T03:32:03Z) - Universal Domain Adaptation from Foundation Models: A Baseline Study [58.51162198585434]
基礎モデルを用いた最先端UniDA手法の実証的研究を行った。
CLIPモデルからターゲット知識を抽出するためのパラメータフリーな手法であるtextitCLIP 蒸留を導入する。
単純な手法ではあるが、ほとんどのベンチマークタスクでは従来の手法よりも優れている。
論文 参考訳(メタデータ) (2023-05-18T16:28:29Z) - DA-VEGAN: Differentiably Augmenting VAE-GAN for microstructure
reconstruction from extremely small data sets [110.60233593474796]
DA-VEGANは2つの中心的なイノベーションを持つモデルである。
$beta$-variational autoencoderはハイブリッドGANアーキテクチャに組み込まれている。
このアーキテクチャに特化して、独自の差別化可能なデータ拡張スキームが開発されている。
論文 参考訳(メタデータ) (2023-02-17T08:49:09Z) - Synthetic-to-Real Domain Generalized Semantic Segmentation for 3D Indoor
Point Clouds [69.64240235315864]
本稿では,本課題に対して,合成-実領域一般化設定を提案する。
合成と実世界のポイントクラウドデータのドメインギャップは、主に異なるレイアウトとポイントパターンにあります。
CINMixとMulti-prototypeの両方が分配ギャップを狭めることを示した。
論文 参考訳(メタデータ) (2022-12-09T05:07:43Z) - Continental-Scale Building Detection from High Resolution Satellite
Imagery [5.56205296867374]
アーキテクチャ,損失関数,正規化,事前学習,自己学習,後処理のバリエーションについて検討し,インスタンスセグメンテーション性能を向上する。
アフリカ全土の100万枚の衛星画像のデータセットを用いて、手動でラベル付けされた建築事例を含む実験が行われた。
本稿では,このモデルを用いた建物検出の性能向上のための新しい手法について報告する。
論文 参考訳(メタデータ) (2021-07-26T15:48:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。