論文の概要: Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone
- arxiv url: http://arxiv.org/abs/2308.05358v1
- Date: Thu, 10 Aug 2023 05:54:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-11 13:38:47.856340
- Title: Fine-grained building roof instance segmentation based on domain adapted
pretraining and composite dual-backbone
- Title(参考訳): ドメイン適応プレトレーニングと複合二重バックボーンに基づくきめ細かい屋根のインスタンスセグメンテーション
- Authors: Guozhang Liu, Baochai Peng, Ting Liu, Pan Zhang, Mengke Yuan, Chaoran
Lu, Ningning Cao, Sen Zhang, Simin Huang, Tao Wang
- Abstract要約: 本稿では,高解像度光衛星画像を用いた個々の建物の意味解釈を実現するための枠組みを提案する。
具体的には、レバレッジされたドメイン適応事前学習戦略と複合二重バックボーンは、非ネイティブな特徴学習を大いに促進する。
その結果,本手法は2023年のIEEE GRSS Data Fusion Contestの第一位に位置づけられた。
- 参考スコア(独自算出の注目度): 13.09940764764909
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The diversity of building architecture styles of global cities situated on
various landforms, the degraded optical imagery affected by clouds and shadows,
and the significant inter-class imbalance of roof types pose challenges for
designing a robust and accurate building roof instance segmentor. To address
these issues, we propose an effective framework to fulfill semantic
interpretation of individual buildings with high-resolution optical satellite
imagery. Specifically, the leveraged domain adapted pretraining strategy and
composite dual-backbone greatly facilitates the discriminative feature
learning. Moreover, new data augmentation pipeline, stochastic weight averaging
(SWA) training and instance segmentation based model ensemble in testing are
utilized to acquire additional performance boost. Experiment results show that
our approach ranks in the first place of the 2023 IEEE GRSS Data Fusion Contest
(DFC) Track 1 test phase ($mAP_{50}$:50.6\%). Note-worthily, we have also
explored the potential of multimodal data fusion with both optical satellite
imagery and SAR data.
- Abstract(参考訳): 様々な地形上に位置するグローバル都市の建築様式の多様性、雲や影の影響による光学画像の劣化、屋根タイプのクラス間の大きな不均衡は、頑健で正確な屋根インスタンスセグメンタを設計する上で課題となる。
そこで本稿では,高分解能衛星画像を用いた個々の建築物の意味解釈を実現するための効果的な枠組みを提案する。
特に、レバレッジドドメイン適応プリトレーニング戦略と複合デュアルバックボーンは、識別的特徴学習を大いに促進する。
さらに、新たなデータ拡張パイプライン、確率重み付け(SWA)トレーニング、およびテストにおけるインスタンスセグメンテーションに基づくモデルアンサンブルを利用して、さらなるパフォーマンス向上を図る。
実験の結果,本手法は2023年のIEEE GRSS Data Fusion Contest (DFC) Track 1 test phase (mAP_{50}$:50.6\%)の第一位にランクされている。
また,光衛星画像とSARデータとのマルチモーダルデータ融合の可能性についても検討した。
関連論文リスト
- A Framework for Fine-Tuning LLMs using Heterogeneous Feedback [69.51729152929413]
ヘテロジニアスフィードバックを用いた大規模言語モデル(LLM)の微調整フレームワークを提案する。
まず、不均一なフィードバックデータをSFTやRLHFなどの手法と互換性のある単一の監視形式にまとめる。
次に、この統合されたフィードバックデータセットから、性能向上を得るために高品質で多様なサブセットを抽出する。
論文 参考訳(メタデータ) (2024-08-05T23:20:32Z) - UB-FineNet: Urban Building Fine-grained Classification Network for
Open-access Satellite Images [7.435848987082052]
オープンアクセス衛星画像を用いた都市建物のきめ細かい分類のためのディープ・ネットワーク・アプローチを提案する。
クラス不均衡の問題を緩和するために,カテゴリ情報バランスモジュール (CIBM) とコントラストスーパービジョン (CS) 技術を用いた新たなきめ細かい分類網を提案する。
11の細い建物を持つ香港のデータセットの実験では、Top-1の平均精度が60.45%の有望な分類結果が示された。
論文 参考訳(メタデータ) (2024-03-04T15:40:31Z) - Multi-task deep learning for large-scale building detail extraction from
high-resolution satellite imagery [13.544826927121992]
MT-BR(Multi-task Building Refiner)は、衛星画像から構築の詳細を同時抽出するための適応型ニューラルネットワークである。
大規模アプリケーションでは,限定的だが代表的画像サンプルを戦略的に選択する新しい空間サンプリング方式を考案する。
MT-BRは、様々なメトリクスをまたいだ詳細の構築において、他の最先端の手法よりも一貫して優れている。
論文 参考訳(メタデータ) (2023-10-29T04:43:30Z) - Segment Any Building [8.12405696290333]
この原稿は、画像にセグメンテーションを構築するための最先端表現学習パラダイムを用いて、多様なデータセットをタンデムで活用する能力をアクセント化する。
我々の前衛合同訓練体制は, 都市インフラ整備, 防災戦略, 生態モニタリングなど, 重要な分野に重大な影響を及ぼし, アプローチのメリットを浮き彫りにしている。
この研究の結果は、学術的な追求の基盤を固めることと、セグメンテーション構築の分野における革新的な応用による地平線を埋めることの両方に繋がる。
論文 参考訳(メタデータ) (2023-10-02T12:49:20Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - DA-VEGAN: Differentiably Augmenting VAE-GAN for microstructure
reconstruction from extremely small data sets [110.60233593474796]
DA-VEGANは2つの中心的なイノベーションを持つモデルである。
$beta$-variational autoencoderはハイブリッドGANアーキテクチャに組み込まれている。
このアーキテクチャに特化して、独自の差別化可能なデータ拡張スキームが開発されている。
論文 参考訳(メタデータ) (2023-02-17T08:49:09Z) - A diverse large-scale building dataset and a novel plug-and-play domain
generalization method for building extraction [2.578242050187029]
リモートセンシング画像からのビルディング抽出の開発を容易にするために,新しいビルディングデータセットを導入し,新しい領域一般化手法を提案する。
WHU-Mixビルディングデータセットは、世界中から収集された43,727の多様な画像を含むトレーニング/検証セットと、5大陸5都市からの8402の画像を含むテストセットで構成されている。
建物抽出モデルの一般化能力をさらに向上するために,バッチ型混合(BSM)というドメイン一般化手法を提案する。
論文 参考訳(メタデータ) (2022-08-22T01:43:13Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Buildings Classification using Very High Resolution Satellite Imagery [0.769672852567215]
住宅・非住宅の建物被害評価(BDA)とビルタイプ分類(BTC)に着目した。
まず,意味的セグメンテーションモデルを用いて建物の足跡を抽出する2段階のディープラーニング手法を提案する。
提案手法をF1スコアの精度と精度を示す2つのアプリケーションで検証する。
論文 参考訳(メタデータ) (2021-11-29T16:07:04Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。