論文の概要: A Generalized Multi-Task Learning Approach to Stereo DSM Filtering in
Urban Areas
- arxiv url: http://arxiv.org/abs/2004.02493v2
- Date: Tue, 7 Apr 2020 15:33:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-16 07:20:56.757555
- Title: A Generalized Multi-Task Learning Approach to Stereo DSM Filtering in
Urban Areas
- Title(参考訳): 都市におけるステレオDSMフィルタリングのための汎用マルチタスク学習手法
- Authors: Lukas Liebel, Ksenia Bittner, Marco K\"orner
- Abstract要約: 都市のモデルと高さマップは、災害管理や都市計画といった多くの応用のための貴重なデータ源となっている。
既存のアプローチを一般化したフレームワークに統合するモジュール型マルチタスク学習の概念を提案する。
本手法は, 定量的, 定性的に, 共通データ上での手法の状態を常に上回り, 独立研究領域の新しいデータセットによく当てはまる。
- 参考スコア(独自算出の注目度): 5.908471365011942
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: City models and height maps of urban areas serve as a valuable data source
for numerous applications, such as disaster management or city planning. While
this information is not globally available, it can be substituted by digital
surface models (DSMs), automatically produced from inexpensive satellite
imagery. However, stereo DSMs often suffer from noise and blur. Furthermore,
they are heavily distorted by vegetation, which is of lesser relevance for most
applications. Such basic models can be filtered by convolutional neural
networks (CNNs), trained on labels derived from digital elevation models (DEMs)
and 3D city models, in order to obtain a refined DSM. We propose a modular
multi-task learning concept that consolidates existing approaches into a
generalized framework. Our encoder-decoder models with shared encoders and
multiple task-specific decoders leverage roof type classification as a
secondary task and multiple objectives including a conditional adversarial
term. The contributing single-objective losses are automatically weighted in
the final multi-task loss function based on learned uncertainty estimates. We
evaluated the performance of specific instances of this family of network
architectures. Our method consistently outperforms the state of the art on
common data, both quantitatively and qualitatively, and generalizes well to a
new dataset of an independent study area.
- Abstract(参考訳): 都市のモデルと高さマップは、災害管理や都市計画といった多くの応用のための貴重なデータ源となっている。
この情報は世界的には入手できないが、安価な衛星画像から自動的に生成されたデジタル表面モデル(dsms)に置き換えることができる。
しかし、ステレオDSMはしばしばノイズやぼやけに悩まされる。
さらに、植物によって大きく歪められているため、ほとんどの用途ではより関連性が低い。
このような基本モデルは、デジタル標高モデル(DEM)と3D都市モデルから派生したラベルに基づいて訓練された畳み込みニューラルネットワーク(CNN)によってフィルタリングされ、洗練されたDSMが得られる。
既存のアプローチを一般化したフレームワークに統合するモジュール型マルチタスク学習の概念を提案する。
共有エンコーダと複数のタスク固有デコーダを持つエンコーダ-デコーダモデルは,屋根型分類を二次タスクとして,条件付き逆項を含む複数の目的に活用する。
寄与する単目的損失は、学習された不確実性推定に基づいて、最終マルチタスク損失関数で自動的に重み付けされる。
ネットワークアーキテクチャのこのファミリの特定のインスタンスの性能を評価した。
本手法は, 定量的, 定性的に, 共通データ上での手法の状態を常に上回り, 独立研究領域の新しいデータセットによく当てはまる。
関連論文リスト
- Probing Fine-Grained Action Understanding and Cross-View Generalization of Foundation Models [13.972809192907931]
ファンデーションモデル(FM)は、広いデータセットでトレーニングされた大規模なニューラルネットワークである。
ビデオにおける人間の活動認識は、異なるアーキテクチャ間の競争によって駆動されるFMによって進歩している。
本稿では,視線変化が人体活動認識の微粒化における異なるFMに与える影響を実験的に評価する。
論文 参考訳(メタデータ) (2024-07-22T12:59:57Z) - Dataset Quantization [72.61936019738076]
大規模データセットを小さなサブセットに圧縮する新しいフレームワークであるデータセット量子化(DQ)を提案する。
DQは、ImageNet-1kのような大規模データセットを最先端圧縮比で蒸留する最初の方法である。
論文 参考訳(メタデータ) (2023-08-21T07:24:29Z) - General-Purpose Multimodal Transformer meets Remote Sensing Semantic
Segmentation [35.100738362291416]
マルチモーダルAIは、特にセマンティックセグメンテーションのような複雑なタスクのために、補完的なデータソースを活用する。
汎用マルチモーダルネットワークの最近のトレンドは、最先端の性能を達成する大きな可能性を示している。
本稿では,3次元畳み込みを利用して重要なローカル情報をエンコードし,同時にモーダルな特徴を学習するUNet型モジュールを提案する。
論文 参考訳(メタデータ) (2023-07-07T04:58:34Z) - MADS: Modulated Auto-Decoding SIREN for time series imputation [9.673093148930874]
我々は,暗黙のニューラル表現に基づく時系列計算のための新しい自動デコードフレームワークMADSを提案する。
実世界の2つのデータセット上で本モデルを評価し,時系列計算における最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-07-03T09:08:47Z) - Hierarchical Graph-Convolutional Variational AutoEncoding for Generative
Modelling of Human Motion [1.2599533416395767]
人間の動きのモデルは通常、軌跡予測または行動分類に焦点を当てるが、どちらもまれである。
本稿では,階層的変動オートエンコーダと深部グラフ畳み込みニューラルネットワークに基づく新しいアーキテクチャを提案する。
この階層型グラフ共進化型自己エンコーダ(HG-VAE)は、コヒーレントな動作を生成し、分布外データを検出し、モデルの後部への勾配上昇による欠落データを出力できることを示す。
論文 参考訳(メタデータ) (2021-11-24T16:21:07Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - DSM Refinement with Deep Encoder-Decoder Networks [0.0]
この研究は、そのようなDSMを自動的に洗練するアプローチを提示する。
重要なアイデアは、参照データからニューラルネットワークに都市部の特性を教えることである。
高さマップの更新を学ぶために、深い残差学習とエンコーダ・デコーダ構造の概念に基づいてネットワークアーキテクチャを設定する。
論文 参考訳(メタデータ) (2020-12-14T11:27:42Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - Deep Autoencoding Topic Model with Scalable Hybrid Bayesian Inference [55.35176938713946]
我々は、ガンマ分布の階層構造を用いて、その多確率層生成ネットワークを構築するディープ・オートエンコーディング・トピック・モデル(DATM)を開発した。
Weibull上向き変分エンコーダを提案する。このエンコーダは深層ニューラルネットワークを介して情報を上向きに伝播し,次いで下向き生成モデルを提案する。
大規模コーパス上での教師なしおよび教師なしの学習タスクにおいて,モデルの有効性とスケーラビリティを実証した。
論文 参考訳(メタデータ) (2020-06-15T22:22:56Z) - Diversity inducing Information Bottleneck in Model Ensembles [73.80615604822435]
本稿では,予測の多様性を奨励することで,ニューラルネットワークの効果的なアンサンブルを生成する問題をターゲットにする。
そこで本研究では,潜伏変数の学習における逆損失の多様性を明示的に最適化し,マルチモーダルデータのモデリングに必要な出力予測の多様性を得る。
最も競争力のあるベースラインと比較して、データ分布の変化の下で、分類精度が大幅に向上した。
論文 参考訳(メタデータ) (2020-03-10T03:10:41Z) - Crowd Counting via Hierarchical Scale Recalibration Network [61.09833400167511]
本稿では,群集カウントの課題に取り組むために,階層型大規模校正ネットワーク(HSRNet)を提案する。
HSRNetは、リッチなコンテキスト依存をモデル化し、複数のスケール関連情報を再検討する。
提案手法は,様々なノイズを選択的に無視し,適切な群集スケールに自動的に焦点を合わせることができる。
論文 参考訳(メタデータ) (2020-03-07T10:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。