論文の概要: Aerial Height Prediction and Refinement Neural Networks with Semantic
and Geometric Guidance
- arxiv url: http://arxiv.org/abs/2011.10697v4
- Date: Fri, 12 Nov 2021 16:54:23 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-22 23:25:03.734228
- Title: Aerial Height Prediction and Refinement Neural Networks with Semantic
and Geometric Guidance
- Title(参考訳): セマンティックおよび幾何学的誘導による空中高度予測とリファインメントニューラルネットワーク
- Authors: Elhousni Mahdi, Zhang Ziming and Huang Xinming
- Abstract要約: このレターでは、まずマルチタスクニューラルネットワークを用いて、単一のRGB空中入力画像から得られる高さマップを予測する2段階のアプローチを提案する。
2つの公開データセットの実験により、我々の手法は最先端の結果を生成可能であることが示された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning provides a powerful new approach to many computer vision tasks.
Height prediction from aerial images is one of those tasks that benefited
greatly from the deployment of deep learning which replaced old multi-view
geometry techniques. This letter proposes a two-stage approach, where first a
multi-task neural network is used to predict the height map resulting from a
single RGB aerial input image. We also include a second refinement step, where
a denoising autoencoder is used to produce higher quality height maps.
Experiments on two publicly available datasets show that our method is capable
of producing state-of-the-art results. Code is available at
https://github.com/melhousni/DSMNet.
- Abstract(参考訳): ディープラーニングは多くのコンピュータビジョンタスクに強力な新しいアプローチを提供する。
空中画像からの高さ予測は、古いマルチビュー幾何技術を置き換えるディープラーニングの展開から大きな恩恵を受けたタスクの1つである。
このレターでは、まずマルチタスクニューラルネットワークを用いて、単一のRGB空中入力画像から得られる高さマップを予測する2段階のアプローチを提案する。
また,2番目の改良ステップでは,高品質な高階マップを作成するためにデノナイジングオートエンコーダが使用される。
公開データセットを2つ実験した結果,本手法は最先端の結果を生成できることが判明した。
コードはhttps://github.com/melhousni/DSMNetで入手できる。
関連論文リスト
- Neural Implicit Dense Semantic SLAM [83.04331351572277]
本稿では,屋内シーンのメモリ効率,高密度な3次元形状,セマンティックセマンティックセグメンテーションをオンラインで学習する新しいRGBD vSLAMアルゴリズムを提案する。
私たちのパイプラインは、従来の3Dビジョンベースのトラッキングとループクローズとニューラルフィールドベースのマッピングを組み合わせたものです。
提案アルゴリズムはシーン認識を大幅に向上させ,様々なロボット制御問題を支援する。
論文 参考訳(メタデータ) (2023-04-27T23:03:52Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - PointMCD: Boosting Deep Point Cloud Encoders via Multi-view Cross-modal
Distillation for 3D Shape Recognition [55.38462937452363]
本稿では,教師として事前訓練されたディープイメージエンコーダ,学生としてディープポイントエンコーダを含む多視点クロスモーダル蒸留アーキテクチャを提案する。
複数ビューの視覚的および幾何学的記述子をペアワイズにアライメントすることで、より強力なディープポイントエンコーダを、疲労や複雑なネットワーク修正を伴わずに得ることができる。
論文 参考訳(メタデータ) (2022-07-07T07:23:20Z) - A Deep Learning Ensemble Framework for Off-Nadir Geocentric Pose
Prediction [0.0]
現在のソフトウェアは、ほぼナディア画像のみに最適に機能するが、ナディア画像は自然災害後の最初の情報源であることが多い。
本研究では,世界の都市における5,923個の近海RGB衛星画像を用いて,地球中心のポーズを予測するための深層学習アンサンブルフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T08:33:41Z) - Sparse Auxiliary Networks for Unified Monocular Depth Prediction and
Completion [56.85837052421469]
コスト効率のよいセンサで得られたデータからシーン形状を推定することは、ロボットや自動運転車にとって鍵となる。
本稿では,1枚のRGB画像から,低コストな能動深度センサによるスパース計測により,深度を推定する問題について検討する。
sparse networks (sans) は,深さ予測と完了という2つのタスクをmonodepthネットワークで実行可能にする,新しいモジュールである。
論文 参考訳(メタデータ) (2021-03-30T21:22:26Z) - Deep Gradient Projection Networks for Pan-sharpening [20.929492740317915]
本稿では,モデルに基づくディープパンシャーピング手法を提案する。
2つのブロックを積み重ねることで、グラデーションプロジェクションベースのパンスハーピングニューラルネットワークと呼ばれる新しいネットワークが構築される。
さまざまな種類の衛星データセットの実験結果は、新しいネットワークが視覚的および定量的に最先端の方法よりも優れていることを示しています。
論文 参考訳(メタデータ) (2021-03-08T07:51:58Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Height estimation from single aerial images using a deep ordinal
regression network [12.991266182762597]
単体画像からの高度推定の曖昧で未解決な問題に対処する。
深層学習、特に深層畳み込みニューラルネットワーク(CNN)の成功により、いくつかの研究は、単一の空中画像から高さ情報を推定することを提案した。
本稿では,高さ値を間隔増加間隔に分割し,回帰問題を順序回帰問題に変換することを提案する。
論文 参考訳(メタデータ) (2020-06-04T12:03:51Z) - Towards Reading Beyond Faces for Sparsity-Aware 4D Affect Recognition [55.15661254072032]
自動4次元表情認識(FER)のための空間認識深層ネットワークを提案する。
まず,深層学習のためのデータ制限問題に対処する新しい拡張手法を提案する。
次に、多視点での畳み込み特徴のスパース表現を計算するために、疎度対応のディープネットワークを提案する。
論文 参考訳(メタデータ) (2020-02-08T13:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。