論文の概要: A Deep Learning Ensemble Framework for Off-Nadir Geocentric Pose
Prediction
- arxiv url: http://arxiv.org/abs/2205.11230v3
- Date: Sat, 6 Aug 2022 08:16:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-14 08:49:32.502791
- Title: A Deep Learning Ensemble Framework for Off-Nadir Geocentric Pose
Prediction
- Title(参考訳): オフナディア測地偏差予測のための深層学習アンサンブルフレームワーク
- Authors: Christopher Sun, Jai Sharma, Milind Maiti
- Abstract要約: 現在のソフトウェアは、ほぼナディア画像のみに最適に機能するが、ナディア画像は自然災害後の最初の情報源であることが多い。
本研究では,世界の都市における5,923個の近海RGB衛星画像を用いて,地球中心のポーズを予測するための深層学習アンサンブルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational methods to accelerate natural disaster response include change
detection, map alignment, and vision-aided navigation. Current software
functions optimally only on near-nadir images, though off-nadir images are
often the first sources of information following a natural disaster. The use of
off-nadir images for the aforementioned tasks requires the computation of
geocentric pose, which is an aerial vehicle's spatial orientation with respect
to gravity. This study proposes a deep learning ensemble framework to predict
geocentric pose using 5,923 near-nadir and off-nadir RGB satellite images of
cities worldwide. First, a U-Net Fully Convolutional Neural Network predicts
the pixel-wise above-ground elevation mask of the RGB images. Then, the
elevation masks are concatenated with the RGB images to form four-channel
inputs fed into a second convolutional model, which predicts orientation angle
and magnification scale. A performance accuracy of R2=0.917 significantly
outperforms previous methodologies. In addition, outlier removal is performed
through supervised interpolation, and a sensitivity analysis of elevation masks
is conducted to gauge the usefulness of data features, motivating future
avenues of feature engineering. The high-accuracy software built in this study
contributes to mapping and navigation procedures for effective disaster
response to save lives.
- Abstract(参考訳): 自然災害対応を加速する計算手法には、変化検出、地図アライメント、視覚支援ナビゲーションなどがある。
現在のソフトウェアはnadirに近い画像のみに最適に機能するが、オフnadir画像は自然災害後の最初の情報源であることが多い。
上記のタスクにオフnadir画像を使用するには、重力に対する航空機の空間方向であるジオセントリックなポーズの計算が必要である。
本研究では,世界の都市における5,923個の近海RGB衛星画像を用いて,地球中心のポーズを予測するためのディープラーニングアンサンブルフレームワークを提案する。
まず、U-Net Fully Convolutional Neural Networkは、RGB画像の画素方向の地上高度マスクを予測する。
そして、標高マスクをRGB画像と連結して第2畳み込みモデルに入力される4チャンネル入力を形成し、方位角と倍率スケールを予測する。
R2=0.917の性能精度は従来の手法よりも大幅に向上した。
また,教師付き補間により異常除去を行い,標高マスクの感度分析を行い,データ特徴量の有用性を評価し,将来的な特徴工学の道筋を動機付ける。
本研究で構築した高精度ソフトウェアは,災害対応のための地図作成とナビゲーションに有効である。
関連論文リスト
- FlightScope: A Deep Comprehensive Review of Aircraft Detection Algorithms in Satellite Imagery [2.9687381456164004]
本稿では,衛星画像中の航空機を識別するタスク用にカスタマイズされた,高度な物体検出アルゴリズム群を批判的に評価し,比較する。
この研究は、YOLOバージョン5と8、より高速なRCNN、CenterNet、RetinaNet、RTMDet、DETRを含む一連の方法論を含む。
YOLOv5は空中物体検出のための堅牢なソリューションとして登場し、平均的精度、リコール、ユニオンのスコアに対するインターセクションによってその重要性を裏付けている。
論文 参考訳(メタデータ) (2024-04-03T17:24:27Z) - RFTrans: Leveraging Refractive Flow of Transparent Objects for Surface
Normal Estimation and Manipulation [50.10282876199739]
本稿では、透明物体の表面正規化と操作のためのRGB-Dに基づくRFTransを提案する。
RFNetは屈折流、物体マスク、境界を予測し、次いでF2Netは屈折流から表面の正常を推定する。
現実のロボットがタスクをつかむと、成功率は83%となり、屈折流が直接シミュレートから現実への移動を可能にすることが証明される。
論文 参考訳(メタデータ) (2023-11-21T07:19:47Z) - Combining geolocation and height estimation of objects from street level
imagery [5.887281983256354]
道路レベルRGB画像からの多クラス物体位置推定と高さ推定を組み合わせたパイプラインを提案する。
提案手法は、カスタムトレーニングされた畳み込みニューラルネットワークで検出された画像平面内の物体の座標とともに画像メタデータを使用する。
論文 参考訳(メタデータ) (2023-05-14T19:40:02Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - GoToNet: Fast Monocular Scene Exposure and Exploration [0.6204265638103346]
リアルタイム環境探索のための新しい手法を提案する。
我々の方法は良い戦術的な決定を下すのに一面(イメージ)しか必要としない。
GotoとLookatと呼ばれる画素が特徴である2つの方向予測が,本手法のコアを構成する。
論文 参考訳(メタデータ) (2022-06-13T08:28:31Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - Sparse Auxiliary Networks for Unified Monocular Depth Prediction and
Completion [56.85837052421469]
コスト効率のよいセンサで得られたデータからシーン形状を推定することは、ロボットや自動運転車にとって鍵となる。
本稿では,1枚のRGB画像から,低コストな能動深度センサによるスパース計測により,深度を推定する問題について検討する。
sparse networks (sans) は,深さ予測と完了という2つのタスクをmonodepthネットワークで実行可能にする,新しいモジュールである。
論文 参考訳(メタデータ) (2021-03-30T21:22:26Z) - Memory-Augmented Reinforcement Learning for Image-Goal Navigation [67.3963444878746]
本論文では,クロスエピソードメモリを活用したナビゲーション学習法を提案する。
オーバーフィッティングを避けるため、トレーニング中にRGB入力にデータ拡張を適用することを提案する。
この競合性能はRGB入力のみから得られるが,位置や深度などのセンサは利用できない。
論文 参考訳(メタデータ) (2021-01-13T16:30:20Z) - Aerial Height Prediction and Refinement Neural Networks with Semantic
and Geometric Guidance [0.0]
このレターでは、まずマルチタスクニューラルネットワークを用いて、単一のRGB空中入力画像から得られる高さマップを予測する2段階のアプローチを提案する。
2つの公開データセットの実験により、我々の手法は最先端の結果を生成可能であることが示された。
論文 参考訳(メタデータ) (2020-11-21T01:39:37Z) - Height estimation from single aerial images using a deep ordinal
regression network [12.991266182762597]
単体画像からの高度推定の曖昧で未解決な問題に対処する。
深層学習、特に深層畳み込みニューラルネットワーク(CNN)の成功により、いくつかの研究は、単一の空中画像から高さ情報を推定することを提案した。
本稿では,高さ値を間隔増加間隔に分割し,回帰問題を順序回帰問題に変換することを提案する。
論文 参考訳(メタデータ) (2020-06-04T12:03:51Z) - Where am I looking at? Joint Location and Orientation Estimation by
Cross-View Matching [95.64702426906466]
ジオタグ付き空中画像の大規模データベースを考えると、クロスビューなジオローカライゼーションは問題となる。
地上画像と空中画像の向きを知ることは、これらの2つのビュー間のあいまいさを著しく軽減することができる。
局所化時の横方向のアライメントを推定する動的類似マッチングネットワークを設計する。
論文 参考訳(メタデータ) (2020-05-08T05:21:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。