論文の概要: Road-aware Monocular Structure from Motion and Homography Estimation
- arxiv url: http://arxiv.org/abs/2112.08635v1
- Date: Thu, 16 Dec 2021 05:32:07 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-17 15:52:23.924485
- Title: Road-aware Monocular Structure from Motion and Homography Estimation
- Title(参考訳): 運動とホモグラフィ推定による道路対応単眼構造
- Authors: Wei Sui, Teng Chen, Jiaxin Zhang, Jiao Lu, Qian Zhang
- Abstract要約: 移動からの構造(SFM)と地上平面のホモグラフィー推定は、自律走行や他のロボット工学の応用にとって重要である。
本稿では,両問題をエンドツーエンドに解決し,その性能を向上する手法を提案する。
- 参考スコア(独自算出の注目度): 3.623923862398345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Structure from motion (SFM) and ground plane homography estimation are
critical to autonomous driving and other robotics applications. Recently, much
progress has been made in using deep neural networks for SFM and homography
estimation respectively. However, directly applying existing methods for ground
plane homography estimation may fail because the road is often a small part of
the scene. Besides, the performances of deep SFM approaches are still inferior
to traditional methods. In this paper, we propose a method that learns to solve
both problems in an end-to-end manner, improving performance on both. The
proposed networks consist of a Depth-CNN, a Pose-CNN and a Ground-CNN. The
Depth-CNN and Pose-CNN estimate dense depth map and ego-motion respectively,
solving SFM, while the Pose-CNN and Ground-CNN followed by a homography layer
solve the ground plane estimation problem. By enforcing coherency between SFM
and homography estimation results, the whole network can be trained end to end
using photometric loss and homography loss without any groundtruth except the
road segmentation provided by an off-the-shelf segmenter. Comprehensive
experiments are conducted on KITTI benchmark to demonstrate promising results
compared with various state-of-the-art approaches.
- Abstract(参考訳): structure from motion (sfm) とグランドプレーンのホモグラフィ推定は、自動運転や他のロボット応用に不可欠である。
近年、SFMとホモグラフィー推定にディープニューラルネットワークを用いることで、多くの進歩がなされている。
しかし,地平面のホモグラフィー推定に既存の手法を直接適用することは,道路がシーンの小さな部分であることが多いため失敗する可能性がある。
さらに、深いSFM手法の性能は従来の手法よりも劣っている。
本稿では,両課題をエンドツーエンドで解決し,両者の性能を向上させる手法を提案する。
提案ネットワークはDepth-CNN, Pose-CNN, Ground-CNNで構成されている。
深度CNNとPose-CNNはそれぞれ深度マップとエゴモーメントを推定し、Pose-CNNとGarth-CNNはホモグラフィー層によって地上平面推定問題を解く。
SFMとホモグラフィー推定結果のコヒーレンシーを強制することにより、オフザシェルフセグメンタによって提供される道路セグメンテーション以外の基盤構造なしに、全ネットワークを測光損失とホモグラフィー損失を用いてエンドツーエンドにトレーニングすることができる。
KITTIベンチマークを用いて、様々な最先端手法と比較して有望な結果を示す総合的な実験を行った。
関連論文リスト
- Deep Learning-Based CKM Construction with Image Super-Resolution [14.344058455725692]
本稿では,SRResNet として知られる画像SRネットワークを利用した効果的な深層学習に基づく CKM 構築手法を提案する。
従来の経路損失マップの構成に加えて,チャネル角マップの構築にも本手法を適用することができる。
論文 参考訳(メタデータ) (2024-10-28T02:33:35Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定値から計量深度値を求めるための,実践的なオンラインスケール回復手法であるTanDepthを提案する。
本手法は無人航空機(UAV)の用途に応用され,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスシミュレーションフィルタへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - Deep learning network to correct axial and coronal eye motion in 3D OCT
retinal imaging [65.47834983591957]
深層学習に基づくニューラルネットワークを用いて,OCTの軸運動とコロナ運動のアーチファクトを1つのスキャンで補正する。
実験結果から, 提案手法は動作アーチファクトを効果的に補正し, 誤差が他の方法よりも小さいことを示す。
論文 参考訳(メタデータ) (2023-05-27T03:55:19Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Physics-/Model-Based and Data-Driven Methods for Low-Dose Computed
Tomography: A survey [21.430431819394414]
2016年には、特に低線量CT(LDCT)画像において、高度なトモグラフィーが成功している。
LDCTはビッグデータによって駆動されるが、純粋なエンドツーエンド再構築ネットワークはブラックボックスの性質や不安定性などの大きな問題に悩まされることが多い。
新たなトレンドは、イメージング物理学とモデルをディープネットワークに統合し、物理/モデルベースおよびデータ駆動要素のハイブリッド化を可能にすることだ。
論文 参考訳(メタデータ) (2022-03-29T16:36:51Z) - Spatial-Temporal Map Vehicle Trajectory Detection Using Dynamic Mode
Decomposition and Res-UNet+ Neural Networks [0.0]
本稿では,高角交通カメラから車両軌跡を抽出する,機械学習による縦走査法を提案する。
空間時間マップ(STMap)をスパースフォアグラウンドおよびローランク背景に分解することにより,車両ストランドの抽出に動的モード分解(DMD)法を適用した。
Res-UNet+という名前のディープニューラルネットワークは、2つの一般的なディープラーニングアーキテクチャを適用することでセマンティックセグメンテーションタスクのために設計された。
論文 参考訳(メタデータ) (2022-01-13T00:49:24Z) - New SAR target recognition based on YOLO and very deep multi-canonical
correlation analysis [0.1503974529275767]
本稿では,異なるCNN層から有効な特徴を適応的に融合させることにより,SAR画像ターゲット分類のためのロバストな特徴抽出手法を提案する。
MSTARデータセットの実験により,提案手法が最先端手法より優れていることが示された。
論文 参考訳(メタデータ) (2021-10-28T18:10:26Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - Deep Two-View Structure-from-Motion Revisited [83.93809929963969]
2次元構造移動(SfM)は3次元再構成と視覚SLAMの基礎となる。
古典パイプラインの適切性を活用することで,深部2視点sfmの問題を再検討することを提案する。
本手法は,1)2つのフレーム間の密対応を予測する光フロー推定ネットワーク,2)2次元光フロー対応から相対カメラポーズを計算する正規化ポーズ推定モジュール,3)エピポーラ幾何を利用して探索空間を縮小し,密対応を洗練し,相対深度マップを推定するスケール不変深さ推定ネットワークからなる。
論文 参考訳(メタデータ) (2021-04-01T15:31:20Z) - Deep Gaussian Scale Mixture Prior for Spectral Compressive Imaging [48.34565372026196]
本稿では,ポストリア(MAP)推定フレームワークに基づく新しいHSI再構成手法を提案する。
また,深層畳み込みニューラルネットワーク(DCNN)によるGSMモデルの局所平均の推定も提案する。
論文 参考訳(メタデータ) (2021-03-12T08:57:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。