論文の概要: Deformable spatial propagation network for depth completion
- arxiv url: http://arxiv.org/abs/2007.04251v2
- Date: Sun, 19 Jul 2020 09:52:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-12 13:24:18.727421
- Title: Deformable spatial propagation network for depth completion
- Title(参考訳): 深度到達のための変形可能な空間伝搬ネットワーク
- Authors: Zheyuan Xu, Hongche Yin, Jian Yao
- Abstract要約: 本稿では,各画素に対して異なる受容場と親和性行列を適応的に生成する変形可能な空間伝搬ネットワーク(DSPN)を提案する。
これにより、ネットワークは伝播のためのより少ないがより関連性の高い情報を得ることができる。
- 参考スコア(独自算出の注目度): 2.5306673456895306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Depth completion has attracted extensive attention recently due to the
development of autonomous driving, which aims to recover dense depth map from
sparse depth measurements. Convolutional spatial propagation network (CSPN) is
one of the state-of-the-art methods in this task, which adopt a linear
propagation model to refine coarse depth maps with local context. However, the
propagation of each pixel occurs in a fixed receptive field. This may not be
the optimal for refinement since different pixel needs different local context.
To tackle this issue, in this paper, we propose a deformable spatial
propagation network (DSPN) to adaptively generates different receptive field
and affinity matrix for each pixel. It allows the network obtain information
with much fewer but more relevant pixels for propagation. Experimental results
on KITTI depth completion benchmark demonstrate that our proposed method
achieves the state-of-the-art performance.
- Abstract(参考訳): 深度測定から深度マップを復元することを目的とした自動運転の開発により,近年,深度完了が注目されている。
畳み込み空間伝播ネットワーク(CSPN)は,局所的な文脈で粗い深度マップを洗練させるために線形伝播モデルを採用する,最先端の手法の1つである。
しかし、各画素の伝播は一定の受容野で起こる。
これは、異なるピクセルが異なるローカルコンテキストを必要とするため、リファインメントに最適ではないかもしれない。
本稿では,各画素に対して異なる受容場と親和性行列を適応的に生成する変形可能な空間伝搬ネットワーク(DSPN)を提案する。
これにより、ネットワークは伝播のためのより少ないがより関連性の高い情報を得ることができる。
kitti depth completionベンチマークにおける実験結果から,提案手法が最先端の性能を実現することを証明した。
関連論文リスト
- Pixel-Aligned Multi-View Generation with Depth Guided Decoder [86.1813201212539]
画素レベルの画像・マルチビュー生成のための新しい手法を提案する。
従来の作業とは異なり、潜伏映像拡散モデルのVAEデコーダにマルチビュー画像にアテンション層を組み込む。
本モデルにより,マルチビュー画像間の画素アライメントが向上する。
論文 参考訳(メタデータ) (2024-08-26T04:56:41Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - FSOINet: Feature-Space Optimization-Inspired Network for Image
Compressive Sensing [11.352530132548912]
本稿では,情報フローのフェーズを特徴空間で段階的に実現し,特徴空間最適化にインスパイアされたネットワーク(FSOINet)を設計する手法を提案する。
実験により、提案したFSOINetは既存の最先端手法よりも、定量的にも定性的にも大きなマージンで優れていることが示された。
論文 参考訳(メタデータ) (2022-04-12T03:30:22Z) - DVMN: Dense Validity Mask Network for Depth Completion [0.0]
スパース深度マップから高密度かつ有効な情報を集めることに焦点を当てたガイド付き畳み込みニューラルネットワークを開発した。
我々は,KITTI深度補完ベンチマークを用いてDense Validity Mask Network (DVMN) を評価し,その結果を報告する。
論文 参考訳(メタデータ) (2021-07-14T13:57:44Z) - LocalTrans: A Multiscale Local Transformer Network for Cross-Resolution
Homography Estimation [52.63874513999119]
クロスレゾリューション画像アライメントは、マルチスケールギガ撮影において重要な問題である。
既存のディープ・ホモグラフィー手法は、それらの間の対応の明示的な定式化を無視し、クロスレゾリューションの課題において精度が低下する。
本稿では,マルチモーダル入力間の対応性を明確に学習するために,マルチスケール構造内に埋め込まれたローカルトランスフォーマーネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-08T02:51:45Z) - PLADE-Net: Towards Pixel-Level Accuracy for Self-Supervised Single-View
Depth Estimation with Neural Positional Encoding and Distilled Matting Loss [49.66736599668501]
PLADE-Netと呼ばれる自己監視型単視点画素レベルの高精度深度推定ネットワークを提案する。
提案手法は,KITTIデータセットの$delta1$測定値の95%を超え,前例のない精度を示す。
論文 参考訳(メタデータ) (2021-03-12T15:54:46Z) - An Empirical Method to Quantify the Peripheral Performance Degradation
in Deep Networks [18.808132632482103]
畳み込みニューラルネットワーク(CNN)カーネルは、各畳み込み層に結合する。
より深いネットワークとストライドベースのダウンサンプリングを組み合わせることで、この領域の伝播は、画像の無視できない部分をカバーすることができる。
我々のデータセットは、高解像度の背景にオブジェクトを挿入することで構築され、画像境界に対してターゲットオブジェクトを特定の位置に配置するサブイメージを収穫することができる。
マスクR-CNNの動作を目標位置の選択にわたって探索することにより、画像境界付近、特に画像コーナーにおいて、パフォーマンス劣化の明確なパターンが明らかになる。
論文 参考訳(メタデータ) (2020-12-04T18:00:47Z) - Adaptive Context-Aware Multi-Modal Network for Depth Completion [107.15344488719322]
我々は,観測された空間コンテキストを捉えるために,グラフ伝搬を採用することを提案する。
次に、注意機構を伝搬に適用し、ネットワークが文脈情報を適応的にモデル化することを奨励する。
最後に、抽出したマルチモーダル特徴を効果的に活用するための対称ゲート融合戦略を導入する。
本稿では,Adaptive Context-Aware Multi-Modal Network (ACMNet) を2つのベンチマークで評価した。
論文 参考訳(メタデータ) (2020-08-25T06:00:06Z) - Probabilistic Pixel-Adaptive Refinement Networks [21.233814875276803]
画像適応型後処理法は,高解像度の入力画像をガイダンスデータとして活用することで有用であることを示す。
我々は,画像誘導データに頼らず,画素ごとの予測の信頼性を尊重する確率的画素適応畳み込み(PPAC)を導入する。
PPACが境界アーチファクトの明確化につながるような,光フローとセマンティックセグメンテーションのための精細化ネットワークにおいて,その実用性を実証する。
論文 参考訳(メタデータ) (2020-03-31T17:53:21Z) - Real-Time High-Performance Semantic Image Segmentation of Urban Street
Scenes [98.65457534223539]
都市景観のロバストなセマンティックセマンティックセグメンテーションのためのリアルタイムDCNNに基づく高速DCNN手法を提案する。
提案手法は, 51.0 fps と 39.3 fps の推論速度で, 平均 73.6% と平均 68.0% (mIoU) の精度を実現する。
論文 参考訳(メタデータ) (2020-03-11T08:45:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。