論文の概要: RADU: Ray-Aligned Depth Update Convolutions for ToF Data Denoising
- arxiv url: http://arxiv.org/abs/2111.15513v1
- Date: Tue, 30 Nov 2021 15:53:28 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 15:47:31.555799
- Title: RADU: Ray-Aligned Depth Update Convolutions for ToF Data Denoising
- Title(参考訳): radu: tofデータデノイジングのためのレイアライン深度更新畳み込み
- Authors: Michael Schelling, Pedro Hermosilla, Timo Ropinski
- Abstract要約: マルチパス干渉(MPI)による高レベルのノイズ・歪みを受ける飛行時間(ToF)カメラ
本稿では,3次元点の畳み込みにより視点方向に沿った点の位置を補正し,2.5次元データから学習するように設計した,3次元空間で動作する反復的 denoising アプローチを提案する。
本稿では,2つの実世界データセットと大規模合成データセットを含む,複数のデータセット上でSOTA法より優れていることを示す。
- 参考スコア(独自算出の注目度): 8.142947808507369
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Time-of-Flight (ToF) cameras are subject to high levels of noise and
distortions due to Multi-Path-Interference (MPI). While recent research showed
that 2D neural networks are able to outperform previous traditional
State-of-the-Art (SOTA) methods on denoising ToF-Data, little research on
learning-based approaches has been done to make direct use of the 3D
information present in depth images. In this paper, we propose an iterative
denoising approach operating in 3D space, that is designed to learn on 2.5D
data by enabling 3D point convolutions to correct the points' positions along
the view direction. As labeled real world data is scarce for this task, we
further train our network with a self-training approach on unlabeled real world
data to account for real world statistics. We demonstrate that our method is
able to outperform SOTA methods on several datasets, including two real world
datasets and a new large-scale synthetic data set introduced in this paper.
- Abstract(参考訳): ToF(Time-of-Flight)カメラは、MPI(Multi-Path-Interference)によるノイズや歪みのレベルが高い。
近年の研究では、2dニューラルネットワークが従来の最先端(sota)のtofデータをデノボライズする手法よりも優れていることが示されているが、奥行き画像に存在する3d情報を直接利用するための学習に基づくアプローチの研究はほとんど行われていない。
本稿では,3次元点畳み込みによって視点方向に沿った点の位置を補正し,2.5次元データから学習する3次元空間における反復的雑音化手法を提案する。
ラベル付き実世界データはこのタスクで不足しているため、ラベル付き実世界データに対して自己学習アプローチでネットワークをトレーニングし、実世界統計を考慮します。
本稿では,本手法が2つの実世界データセットと新たな大規模合成データセットを含む,複数のデータセット上でのsomaメソッドを上回ることを実証する。
関連論文リスト
- Semi-supervised 3D Semantic Scene Completion with 2D Vision Foundation Model Guidance [11.090775523892074]
我々は、高密度な注釈付きデータへの依存を軽減するために、新しい半教師付きフレームワークを導入する。
提案手法は2次元基礎モデルを用いて3次元シーンの幾何学的・意味的手がかりを生成する。
本手法は,10%のラベル付きデータを用いて全教師付き性能の最大85%を達成する。
論文 参考訳(メタデータ) (2024-08-21T12:13:18Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Ray Denoising: Depth-aware Hard Negative Sampling for Multi-view 3D
Object Detection [46.041193889845474]
レイデノジング(Ray Denoising)は、カメラ線に沿って戦略的にサンプリングすることで検出精度を高める革新的な手法である。
Ray Denoisingはプラグイン・アンド・プレイモジュールとして設計されており、DETR方式のマルチビュー3D検出器と互換性がある。
NuScenesデータセット上の最先端のStreamPETR法よりも平均精度(mAP)が1.9%向上した。
論文 参考訳(メタデータ) (2024-02-06T02:17:44Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Leveraging Neural Radiance Fields for Uncertainty-Aware Visual
Localization [56.95046107046027]
我々は,Neural Radiance Fields (NeRF) を用いてシーン座標回帰のためのトレーニングサンプルを生成することを提案する。
レンダリングにおけるNeRFの効率にもかかわらず、レンダリングされたデータの多くはアーティファクトによって汚染されるか、最小限の情報ゲインしか含まない。
論文 参考訳(メタデータ) (2023-10-10T20:11:13Z) - Learning-based Point Cloud Registration for 6D Object Pose Estimation in
the Real World [55.7340077183072]
我々は、ポイントクラウドデータからオブジェクトの6Dポーズを推定するタスクに取り組む。
この課題に対処する最近の学習ベースのアプローチは、合成データセットにおいて大きな成功を収めている。
これらの障害の原因を分析し、ソースとターゲットポイントの雲の特徴分布の違いに遡る。
論文 参考訳(メタデータ) (2022-03-29T07:55:04Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Exploring Deep 3D Spatial Encodings for Large-Scale 3D Scene
Understanding [19.134536179555102]
生の3次元点雲の空間的特徴を非方向性グラフモデルに符号化することで,CNNに基づくアプローチの限界を克服する代替手法を提案する。
提案手法は、訓練時間とモデル安定性を改善して、最先端の精度で達成し、さらなる研究の可能性を示す。
論文 参考訳(メタデータ) (2020-11-29T12:56:19Z) - Bridging the Reality Gap for Pose Estimation Networks using Sensor-Based
Domain Randomization [1.4290119665435117]
合成データに基づいて訓練された手法は、2Dの領域ランダム化をより発展させるため、2D画像を使用する。
提案手法では,3次元データをネットワークに統合し,ポーズ推定の精度を高める。
3つの大規模ポーズ推定ベンチマーク実験により, 提案手法は, 合成データを用いた従来手法よりも優れていたことがわかった。
論文 参考訳(メタデータ) (2020-11-17T09:12:11Z) - SelfVoxeLO: Self-supervised LiDAR Odometry with Voxel-based Deep Neural
Networks [81.64530401885476]
本稿では,これら2つの課題に対処するために,自己教師型LiDARオドメトリー法(SelfVoxeLO)を提案する。
具体的には、生のLiDARデータを直接処理する3D畳み込みネットワークを提案し、3D幾何パターンをよりよく符号化する特徴を抽出する。
我々は,KITTIとApollo-SouthBayという2つの大規模データセット上での手法の性能を評価する。
論文 参考訳(メタデータ) (2020-10-19T09:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。