論文の概要: On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks
- arxiv url: http://arxiv.org/abs/2303.14840v1
- Date: Sun, 26 Mar 2023 22:32:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 17:25:22.969498
- Title: On the Importance of Accurate Geometry Data for Dense 3D Vision Tasks
- Title(参考訳): 深度3次元視覚課題における精密幾何データの重要性について
- Authors: HyunJun Jung, Patrick Ruhkamp, Guangyao Zhai, Nikolas Brasch, Yitong
Li, Yannick Verdie, Jifei Song, Yiren Zhou, Anil Armagan, Slobodan Ilic, Ales
Leonardis, Nassir Navab, Benjamin Busam
- Abstract要約: 不正確または破損したデータのトレーニングは、モデルバイアスとハマーズ一般化能力を誘導する。
本稿では,深度推定と再構成における高密度3次元視覚課題に対するセンサ誤差の影響について検討する。
- 参考スコア(独自算出の注目度): 61.74608497496841
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Learning-based methods to solve dense 3D vision problems typically train on
3D sensor data. The respectively used principle of measuring distances provides
advantages and drawbacks. These are typically not compared nor discussed in the
literature due to a lack of multi-modal datasets. Texture-less regions are
problematic for structure from motion and stereo, reflective material poses
issues for active sensing, and distances for translucent objects are intricate
to measure with existing hardware. Training on inaccurate or corrupt data
induces model bias and hampers generalisation capabilities. These effects
remain unnoticed if the sensor measurement is considered as ground truth during
the evaluation. This paper investigates the effect of sensor errors for the
dense 3D vision tasks of depth estimation and reconstruction. We rigorously
show the significant impact of sensor characteristics on the learned
predictions and notice generalisation issues arising from various technologies
in everyday household environments. For evaluation, we introduce a carefully
designed dataset\footnote{dataset available at
https://github.com/Junggy/HAMMER-dataset} comprising measurements from
commodity sensors, namely D-ToF, I-ToF, passive/active stereo, and monocular
RGB+P. Our study quantifies the considerable sensor noise impact and paves the
way to improved dense vision estimates and targeted data fusion.
- Abstract(参考訳): 密集した3D視覚問題を解決する学習ベースの手法は、通常3Dセンサーのデータに基づいて訓練される。
それぞれの測定距離の原理は、利点と欠点をもたらす。
これらは典型的には、マルチモーダルデータセットが欠如しているため、文献では比較も議論もされない。
テクスチャレス領域は、動きやステレオからの構造に問題があり、反射材料はアクティブセンシングに問題を引き起こし、透明な物体の距離は既存のハードウェアで測定するために複雑である。
不正確または破損したデータのトレーニングは、モデルバイアスとハッパー一般化能力を誘導する。
これらの影響は、評価中にセンサ測定が基礎的真理と見なされる場合、注目されない。
本稿では,深度推定と再構成の密集した3次元視覚課題に対するセンサ誤差の影響について検討する。
センサ特性が学習予測に及ぼす影響を厳密に示し,日常生活環境における各種技術から生じる一般化問題に注目する。
評価のために、D-ToF、I-ToF、パッシブ/アクティブステレオ、モノクラーRGB+Pといったコモディティセンサーからの測定値を含む、https://github.com/Junggy/HAMMER-dataset}で利用可能なデータセットを慎重に設計した。
本研究は、センサノイズの影響を定量化し、高密度視力推定とターゲットデータ融合を改善する方法について検討する。
関連論文リスト
- CatFree3D: Category-agnostic 3D Object Detection with Diffusion [63.75470913278591]
本稿では,2次元検出と深度予測から3次元検出を分離するパイプラインを提案する。
また,3次元検出結果の正確な評価のために,正規化ハンガリー距離(NHD)指標も導入した。
論文 参考訳(メタデータ) (2024-08-22T22:05:57Z) - PruNeRF: Segment-Centric Dataset Pruning via 3D Spatial Consistency [33.68948881727943]
PruNeRFは3次元空間整合性によるセグメント中心のデータセットプルーニングフレームワークである。
ベンチマークデータセットを用いた実験により、PruNeRFは邪魔者に対するロバスト性において、最先端の手法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2024-06-02T16:49:05Z) - SimMining-3D: Altitude-Aware 3D Object Detection in Complex Mining
Environments: A Novel Dataset and ROS-Based Automatic Annotation Pipeline [0.9790236766474201]
鉱業環境における3次元物体検出に特化して設計された合成データセットSimMining 3Dを提案する。
このデータセットは、鉱山のベンチ内のさまざまな高さに位置する物体やセンサーを捉え、正確な採掘シナリオを正確に反映している。
本研究では,センサ対オブジェクトの高さ変化と点雲密度を考慮した評価指標を提案し,正確なモデル評価を可能にする。
論文 参考訳(メタデータ) (2023-12-11T04:33:45Z) - Towards a Robust Sensor Fusion Step for 3D Object Detection on Corrupted
Data [4.3012765978447565]
この研究は、データの破損に対処し、3Dオブジェクト検出のためのセンサ融合をより堅牢にする新しい融合ステップを示す。
提案手法は,通常のデータに対する最先端手法と同等に動作し,不整合データに対して性能を向上することを示す。
論文 参考訳(メタデータ) (2023-06-12T18:06:29Z) - AGO-Net: Association-Guided 3D Point Cloud Object Detection Network [86.10213302724085]
ドメイン適応によるオブジェクトの無傷な特徴を関連付ける新しい3D検出フレームワークを提案する。
我々は,KITTIの3D検出ベンチマークにおいて,精度と速度の両面で最新の性能を実現する。
論文 参考訳(メタデータ) (2022-08-24T16:54:38Z) - Is my Depth Ground-Truth Good Enough? HAMMER -- Highly Accurate
Multi-Modal Dataset for DEnse 3D Scene Regression [34.95597838973912]
HAMMERは屋内深度推定のための複数の一般的なセンサーからの深度推定を含むデータセットである。
我々は3次元スキャナーとアライメントレンダリングの助けを借りて、信頼性の高い地上真理深度マップを構築した。
一般的な深度推定器は、このデータと典型的な深度センサに基づいて訓練されている。
論文 参考訳(メタデータ) (2022-05-09T21:25:09Z) - Probabilistic and Geometric Depth: Detecting Objects in Perspective [78.00922683083776]
3次元物体検出は、運転支援システムなどの様々な実用用途で必要とされる重要な機能である。
双眼視やLiDARに頼っている従来の設定に比べて、経済的な解決策として単眼3D検出が注目されているが、それでも満足のいく結果が得られていない。
本稿ではまず,この問題に関する系統的研究を行い,現在の単分子3次元検出問題をインスタンス深度推定問題として単純化できることを考察する。
論文 参考訳(メタデータ) (2021-07-29T16:30:33Z) - 3D Object Detection for Autonomous Driving: A Survey [14.772968858398043]
3次元物体検出は、そのような知覚システムの中核となる基礎となる。
既存の努力にもかかわらず、ポイントクラウド上の3Dオブジェクト検出はまだ初期段階にある。
近年, プロスとコンスを用いた最先端検出法が提案されている。
論文 参考訳(メタデータ) (2021-06-21T03:17:20Z) - Delving into Localization Errors for Monocular 3D Object Detection [85.77319416168362]
単眼画像から3Dバウンディングボックスを推定することは、自動運転に不可欠な要素です。
本研究では, 各サブタスクがもたらす影響を定量化し, 局所化誤差を求めることが, モノクロ3次元検出の抑制に欠かせない要因である。
論文 参考訳(メタデータ) (2021-03-30T10:38:01Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。