論文の概要: Learning with Noisy Ground Truth: From 2D Classification to 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2406.15982v1
- Date: Sun, 23 Jun 2024 02:21:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 19:33:31.758697
- Title: Learning with Noisy Ground Truth: From 2D Classification to 3D Reconstruction
- Title(参考訳): 雑音場真実による学習:2次元分類から3次元再構成へ
- Authors: Yangdi Lu, Wenbo He,
- Abstract要約: 本稿では,LNGT LNGTの分析を機械学習タスクの文脈で統一する形式的定義を提案する。
我々は,暗記効果の詳細な分析と今後の研究機会に関する洞察に富んだ議論を行う。
- 参考スコア(独自算出の注目度): 13.314778587751588
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks has been highly successful in data-intense computer vision applications, while such success relies heavily on the massive and clean data. In real-world scenarios, clean data sometimes is difficult to obtain. For example, in image classification and segmentation tasks, precise annotations of millions samples are generally very expensive and time-consuming. In 3D static scene reconstruction task, most NeRF related methods require the foundational assumption of the static scene (e.g. consistent lighting condition and persistent object positions), which is often violated in real-world scenarios. To address these problem, learning with noisy ground truth (LNGT) has emerged as an effective learning method and shows great potential. In this short survey, we propose a formal definition unify the analysis of LNGT LNGT in the context of different machine learning tasks (classification and regression). Based on this definition, we propose a novel taxonomy to classify the existing work according to the error decomposition with the fundamental definition of machine learning. Further, we provide in-depth analysis on memorization effect and insightful discussion about potential future research opportunities from 2D classification to 3D reconstruction, in the hope of providing guidance to follow-up research.
- Abstract(参考訳): ディープニューラルネットワークは、大規模でクリーンなデータに大きく依存する一方で、データインテリジェンスコンピュータビジョンアプリケーションで成功している。
現実のシナリオでは、クリーンなデータを得るのは難しいことがあります。
例えば、画像分類やセグメンテーションタスクでは、数百万のサンプルの正確なアノテーションは非常に高価で時間を要する。
静的シーン再構築タスクでは、ほとんどのNeRF関連手法は静的シーン(例えば、一貫した照明条件と永続的な物体位置)の基本的な仮定を必要とする。
これらの問題に対処するため、雑音の多い基底真理(LNGT)による学習が効果的な学習方法として登場し、大きな可能性を秘めている。
本稿では,LNGT LNGTの分析を異なる機械学習タスク(分類と回帰)の文脈で統一する形式的定義を提案する。
本定義に基づいて,機械学習の基本的定義と誤り分解に基づいて既存の作業を分類する新たな分類法を提案する。
さらに,2次元分類から3次元再構成に至るまでの今後の研究機会について,記憶効果の詳細な分析と洞察に富んだ考察を行い,今後の研究の指導を期待する。
関連論文リスト
- Self-supervised cross-modality learning for uncertainty-aware object detection and recognition in applications which lack pre-labelled training data [6.892494758401737]
我々は、不確実性を認識したディープニューラルネットワークが2次元RGB画像中の物体を検出し、認識し、ローカライズするためにどのように訓練されるかを示す。
本手法は,ラベル付きデータセットが一般に利用できない,多くの重要な産業タスクに適用可能である。
論文 参考訳(メタデータ) (2024-11-05T13:26:31Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with
Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。
冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。
既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文 参考訳(メタデータ) (2023-12-28T14:52:07Z) - Recovering 3D Human Mesh from Monocular Images: A Survey [49.00136388529404]
単眼画像から人間のポーズと形状を推定することは、コンピュータビジョンにおける長年の問題である。
本調査は, 単分子型3次元メッシュ回収の課題に焦点を当てた。
論文 参考訳(メタデータ) (2022-03-03T18:56:08Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - Unsupervised Learning of 3D Object Categories from Videos in the Wild [75.09720013151247]
オブジェクトインスタンスの大規模なコレクションの複数のビューからモデルを学ぶことに重点を置いています。
再構成を大幅に改善するワープコンディショニングレイ埋め込み(WCR)と呼ばれる新しいニューラルネットワーク設計を提案する。
本評価は,既存のベンチマークを用いた複数の深部単眼再構成ベースラインに対する性能改善を示す。
論文 参考訳(メタデータ) (2021-03-30T17:57:01Z) - Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。
最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。
しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。
本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文 参考訳(メタデータ) (2021-01-18T03:24:48Z) - 3D_DEN: Open-ended 3D Object Recognition using Dynamically Expandable
Networks [0.0]
本研究では,新しい3Dオブジェクトカテゴリをオープンエンドで学習できるロボットを実現するために,動的アーキテクチャに基づく新しい深層移動学習手法を提案する。
実験結果から,提案手法は精度に優れ,計算オーバーヘッドを大幅に最小化できることがわかった。
論文 参考訳(メタデータ) (2020-09-15T16:44:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。