論文の概要: Domain Adaptation for Real-World Single View 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2108.10972v1
- Date: Tue, 24 Aug 2021 22:02:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 22:24:59.798857
- Title: Domain Adaptation for Real-World Single View 3D Reconstruction
- Title(参考訳): 実世界single view 3dリコンストラクションのためのドメイン適応
- Authors: Brandon Leung, Siddharth Singh, Arik Horodniceanu
- Abstract要約: 教師なしのドメイン適応は、ラベル付き合成ソースドメインからラベルなしの実際のターゲットドメインに知識を転送するために使用することができる。
本稿では,3次元モデルでは対象のドメインデータが教師されないが,クラスラベルでは教師されないという事実を生かして,新しいアーキテクチャを提案する。
その結果はShapeNetをソースドメインとして、Object Domain Suite(ODDS)データセット内のドメインをターゲットとして実行されます。
- 参考スコア(独自算出の注目度): 1.611271868398988
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Deep learning-based object reconstruction algorithms have shown remarkable
improvements over classical methods. However, supervised learning based methods
perform poorly when the training data and the test data have different
distributions. Indeed, most current works perform satisfactorily on the
synthetic ShapeNet dataset, but dramatically fail in when presented with real
world images. To address this issue, unsupervised domain adaptation can be used
transfer knowledge from the labeled synthetic source domain and learn a
classifier for the unlabeled real target domain. To tackle this challenge of
single view 3D reconstruction in the real domain, we experiment with a variety
of domain adaptation techniques inspired by the maximum mean discrepancy (MMD)
loss, Deep CORAL, and the domain adversarial neural network (DANN). From these
findings, we additionally propose a novel architecture which takes advantage of
the fact that in this setting, target domain data is unsupervised with regards
to the 3D model but supervised for class labels. We base our framework off a
recent network called pix2vox. Results are performed with ShapeNet as the
source domain and domains within the Object Dataset Domain Suite (ODDS) dataset
as the target, which is a real world multiview, multidomain image dataset. The
domains in ODDS vary in difficulty, allowing us to assess notions of domain gap
size. Our results are the first in the multiview reconstruction literature
using this dataset.
- Abstract(参考訳): 深層学習に基づくオブジェクト再構成アルゴリズムは、古典的手法よりも著しく改善されている。
しかし、トレーニングデータとテストデータが異なる分布を持つ場合、教師付き学習ベース手法は性能が良くない。
実際、現在のほとんどの研究は、合成されたShapeNetデータセットに満足できるパフォーマンスを保っていますが、実際の画像で提示すると劇的に失敗します。
この問題に対処するために、教師なし領域適応は、ラベル付き合成ソースドメインからの転送知識を使用し、ラベル付き実ターゲットドメインの分類器を学ぶことができる。
実領域におけるsingle view 3dリコンストラクションの課題に取り組むため,我々は,mmd(maximum mean discrepancy)損失,深海サンゴ,およびdann(domain adversarial neural network)に触発された様々なドメイン適応手法を実験した。
これらの結果から,本手法では3dモデルでは対象領域データは教師なしであるが,クラスラベルでは教師なしであるという事実を生かした新しいアーキテクチャを提案する。
pix2voxと呼ばれる最近のネットワークからフレームワークをベースとしています。
結果は、shapenetをソースドメインとして、object dataset domain suite(odds)データセットをターゲットとして、real world multiview、multidomain imageデータセットとして、shapenetで実行される。
ODDSのドメインは困難であり、ドメインギャップサイズの概念を評価することができる。
このデータセットを用いたマルチビュー再構築文献では,この結果が初めてである。
関連論文リスト
- Syn-to-Real Unsupervised Domain Adaptation for Indoor 3D Object Detection [50.448520056844885]
室内3次元物体検出における非教師なし領域適応のための新しいフレームワークを提案する。
合成データセット3D-FRONTから実世界のデータセットScanNetV2とSUN RGB-Dへの適応結果は、ソースオンリーベースラインよりも9.7%、9.1%のmAP25が顕著に改善されていることを示している。
論文 参考訳(メタデータ) (2024-06-17T08:18:41Z) - CMDA: Cross-Modal and Domain Adversarial Adaptation for LiDAR-Based 3D
Object Detection [14.063365469339812]
LiDARベースの3Dオブジェクト検出法は、ソース(またはトレーニング)データ配布の外部のターゲットドメインにうまく一般化しないことが多い。
画像のモダリティから視覚的セマンティックキューを活用する,CMDA (unsupervised domain adaptation) と呼ばれる新しい手法を提案する。
また、自己学習に基づく学習戦略を導入し、モデルが逆向きに訓練され、ドメイン不変の機能を生成する。
論文 参考訳(メタデータ) (2024-03-06T14:12:38Z) - Unsupervised Domain Adaptation for Monocular 3D Object Detection via
Self-Training [57.25828870799331]
我々は、Mono3D上での教師なしドメイン適応のための新しい自己学習フレームワークSTMono3Dを提案する。
対象ドメイン上で適応的な擬似ラベルを生成するための教師学生パラダイムを開発する。
STMono3Dは、評価されたすべてのデータセットで顕著なパフォーマンスを達成し、KITTI 3Dオブジェクト検出データセットの完全な教師付き結果を超えています。
論文 参考訳(メタデータ) (2022-04-25T12:23:07Z) - Unsupervised Domain Adaptive 3D Detection with Multi-Level Consistency [90.71745178767203]
ディープラーニングに基づく3Dオブジェクト検出は、大規模な自律走行データセットの出現によって、前例のない成功を収めた。
既存の3Dドメイン適応検出手法は、しばしばターゲットのドメインアノテーションへの事前アクセスを前提とします。
我々は、ソースドメインアノテーションのみを利用する、より現実的な、教師なしの3Dドメイン適応検出について研究する。
論文 参考訳(メタデータ) (2021-07-23T17:19:23Z) - Inferring Latent Domains for Unsupervised Deep Domain Adaptation [54.963823285456925]
Unsupervised Domain Adaptation (UDA)は、ラベル付きデータが利用できないターゲットドメインでモデルを学習する問題を指す。
本稿では,視覚データセット中の潜在ドメインを自動的に発見することにより,udaの問題に対処する新しい深層アーキテクチャを提案する。
提案手法を公開ベンチマークで評価し,最先端のドメイン適応手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-03-25T14:33:33Z) - Generation for adaption: a Gan-based approach for 3D Domain Adaption
inPoint Cloud [10.614067060304919]
Unsupervised Domain Adapt (UDA)は、ターゲットドメインラベルなしでそのような問題を解決することを目指しています。
本稿では,生成逆ネットワークを用いてソースドメインから合成データを生成する手法を提案する。
実験により,本手法は3つの一般的な3次元オブジェクト/シーンデータセットにおいて,最先端のUDA手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2021-02-15T07:24:10Z) - A Review of Single-Source Deep Unsupervised Visual Domain Adaptation [81.07994783143533]
大規模ラベル付きトレーニングデータセットにより、ディープニューラルネットワークは、幅広いベンチマークビジョンタスクを拡張できるようになった。
多くのアプリケーションにおいて、大量のラベル付きデータを取得するのは非常に高価で時間を要する。
限られたラベル付きトレーニングデータに対処するため、大規模ラベル付きソースドメインでトレーニングされたモデルを、疎ラベルまたは未ラベルのターゲットドメインに直接適用しようと試みている人も多い。
論文 参考訳(メタデータ) (2020-09-01T00:06:50Z) - Deep Domain-Adversarial Image Generation for Domain Generalisation [115.21519842245752]
マシンラーニングモデルは通常、ソースデータセットでトレーニングされたり、異なるディストリビューションのターゲットデータセットで評価されたりする際に、ドメインシフトの問題に悩まされる。
この問題を解決するために、ドメイン一般化(DG)手法は、訓練されたモデルが未知のドメインに一般化できるように、複数のソースドメインからのデータを活用することを目的としている。
我々はemphDeep Domain-Adversarial Image Generation (DDAIG)に基づく新しいDG手法を提案する。
論文 参考訳(メタデータ) (2020-03-12T23:17:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。