論文の概要: SharinGAN: Combining Synthetic and Real Data for Unsupervised Geometry
Estimation
- arxiv url: http://arxiv.org/abs/2006.04026v1
- Date: Sun, 7 Jun 2020 02:45:33 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 08:14:29.818043
- Title: SharinGAN: Combining Synthetic and Real Data for Unsupervised Geometry
Estimation
- Title(参考訳): sharingan: 合成データと実データを組み合わせた教師なし幾何推定
- Authors: Koutilya PNVR, Hao Zhou, David Jacobs
- Abstract要約: 本稿では,学習ネットワークにおける合成画像と実画像を組み合わせる新しい手法を提案する。
両画像の型を1つの共有ドメインにマッピングする方法を提案する。
本実験は,2つの重要な領域における最先端技術に対する顕著な改善を実証した。
- 参考スコア(独自算出の注目度): 18.29202999419042
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose a novel method for combining synthetic and real images when
training networks to determine geometric information from a single image. We
suggest a method for mapping both image types into a single, shared domain.
This is connected to a primary network for end-to-end training. Ideally, this
results in images from two domains that present shared information to the
primary network. Our experiments demonstrate significant improvements over the
state-of-the-art in two important domains, surface normal estimation of human
faces and monocular depth estimation for outdoor scenes, both in an
unsupervised setting.
- Abstract(参考訳): 本稿では,1つの画像から幾何情報を決定するためのトレーニングネットワークにおいて,合成画像と実画像を組み合わせる新しい手法を提案する。
両画像の型を1つの共有ドメインにマッピングする方法を提案する。
これはエンドツーエンドトレーニングのためのプライマリネットワークに接続されている。
理想的には、2つのドメインのイメージがプライマリネットワークに共有情報を提供する。
実験では,人間の顔表面の正常推定と屋外シーンの単眼深度推定という2つの重要な領域において,教師なし環境での最先端技術に対して有意な改善が示された。
関連論文リスト
- Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Self-Supervised Image Representation Learning with Geometric Set
Consistency [50.12720780102395]
本稿では,3次元幾何整合性に基づく自己教師付き画像表現学習法を提案する。
具体的には、画像ビュー内の特徴整合性を強化するために、コントラスト学習フレームワークに3次元幾何学的整合性を導入する。
論文 参考訳(メタデータ) (2022-03-29T08:57:33Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Self-Supervised Learning of Domain Invariant Features for Depth
Estimation [35.74969527929284]
単一画像深度推定のための教師なし合成-現実的領域適応の課題に対処する。
単一画像深度推定の重要なビルディングブロックはエンコーダ・デコーダ・タスク・ネットワークであり、RGB画像を入力とし、出力として深度マップを生成する。
本稿では,タスクネットワークにドメイン不変表現を自己教師型で学習させる新たなトレーニング戦略を提案する。
論文 参考訳(メタデータ) (2021-06-04T16:45:48Z) - ShaRF: Shape-conditioned Radiance Fields from a Single View [54.39347002226309]
本稿では,単一の画像のみのオブジェクトの神経シーン表現を推定する手法を提案する。
この手法の核心は,対象物の幾何学的足場の推定である。
合成画像と実画像の両方において,提案手法の有効性を示す実験を行った。
論文 参考訳(メタデータ) (2021-02-17T16:40:28Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - From Real to Synthetic and Back: Synthesizing Training Data for
Multi-Person Scene Understanding [0.7519872646378835]
特定のシナリオで対話する複数の人物の自然に見える画像を合成する手法を提案する。
これらの画像は、合成データの利点の恩恵を受けている。
合成領域と実領域のギャップを低減するため,以下のステップからなるパイプラインを導入する。
論文 参考訳(メタデータ) (2020-06-03T09:02:06Z) - Two-shot Spatially-varying BRDF and Shape Estimation [89.29020624201708]
形状とSVBRDFを段階的に推定した新しいディープラーニングアーキテクチャを提案する。
ドメインランダム化された幾何学と現実的な材料を用いた大規模合成学習データセットを作成する。
合成データセットと実世界のデータセットの両方の実験により、合成データセットでトレーニングされたネットワークが、実世界の画像に対してうまく一般化できることが示されている。
論文 参考訳(メタデータ) (2020-04-01T12:56:13Z) - Introducing Pose Consistency and Warp-Alignment for Self-Supervised 6D
Object Pose Estimation in Color Images [38.9238085806793]
オブジェクトの6Dポーズを推定する最も成功したアプローチは、現実世界の画像で注釈付きのポーズで学習を監督することによって、ニューラルネットワークを訓練する。
既存のニューラルネットワークベースのアプローチの上に適用可能な2段階の6Dオブジェクトポーズ推定フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-27T11:53:38Z) - An End-to-End Network for Co-Saliency Detection in One Single Image [47.35448093528382]
単一の画像内の共分散検出は、まだ十分に対処されていない一般的な視覚問題である。
本研究では、バックボーンネットと2つの分岐ネットからなる新しいエンドツーエンドのトレーニングネットワークを提案する。
本研究では,2,019個の自然画像のデータセットを各画像に共分散して構築し,提案手法の評価を行う。
論文 参考訳(メタデータ) (2019-10-25T16:00:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。