論文の概要: Style-transfer GANs for bridging the domain gap in synthetic pose
estimator training
- arxiv url: http://arxiv.org/abs/2004.13681v2
- Date: Wed, 16 Dec 2020 19:06:13 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-08 23:26:37.303950
- Title: Style-transfer GANs for bridging the domain gap in synthetic pose
estimator training
- Title(参考訳): 合成ポーズ推定器トレーニングにおけるドメインギャップのブリッジングのためのスタイルトランスファーGAN
- Authors: Pavel Rojtberg, Thomas P\"ollabauer and Arjan Kuijper
- Abstract要約: 画素レベルの画像変換に汎用的なGANモデルを採用することを提案する。
得られたモデルは、トレーニング中または推論時に、ドメインギャップをブリッジするために使用される。
ドメインランダム化の程度で訓練されたモデルと比較すると,モデルの性能は大幅に向上した。
- 参考スコア(独自算出の注目度): 8.508403388002133
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Given the dependency of current CNN architectures on a large training set,
the possibility of using synthetic data is alluring as it allows generating a
virtually infinite amount of labeled training data. However, producing such
data is a non-trivial task as current CNN architectures are sensitive to the
domain gap between real and synthetic data. We propose to adopt general-purpose
GAN models for pixel-level image translation, allowing to formulate the domain
gap itself as a learning problem. The obtained models are then used either
during training or inference to bridge the domain gap. Here, we focus on
training the single-stage YOLO6D object pose estimator on synthetic CAD
geometry only, where not even approximate surface information is available.
When employing paired GAN models, we use an edge-based intermediate domain and
introduce different mappings to represent the unknown surface properties. Our
evaluation shows a considerable improvement in model performance when compared
to a model trained with the same degree of domain randomization, while
requiring only very little additional effort.
- Abstract(参考訳): 既存のCNNアーキテクチャが大規模なトレーニングセットに依存していることを考えると、事実上無限のラベル付きトレーニングデータを生成することができるため、合成データを使用する可能性は一定である。
しかし、現在のcnnアーキテクチャは実データと合成データの間のドメイン間ギャップに敏感であるため、このようなデータの生成は非自明な作業である。
本稿では,ピクセルレベルの画像変換に汎用ganモデルを適用し,ドメインギャップ自体を学習問題として定式化することを提案する。
得られたモデルは、トレーニング中または推論時に、ドメインギャップをブリッジするために使用される。
そこで本研究では, 合成cad形状のみに対して, 単段のyolo6d物体ポーズ推定器を訓練することに焦点を当て, 近似表面情報も得られない。
ペアGANモデルを用いる場合、エッジベースの中間領域を使用し、未知の表面特性を表現するために異なるマッピングを導入する。
ドメインランダム化の度合いが同じであるモデルと比較すると,モデルの性能は大幅に向上するが,追加の労力はほとんど必要としない。
関連論文リスト
- xTED: Cross-Domain Adaptation via Diffusion-Based Trajectory Editing [21.37585797507323]
ドメイン間政策伝達手法は主に、ポリシー学習を容易にするために、ドメインの対応や修正を学習することを目的としている。
本稿では,クロスドメイントラジェクトリ適応のために特別に設計された拡散モデルを用いたクロスドメイントラジェクトリ・EDitingフレームワークを提案する。
提案するモデルアーキテクチャは,対象データ内の動的パターンだけでなく,状態,行動,報酬間の複雑な依存関係を効果的にキャプチャする。
論文 参考訳(メタデータ) (2024-09-13T10:07:28Z) - Source-Free and Image-Only Unsupervised Domain Adaptation for Category
Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。
対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。
本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文 参考訳(メタデータ) (2024-01-19T17:48:05Z) - Compositional Semantic Mix for Domain Adaptation in Point Cloud
Segmentation [65.78246406460305]
合成意味混合は、ポイントクラウドセグメンテーションのための最初の教師なし領域適応技術である。
本稿では、ソースドメイン(例えば合成)からの点雲とターゲットドメイン(例えば実世界)からの点雲を同時に処理できる2分岐対称ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-08-28T14:43:36Z) - Domain-Adaptive Full-Face Gaze Estimation via Novel-View-Synthesis and Feature Disentanglement [12.857137513211866]
本稿では、教師なしドメイン適応のためのトレーニングデータ合成と視線推定モデルからなる効果的なモデルトレーニングパイプラインを提案する。
提案したデータ合成は、単一画像の3D再構成を利用して、3次元の顔形状データセットを必要とせずに、ソース領域から頭部ポーズの範囲を広げる。
本稿では、視線関連特徴を分離し、背景アグリゲーション整合性損失を導入し、合成音源領域の特性を生かしたディエンタングリングオートエンコーダネットワークを提案する。
論文 参考訳(メタデータ) (2023-05-25T15:15:03Z) - Robust Category-Level 3D Pose Estimation from Synthetic Data [17.247607850702558]
CADモデルから生成されたオブジェクトポーズ推定のための新しい合成データセットであるSyntheticP3Dを紹介する。
逆レンダリングによるポーズ推定を行うニューラルネットワークモデルをトレーニングするための新しいアプローチ(CC3D)を提案する。
論文 参考訳(メタデータ) (2023-05-25T14:56:03Z) - HaDR: Applying Domain Randomization for Generating Synthetic Multimodal
Dataset for Hand Instance Segmentation in Cluttered Industrial Environments [0.0]
本研究では、ドメインランダム化を用いて、マルチモーダルインスタンスセグメンテーションモデルのトレーニングのための合成RGB-Dデータセットを生成する。
提案手法により,既存の最先端データセットでトレーニングしたモデルよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-04-12T13:02:08Z) - SALUDA: Surface-based Automotive Lidar Unsupervised Domain Adaptation [62.889835139583965]
我々は、ソースデータとターゲットデータに基づいて、暗黙の基盤となる表面表現を同時に学習する教師なし補助タスクを導入する。
両方のドメインが同じ遅延表現を共有しているため、モデルは2つのデータソース間の不一致を許容せざるを得ない。
実験の結果,本手法は実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-実-
論文 参考訳(メタデータ) (2023-04-06T17:36:23Z) - Improving Domain Generalization with Domain Relations [77.63345406973097]
本稿では、モデルがトレーニングされたドメインと異なる新しいドメインに適用されたときに発生するドメインシフトに焦点を当てる。
ドメイン固有モデルを学習するためのD$3$Gという新しい手法を提案する。
以上の結果から,D$3$Gは最先端の手法より一貫して優れていた。
論文 参考訳(メタデータ) (2023-02-06T08:11:16Z) - One-Shot Domain Adaptive and Generalizable Semantic Segmentation with
Class-Aware Cross-Domain Transformers [96.51828911883456]
セマンティックセグメンテーションのための教師なしのsim-to-realドメイン適応(UDA)は、シミュレーションデータに基づいて訓練されたモデルの実世界のテスト性能を改善することを目的としている。
従来のUDAは、適応のためのトレーニング中に利用可能なラベルのない実世界のサンプルが豊富にあると仮定することが多い。
実世界のデータサンプルが1つしか利用できない,一発の教師なしシム・トゥ・リアル・ドメイン適応(OSUDA)と一般化問題について検討する。
論文 参考訳(メタデータ) (2022-12-14T15:54:15Z) - Adapting the Mean Teacher for keypoint-based lung registration under
geometric domain shifts [75.51482952586773]
ディープニューラルネットワークは一般的に、ラベル付きトレーニングデータが多く必要であり、トレーニングデータとテストデータの間のドメインシフトに弱い。
本稿では,ラベル付きソースからラベル付きターゲットドメインへのモデルの適用により,画像登録のための幾何学的領域適応手法を提案する。
本手法は,ベースラインモデルの精度を目標データに適合させながら,ベースラインモデルの50%/47%を継続的に改善する。
論文 参考訳(メタデータ) (2022-07-01T12:16:42Z) - FedILC: Weighted Geometric Mean and Invariant Gradient Covariance for
Federated Learning on Non-IID Data [69.0785021613868]
フェデレートラーニング(Federated Learning)とは、ローカルに計算されたパラメータの更新を、空間的に分散されたクライアントサイロからトレーニングデータに集約することで、共有サーバモデルによる学習を可能にする分散機械学習アプローチである。
本研究では, 勾配の共分散とヘッセンの幾何学的平均を利用して, シロ間およびシロ内成分の両方を捕捉するフェデレート不変学習一貫性(FedILC)アプローチを提案する。
これは医療、コンピュータビジョン、IoT(Internet of Things)といった様々な分野に関係している。
論文 参考訳(メタデータ) (2022-05-19T03:32:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。