論文の概要: ViewNet: Unsupervised Viewpoint Estimation from Conditional Generation
- arxiv url: http://arxiv.org/abs/2212.00435v1
- Date: Thu, 1 Dec 2022 11:16:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 16:12:08.815653
- Title: ViewNet: Unsupervised Viewpoint Estimation from Conditional Generation
- Title(参考訳): ViewNet:条件生成からの教師なし視点推定
- Authors: Octave Mariotti, Oisin Mac Aodha and Hakan Bilen
- Abstract要約: 我々はこれを自己教師付き学習タスクとして定式化し、画像再構成はカメラの視点を予測するのに必要な監督を提供する。
本研究では、視点空間変換器を用いることで、効率的な視点学習が可能であり、既存の教師なしの合成データに対するアプローチよりも優れていることを示す。
- 参考スコア(独自算出の注目度): 35.89557494372891
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Understanding the 3D world without supervision is currently a major challenge
in computer vision as the annotations required to supervise deep networks for
tasks in this domain are expensive to obtain on a large scale. In this paper,
we address the problem of unsupervised viewpoint estimation. We formulate this
as a self-supervised learning task, where image reconstruction provides the
supervision needed to predict the camera viewpoint. Specifically, we make use
of pairs of images of the same object at training time, from unknown
viewpoints, to self-supervise training by combining the viewpoint information
from one image with the appearance information from the other. We demonstrate
that using a perspective spatial transformer allows efficient viewpoint
learning, outperforming existing unsupervised approaches on synthetic data, and
obtains competitive results on the challenging PASCAL3D+ dataset.
- Abstract(参考訳): この領域のタスクのディープネットワークを監督するために必要なアノテーションは、大規模に入手するのに費用がかかるため、コンピュータビジョンにおける3D世界を理解することは、現在大きな課題である。
本稿では,教師なし視点推定の問題に対処する。
これを自己監督学習タスクとして定式化し,画像再構成によりカメラ視点の予測に必要な監督を行う。
具体的には、一方の画像からの視点情報と他方からの外観情報とを組み合わせることにより、未知の視点から自己監督訓練まで、訓練時間における同一物体のペア画像を利用する。
我々は,パースペクティブ空間トランスフォーマを用いて効率的な視点学習を可能にし,既存の教師なし手法を合成データで上回り,挑戦的なpascal3d+データセット上での競合結果を得ることを実証する。
関連論文リスト
- PEEKABOO: Hiding parts of an image for unsupervised object localization [7.161489957025654]
教師なしの方法でオブジェクトをローカライズすることは、重要な視覚情報がないために大きな課題となる。
教師なしオブジェクトローカライゼーションのための単段階学習フレームワークPEEKABOOを提案する。
キーとなるアイデアは、画像の一部を選択的に隠し、残りの画像情報を活用して、明示的な監督なしにオブジェクトの位置を推測することである。
論文 参考訳(メタデータ) (2024-07-24T20:35:20Z) - Mask as Supervision: Leveraging Unified Mask Information for Unsupervised 3D Pose Estimation [26.630702699374194]
マスクを教師なし3次元ポーズ推定の監督として活用する統合フレームワークを提案する。
我々は、アノテーションのないデータの処理を可能にする、完全に教師なしの方法で人間の骨格を整理する。
実験により,Human3.6MとMPI-INF-3DHPデータセットを用いた現状のポーズ推定性能を示す。
論文 参考訳(メタデータ) (2023-12-12T08:08:34Z) - Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。
ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。
我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文 参考訳(メタデータ) (2021-04-09T02:58:59Z) - From Image Collections to Point Clouds with Self-supervised Shape and
Pose Networks [53.71440550507745]
2次元画像から3Dモデルを再構成することは、コンピュータビジョンの基本的な問題の一つである。
本研究では,1枚の画像から3次元オブジェクトを再構成する深層学習手法を提案する。
我々は,3次元点雲の再構成と推定ネットワークの自己教師方式の両方を学習する。
論文 参考訳(メタデータ) (2020-05-05T04:25:16Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z) - DeepCap: Monocular Human Performance Capture Using Weak Supervision [106.50649929342576]
そこで本研究では,単分子密集型人間のパフォーマンスキャプチャのための新しい深層学習手法を提案する。
本手法は,多視点監視に基づく弱教師付き方式で訓練されている。
我々のアプローチは、品質と堅牢性の観点から、芸術の状態を上回ります。
論文 参考訳(メタデータ) (2020-03-18T16:39:56Z) - Weakly-Supervised 3D Human Pose Learning via Multi-view Images in the
Wild [101.70320427145388]
本稿では、3Dアノテーションを必要としない弱教師付きアプローチを提案し、ラベルのないマルチビューデータから3Dポーズを推定する。
提案手法を2つの大規模データセット上で評価する。
論文 参考訳(メタデータ) (2020-03-17T08:47:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。