論文の概要: Aligning Silhouette Topology for Self-Adaptive 3D Human Pose Recovery
- arxiv url: http://arxiv.org/abs/2204.01276v1
- Date: Mon, 4 Apr 2022 06:58:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-05 13:07:20.711627
- Title: Aligning Silhouette Topology for Self-Adaptive 3D Human Pose Recovery
- Title(参考訳): 自己適応型3次元姿勢復元のためのシルエットトポロジーの調整
- Authors: Mugalodi Rakesh, Jogendra Nath Kundu, Varun Jampani, R. Venkatesh Babu
- Abstract要約: アーティキュレーション中心の2D/3Dポーズ監視は、既存の多くの人間のポーズ推定技術においてコアトレーニング目標を形成する。
本稿では,ソース学習モデルベース回帰器を適応させるために,シルエット監視のみに依存する新しいフレームワークを提案する。
我々は、トポロジカル・スケルトン表現を生シルエットから切り離すために、一連の畳み込みに優しい空間変換を開発する。
- 参考スコア(独自算出の注目度): 70.66865453410958
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Articulation-centric 2D/3D pose supervision forms the core training objective
in most existing 3D human pose estimation techniques. Except for synthetic
source environments, acquiring such rich supervision for each real target
domain at deployment is highly inconvenient. However, we realize that standard
foreground silhouette estimation techniques (on static camera feeds) remain
unaffected by domain-shifts. Motivated by this, we propose a novel target
adaptation framework that relies only on silhouette supervision to adapt a
source-trained model-based regressor. However, in the absence of any auxiliary
cue (multi-view, depth, or 2D pose), an isolated silhouette loss fails to
provide a reliable pose-specific gradient and requires to be employed in tandem
with a topology-centric loss. To this end, we develop a series of
convolution-friendly spatial transformations in order to disentangle a
topological-skeleton representation from the raw silhouette. Such a design
paves the way to devise a Chamfer-inspired spatial topological-alignment loss
via distance field computation, while effectively avoiding any gradient
hindering spatial-to-pointset mapping. Experimental results demonstrate our
superiority against prior-arts in self-adapting a source trained model to
diverse unlabeled target domains, such as a) in-the-wild datasets, b)
low-resolution image domains, and c) adversarially perturbed image domains (via
UAP).
- Abstract(参考訳): アーティキュレーション中心の2D/3Dポーズ監視は、既存の多くの人間のポーズ推定技術においてコアトレーニング目標を形成する。
合成ソース環境を除くと、デプロイ時に実際のターゲットドメインごとにそのようなリッチな監督を取得することは、非常に不便である。
しかし,地上の標準シルエット推定技術(静止カメラフィード)はドメインシフトの影響を受けないままである。
そこで本研究では,ソース学習モデルベース回帰器を適応させるために,シルエット監視のみに依存する新たなターゲット適応フレームワークを提案する。
しかしながら、補助的なキュー(マルチビュー、ディープ、または2Dポーズ)がなければ、孤立したシルエットの損失は、信頼できるポーズ特異的な勾配を与えず、トポロジー中心の損失を伴うタンデムで使用される必要がある。
この目的のために, トポロジカルスケルトン表現を生シルエットから切り離すために, 一連の畳み込み型空間変換を開発する。
このような設計は、空間-点間マッピングを妨げる勾配を効果的に回避しつつ、チャムファーにインスパイアされた距離場計算による空間的配向損失を考案する道を開く。
実験結果から,自己適応型ソーストレーニングモデルにおける先行技術に対する優位性を示す。
a) the-the-wild データセット
b)低解像度画像領域、及び
c) (UAPを介して)逆向きに摂動した画像領域
関連論文リスト
- GEOcc: Geometrically Enhanced 3D Occupancy Network with Implicit-Explicit Depth Fusion and Contextual Self-Supervision [49.839374549646884]
本稿では,視覚のみのサラウンドビュー知覚に適したジオメトリ強化OccupancyネットワークであるGEOccについて述べる。
提案手法は,Occ3D-nuScenesデータセット上で,画像解像度が最小で,画像バックボーンが最大である状態-Of-The-Art性能を実現する。
論文 参考訳(メタデータ) (2024-05-17T07:31:20Z) - Source-Free and Image-Only Unsupervised Domain Adaptation for Category
Level Object Pose Estimation [18.011044932979143]
3DUDAは、3Dや深度データを使わずに、ニュアンスドライデンのターゲットドメインに適応できる手法である。
対象のカテゴリを単純な立方体メッシュとして表現し、ニューラル特徴活性化の生成モデルを利用する。
本手法は,グローバルな擬似ラベル付きデータセットの微調整を軽度な仮定でシミュレートする。
論文 参考訳(メタデータ) (2024-01-19T17:48:05Z) - Towards Hard-pose Virtual Try-on via 3D-aware Global Correspondence
Learning [70.75369367311897]
3D対応のグローバルな対応は、グローバルな意味的相関、局所的な変形、および3D人体の幾何学的先行を共同でエンコードする信頼性のあるフローである。
対向ジェネレータは、3D認識フローによって歪んだ衣服と、対象者の画像とを入力として、フォトリアリスティックな試着結果を合成する。
論文 参考訳(メタデータ) (2022-11-25T12:16:21Z) - Non-Local Latent Relation Distillation for Self-Adaptive 3D Human Pose
Estimation [63.199549837604444]
3次元ポーズ推定アプローチは、強い(2D/3Dポーズ)または弱い(複数ビューまたは深さ)ペアによる監督の異なる形態を利用する。
我々は3Dポーズ学習を,ラベル付きソースドメインから完全に損なわれないターゲットへのタスク知識の転送を目的とした,自己指導型適応問題として捉えた。
我々は、異なる自己適応設定を評価し、標準ベンチマークで最先端の3Dポーズ推定性能を示す。
論文 参考訳(メタデータ) (2022-04-05T03:52:57Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - Kinematic-Structure-Preserved Representation for Unsupervised 3D Human
Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。
本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。
提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文 参考訳(メタデータ) (2020-06-24T23:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。