論文の概要: Pose Adaptive Dual Mixup for Few-Shot Single-View 3D Reconstruction
- arxiv url: http://arxiv.org/abs/2112.12484v1
- Date: Thu, 23 Dec 2021 12:22:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-24 16:40:19.857382
- Title: Pose Adaptive Dual Mixup for Few-Shot Single-View 3D Reconstruction
- Title(参考訳): ポーズ適応型デュアルミックスアップによる単眼3次元再構成
- Authors: Ta-Ying Cheng, Hsuan-Ru Yang, Niki Trigoni, Hwann-Tzong Chen, Tyng-Luh
Liu
- Abstract要約: 単像3D再構成のためのポーズ適応型数ショット学習法と2段階データ正規化法を提案する。
PADMixは、ShapeNetデータセットよりも数ショット設定で過去の文献を著しく上回り、より困難な現実世界のPix3Dデータセットで新しいベンチマークを設定している。
- 参考スコア(独自算出の注目度): 35.30827580375749
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a pose adaptive few-shot learning procedure and a two-stage data
interpolation regularization, termed Pose Adaptive Dual Mixup (PADMix), for
single-image 3D reconstruction. While augmentations via interpolating
feature-label pairs are effective in classification tasks, they fall short in
shape predictions potentially due to inconsistencies between interpolated
products of two images and volumes when rendering viewpoints are unknown.
PADMix targets this issue with two sets of mixup procedures performed
sequentially. We first perform an input mixup which, combined with a pose
adaptive learning procedure, is helpful in learning 2D feature extraction and
pose adaptive latent encoding. The stagewise training allows us to build upon
the pose invariant representations to perform a follow-up latent mixup under
one-to-one correspondences between features and ground-truth volumes. PADMix
significantly outperforms previous literature on few-shot settings over the
ShapeNet dataset and sets new benchmarks on the more challenging real-world
Pix3D dataset.
- Abstract(参考訳): 本稿では,単眼3次元再構成のためのポーズ適応型2段階データ補間正規化法として,ポーズ適応型2重混合法(padmix)を提案する。
特徴ラベル対補間による補間は分類タスクにおいて有効であるが、レンダリング視点が不明な場合、2つの画像の補間生成物とボリュームとの矛盾による形状予測が不足する可能性がある。
PADMixはこの問題を、2セットの混合手順で順次実行する。
まず,ポーズ適応学習手順と組み合わせた入力ミックスアップを行い,2次元特徴抽出とポーズ適応潜在符号化の学習に有用である。
段階的にトレーニングすることで、ポーズ不変表現を構築でき、特徴量と基底ボリュームの間の1対1の対応の下で後続の潜伏混合を実行できます。
PADMixは、ShapeNetデータセットよりも数ショット設定で過去の文献を著しく上回り、より困難な現実世界のPix3Dデータセットで新しいベンチマークを設定している。
関連論文リスト
- BIFRÖST: 3D-Aware Image compositing with Language Instructions [27.484947109237964]
Bifr"ostは、命令ベースの画像合成を実行するために拡散モデルに基づいて構築された、新しい3D対応フレームワークである。
Bifr"ostは、MLLMを2.5D位置予測器として訓練し、デプスマップを生成プロセス中に余分な条件として統合することで問題に対処する。
論文 参考訳(メタデータ) (2024-10-24T18:35:12Z) - Adaptive Mix for Semi-Supervised Medical Image Segmentation [22.69909762038458]
本稿では,画像混合のための適応混合アルゴリズム(AdaMix)を提案する。
AdaMix-ST, AdaMix-MT, AdaMix-CTの3つのフレームワークを半教師付き医用画像分割用として開発した。
論文 参考訳(メタデータ) (2024-07-31T13:19:39Z) - Towards Human-Level 3D Relative Pose Estimation: Generalizable, Training-Free, with Single Reference [62.99706119370521]
人間は、単一のクエリ参照イメージペアのみを与えられたラベル/トレーニングなしで、目に見えないオブジェクトの相対的なポーズを容易に推論することができる。
そこで,本研究では,RGB-D参照から2.5D形状のRGB-D参照,オフザシェルフ微分可能なRGB-D参照,DINOv2のような事前学習モデルからのセマンティックキューを用いた3D一般化可能な相対ポーズ推定手法を提案する。
論文 参考訳(メタデータ) (2024-06-26T16:01:10Z) - MM-Mixing: Multi-Modal Mixing Alignment for 3D Understanding [64.65145700121442]
MM-Mixingは3次元理解のためのマルチモーダルミキシングアライメントフレームワークである。
提案する2段階学習パイプラインは,特徴レベルと入力レベルを混合して3Dエンコーダを最適化する。
MM-Mixingは,様々な学習シナリオにおけるベースライン性能を大幅に向上させることを示した。
論文 参考訳(メタデータ) (2024-05-28T18:44:15Z) - MRC-Net: 6-DoF Pose Estimation with MultiScale Residual Correlation [8.840744039764092]
本稿では,1枚のRGB画像から3次元コンピュータ支援デザイン(CAD)モデルを用いてオブジェクトの6-DoFポーズを決定するための単発アプローチを提案する。
まず、ポーズ分類を行い、3Dオブジェクトを分類されたポーズに描画する。
第2段階は、クラス内のきめ細かい残留ポーズを予測するために回帰を実行する。
論文 参考訳(メタデータ) (2024-03-12T18:36:59Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - (Fusionformer):Exploiting the Joint Motion Synergy with Fusion Network
Based On Transformer for 3D Human Pose Estimation [1.52292571922932]
多くの従来手法では、局所的な関節情報の理解が欠けていた。
提案手法では,グローバル・テンポラル・セルフ・トラジェクトリ・モジュールとクロス・テンポラル・セルフ・トラジェクトリ・モジュールを導入する。
その結果、Human3.6Mデータセットでは2.4%のMPJPEと4.3%のP-MPJPEが改善された。
論文 参考訳(メタデータ) (2022-10-08T12:22:10Z) - Uncertainty-Aware Adaptation for Self-Supervised 3D Human Pose
Estimation [70.32536356351706]
本稿では、2つの出力ヘッドを2つの異なる構成にサブスクライブする共通のディープネットワークバックボーンを構成するMPP-Netを紹介する。
ポーズと関節のレベルで予測の不確実性を定量化するための適切な尺度を導出する。
本稿では,提案手法の総合評価を行い,ベンチマークデータセット上での最先端性能を示す。
論文 参考訳(メタデータ) (2022-03-29T07:14:58Z) - MixSTE: Seq2seq Mixed Spatio-Temporal Encoder for 3D Human Pose
Estimation in Video [75.23812405203778]
近年, 学習時間相関のため, 全フレームのボディジョイントを世界規模で考慮し, 2次元キーポイントシーケンスから3次元人間のポーズを推定する手法が提案されている。
本研究では,各関節の時間的動きを別々にモデル化する時間的変圧器ブロックと,関節間空間相関を有する変圧器ブロックを有するミキシングミキシングを提案する。
さらに、ネットワーク出力は、中央フレームから入力ビデオの全フレームに拡張され、入力と出力のベンチマーク間のコヒーレンスが改善される。
論文 参考訳(メタデータ) (2022-03-02T04:20:59Z) - Out-of-Domain Human Mesh Reconstruction via Dynamic Bilevel Online
Adaptation [87.85851771425325]
我々は、人間のメッシュ再構成モデルをドメイン外ストリーミングビデオに適用する際の新しい問題を考える。
オンライン適応によってこの問題に対処し、テスト中のモデルのバイアスを徐々に修正します。
動的バイレベルオンライン適応アルゴリズム(DynaBOA)を提案する。
論文 参考訳(メタデータ) (2021-11-07T07:23:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。