論文の概要: Neural Human Pose Prior
- arxiv url: http://arxiv.org/abs/2507.12138v1
- Date: Wed, 16 Jul 2025 11:11:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-17 19:00:11.368692
- Title: Neural Human Pose Prior
- Title(参考訳): ニューラル・ヒューマン・ポース・プリエント
- Authors: Michal Heker, Sefy Kararlitsky, David Tolpin,
- Abstract要約: 本稿では,人体上のポーズを正規化フローを用いてモデル化する,原理的,データ駆動型アプローチを提案する。
トレーニング中のGram-Schmidt過程を反転させることにより,有効な6次元回転多様体上の分布をモデル化することの課題に対処する。
- 参考スコア(独自算出の注目度): 2.048226951354646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a principled, data-driven approach for modeling a neural prior over human body poses using normalizing flows. Unlike heuristic or low-expressivity alternatives, our method leverages RealNVP to learn a flexible density over poses represented in the 6D rotation format. We address the challenge of modeling distributions on the manifold of valid 6D rotations by inverting the Gram-Schmidt process during training, enabling stable learning while preserving downstream compatibility with rotation-based frameworks. Our architecture and training pipeline are framework-agnostic and easily reproducible. We demonstrate the effectiveness of the learned prior through both qualitative and quantitative evaluations, and we analyze its impact via ablation studies. This work provides a sound probabilistic foundation for integrating pose priors into human motion capture and reconstruction pipelines.
- Abstract(参考訳): 本稿では,人体上のポーズを正規化フローを用いてモデル化する,原理的,データ駆動型アプローチを提案する。
ヒューリスティックな代替品や低表現率の代替品とは異なり、本手法はRealNVPを利用して6次元回転形式で表現されるポーズ上のフレキシブルな密度を学習する。
本稿では,学習中のGram-Schmidt過程を反転させることにより,有効な6次元回転多様体上の分布をモデル化することの課題に対処し,ローテーションベースのフレームワークとの下流互換性を維持しながら安定した学習を可能にする。
私たちのアーキテクチャとトレーニングパイプラインはフレームワークに依存しず、容易に再現できます。
本研究は,定性評価と定量的評価の両方を通じて,学習前の学習の有効性を実証し,その影響をアブレーション研究により分析する。
この研究は、ポーズ先行を人間のモーションキャプチャーと再構築パイプラインに統合するための健全な確率的基盤を提供する。
関連論文リスト
- Initial Model Incorporation for Deep Learning FWI: Pretraining or Denormalization? [7.032076746858836]
地下特性ニューラルネットワークによるフルウェーブフォームインバージョン (FWI) が, 効果的な教師なし学習フレームワークとして登場した。
地下モデルを直接微調整する代わりに、トレーニング可能なニューラルネットワークパラメータを更新する。
トレーニングはまず、初期速度モデルに適合させることで、ニューラルネットワークのパラメータを規制する。
正規化の非正規化は、ネットワークの出力を直接事前訓練せずに初期モデルに追加する。
論文 参考訳(メタデータ) (2025-06-05T18:06:37Z) - PreAdaptFWI: Pretrained-Based Adaptive Residual Learning for Full-Waveform Inversion Without Dataset Dependency [8.719356558714246]
フルウェーブフォーム・インバージョン(Full-waveform Inversion、FWI)は、地震データを用いて地下媒体の物理パラメータを反転させる手法である。
異常な性質のため、FWIは局所的なミニマに閉じ込められやすい。
ニューラルネットワークとFWIを組み合わせることで、インバージョンプロセスの安定化が試みられている。
論文 参考訳(メタデータ) (2025-02-17T15:30:17Z) - An Efficient Occupancy World Model via Decoupled Dynamic Flow and Image-assisted Training [50.71892161377806]
DFIT-OccWorldは、分離されたダイナミックフローとイメージアシストトレーニング戦略を活用する、効率的な3D占有世界モデルである。
提案モデルでは, 静止ボクセルはポーズ変換により容易に得られるのに対し, 既存のボクセルフローを用いて既存の観測を歪曲することで, 将来のダイナミックボクセルを予測できる。
論文 参考訳(メタデータ) (2024-12-18T12:10:33Z) - SCorP: Statistics-Informed Dense Correspondence Prediction Directly from Unsegmented Medical Images [5.507868474642766]
SCorPは,非分割画像から直接表面上の対応を予測できる新しいフレームワークである。
提案モデルでは,対応予測タスクの監督を取り除き,トレーニングフェーズと推論フェーズを合理化する。
論文 参考訳(メタデータ) (2024-04-27T17:56:58Z) - Towards Stable Machine Learning Model Retraining via Slowly Varying Sequences [6.067007470552307]
そこで本研究では,リトレーニングを繰り返して安定なモデル列を見つけるためのモデルに依存しないフレームワークを提案する。
最適モデルの復元が保証される混合整数最適化の定式化を開発する。
平均的に、予測力の2%の低下は、安定性の30%の改善につながることが判明した。
論文 参考訳(メタデータ) (2024-03-28T22:45:38Z) - NRDF: Neural Riemannian Distance Fields for Learning Articulated Pose Priors [43.63496073554301]
本稿では、可塑性調音空間をモデル化したデータ駆動型先行処理であるNRDF(Neuralian Distance Fields)を紹介する。
NRDFsを正の例のみにトレーニングするために,測地線距離が所望の分布に従うことを保証する新しいサンプリングアルゴリズムを導入する。
次に、任意のランダムなポーズをアダプティブステップのリーマン多様体によってレベルセットにマッピングする射影アルゴリズムを考案し、合同回転の積多様体に付着する。
我々は、さまざまな下流タスク、すなわち、ポーズ生成、画像に基づくポーズ推定、逆運動学の解法において、NRDFの他のポーズ前処理に対する包括的評価を行う。
論文 参考訳(メタデータ) (2024-03-05T17:07:29Z) - 3D Human Pose Analysis via Diffusion Synthesis [65.268245109828]
PADSは、逆問題フレームワーク内での一般的な3次元ポーズ解析に取り組むための、初めての拡散ベースのフレームワークである。
その性能は異なるベンチマークで検証され、パイプラインの適応性と堅牢性を示している。
論文 参考訳(メタデータ) (2024-01-17T02:59:34Z) - Initialization Matters for Adversarial Transfer Learning [61.89451332757625]
我々は、逆向きに頑健な事前訓練モデルの必要性を発見する。
本稿では, 対向線形探索により得られる重み付き線形ヘッドを初期化する対向微調整のためのロバスト線形初期化法(RoLI)を提案する。
5つの異なる画像分類データセットにおいて,RoLIの有効性を実証し,新しい最先端結果を得た。
論文 参考訳(メタデータ) (2023-12-10T00:51:05Z) - Prior-guided Source-free Domain Adaptation for Human Pose Estimation [24.50953879583841]
2次元人間のポーズ推定のためのドメイン適応法は、典型的にはソースデータへの連続的なアクセスを必要とする。
我々は、人気のある平均教師フレームワークを基盤とした擬似ラベル方式である、事前指導型自己学習(POST)を提案する。
論文 参考訳(メタデータ) (2023-08-26T20:30:04Z) - Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human
Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。
完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。
我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文 参考訳(メタデータ) (2021-11-30T04:10:57Z) - Locally Aware Piecewise Transformation Fields for 3D Human Mesh
Registration [67.69257782645789]
本論文では,3次元変換ベクトルを学習し,提案空間内の任意のクエリ点をリザーブ空間内の対応する位置にマップする部分変換場を提案する。
パラメトリックモデルにネットワークのポーズを合わせることで、特に極端なポーズにおいて、より優れた登録品質が得られることを示す。
論文 参考訳(メタデータ) (2021-04-16T15:16:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。