論文の概要: 3D human pose estimation with adaptive receptive fields and dilated
temporal convolutions
- arxiv url: http://arxiv.org/abs/2005.13797v1
- Date: Thu, 28 May 2020 06:25:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-27 04:44:48.374405
- Title: 3D human pose estimation with adaptive receptive fields and dilated
temporal convolutions
- Title(参考訳): 適応受容場と拡張時間畳み込みを用いた3次元ポーズ推定
- Authors: Michael Shin, Eduardo Castillo, Irene Font Peradejordi, Shobhna
Jayaraman
- Abstract要約: ポーズ推定モデルにおいて,適応的受容場(adaptive receptive field)を導入する。
受容場を小さくすることで、我々のモデルは通常の速度で走るベンチマークモデルよりも23%速くスローモーションシーケンス(10倍長くなる)を処理できる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: In this work, we demonstrate that receptive fields in 3D pose estimation can
be effectively specified using optical flow. We introduce adaptive receptive
fields, a simple and effective method to aid receptive field selection in pose
estimation models based on optical flow inference. We contrast the performance
of a benchmark state-of-the-art model running on fixed receptive fields with
their adaptive field counterparts. By using a reduced receptive field, our
model can process slow-motion sequences (10x longer) 23% faster than the
benchmark model running at regular speed. The reduction in computational cost
is achieved while producing a pose prediction accuracy to within 0.36% of the
benchmark model.
- Abstract(参考訳): 本研究では,3次元ポーズ推定における受容場を光流を用いて効果的に特定できることを実証する。
我々は,光学的フロー推論に基づくポーズ推定モデルにおいて,適応的受容場(adaptive receptive field)を導入する。
固定受容場上で動作させるベンチマーク・オブ・ザ・アーティファクト・モデルと適応場の性能を対比する。
受容場を小さくすることで、我々のモデルは通常の速度で走るベンチマークモデルよりも23%速くスローモーションシーケンス(10倍長くなる)を処理できる。
ポーズ予測精度をベンチマークモデルの0.36%以内に生成しながら、計算コストの削減を実現する。
関連論文リスト
- 3D Equivariant Pose Regression via Direct Wigner-D Harmonics Prediction [50.07071392673984]
既存の方法は、角度や四元数を用いて空間領域でパラメータ化された3次元回転を学習する。
本稿では,3次元回転回帰のためのWigner-D係数を直接予測する周波数領域アプローチを提案する。
提案手法は, ModelNet10-SO(3) や PASCAL3D+ などのベンチマーク上での最先端結果を実現する。
論文 参考訳(メタデータ) (2024-11-01T12:50:38Z) - Fast constrained sampling in pre-trained diffusion models [77.21486516041391]
拡散モデルは、大規模な生成画像モデルの分野を支配してきた。
本研究では,大規模な事前学習拡散モデルにおける高速拘束サンプリングのアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - TEMPO: Efficient Multi-View Pose Estimation, Tracking, and Forecasting [27.3359362364858]
本稿では,頑健な時間的表現を学習する効率的な多視点ポーズ推定モデルを提案する。
我々のモデルは微調整なしでデータセットをまたいで一般化することができる。
論文 参考訳(メタデータ) (2023-09-14T17:56:30Z) - Post-Processing Temporal Action Detection [134.26292288193298]
時間的行動検出(TAD)法は、通常、入力された可変長のビデオを固定長のスニペット表現シーケンスに変換する際に、前処理のステップを踏む。
この前処理ステップは、ビデオを時間的にダウンサンプリングし、推論の解像度を低減し、元の時間分解における検出性能を阻害する。
モデルの再設計や再学習を伴わない新しいモデル非依存のポストプロセッシング手法を提案する。
論文 参考訳(メタデータ) (2022-11-27T19:50:37Z) - Distribution-Aware Single-Stage Models for Multi-Person 3D Pose
Estimation [29.430404703883084]
本稿では,多人数の3Dポーズ推定問題に対処する新しいDASモデルを提案する。
提案するDASモデルでは,3次元カメラ空間における人物位置と人体関節をワンパスで同時に位置決めする。
CMU Panoptic と MuPoTS-3D のベンチマークに関する総合的な実験は、提案したDASモデルの優れた効率を実証している。
論文 参考訳(メタデータ) (2022-03-15T07:30:27Z) - Camera Distortion-aware 3D Human Pose Estimation in Video with
Optimization-based Meta-Learning [23.200130129530653]
歪みのないデータセットでトレーニングされた既存の3次元ポーズ推定アルゴリズムは、特定のカメラ歪みのある新しいシナリオに適用した場合、パフォーマンス低下を被る。
本研究では, 歪み環境に迅速に適応できる簡易かつ効果的な3次元ポーズ推定モデルを提案する。
論文 参考訳(メタデータ) (2021-11-30T01:35:04Z) - Dynamic Iterative Refinement for Efficient 3D Hand Pose Estimation [87.54604263202941]
本稿では,従来の推定値の修正に部分的レイヤを反復的に活用する,小さなディープニューラルネットワークを提案する。
学習したゲーティング基準を用いて、ウェイトシェアリングループから抜け出すかどうかを判断し、モデルにサンプルごとの適応を可能にする。
提案手法は,広く使用されているベンチマークの精度と効率の両面から,最先端の2D/3Dハンドポーズ推定手法より一貫して優れている。
論文 参考訳(メタデータ) (2021-11-11T23:31:34Z) - FasterPose: A Faster Simple Baseline for Human Pose Estimation [65.8413964785972]
本稿では,高速ポーズ推定のためのLR表現を用いた費用対効果ネットワークの設計パラダイムであるFasterPoseを提案する。
我々は,FasterPoseのトレーニング挙動について検討し,収束を加速する新しい回帰クロスエントロピー(RCE)損失関数を定式化する。
従来のポーズ推定ネットワークと比較すると,FLOPの58%が減少し,精度が1.3%向上した。
論文 参考訳(メタデータ) (2021-07-07T13:39:08Z) - Data-Driven Shadowgraph Simulation of a 3D Object [50.591267188664666]
我々は、数値コードをより安価でプロジェクションベースのサロゲートモデルに置き換えている。
このモデルは、数値的な方法で必要となるすべての前の電場を計算することなく、所定の時間で電場を近似することができる。
このモデルでは, シミュレーションパラメータの狭い範囲におけるデータの摂動問題において, 高品質な再構成が示されており, 大規模な入力データに利用することができる。
論文 参考訳(メタデータ) (2021-06-01T08:46:04Z) - Revitalizing Optimization for 3D Human Pose and Shape Estimation: A
Sparse Constrained Formulation [21.710205047008916]
そこで我々は,新しいスパース制約型定式化を提案し,そこから3次元人間のポーズと形状推定のリアルタイム最適化手法を導出した。
この計算は、複雑な3次元人体モデルの関節の数と線形にスケールすることを示し、より密集した非拘束的な定式化のために立方的にスケールする以前の作業とは対照的である。
本研究では,30FPS以上の1枚の画像から3次元の人間のポーズと形状を推定するリアルタイムモーションキャプチャフレームワークを提案する。
論文 参考訳(メタデータ) (2021-05-28T16:44:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。