論文の概要: ReFit: Recurrent Fitting Network for 3D Human Recovery
- arxiv url: http://arxiv.org/abs/2308.11184v1
- Date: Tue, 22 Aug 2023 04:20:18 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-23 19:18:24.111821
- Title: ReFit: Recurrent Fitting Network for 3D Human Recovery
- Title(参考訳): ReFit: 3Dヒューマンリカバリのためのリカレントフィッティングネットワーク
- Authors: Yufu Wang, Kostas Daniilidis
- Abstract要約: リカレントフィッティング(Recurrent Fitting, ReFit)は, 単画像・パラメトリック3次元再構成のためのニューラルネットワークアーキテクチャである。
ReFitは、最適化を通じて逆問題を解決する戦略を反映したフィードバック更新ループを学習する。
ReFitは逆問題に関する強い知識を符号化するので、以前の回帰モデルよりも訓練が速い。
- 参考スコア(独自算出の注目度): 36.273368767275194
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Recurrent Fitting (ReFit), a neural network architecture for
single-image, parametric 3D human reconstruction. ReFit learns a
feedback-update loop that mirrors the strategy of solving an inverse problem
through optimization. At each iterative step, it reprojects keypoints from the
human model to feature maps to query feedback, and uses a recurrent-based
updater to adjust the model to fit the image better. Because ReFit encodes
strong knowledge of the inverse problem, it is faster to train than previous
regression models. At the same time, ReFit improves state-of-the-art
performance on standard benchmarks. Moreover, ReFit applies to other
optimization settings, such as multi-view fitting and single-view shape
fitting. Project website: https://yufu-wang.github.io/refit_humans/
- Abstract(参考訳): リカレントフィッティング(Recurrent Fitting, ReFit)は, 単画像・パラメトリック3次元再構成のためのニューラルネットワークアーキテクチャである。
ReFitは、最適化を通じて逆問題を解決する戦略を反映したフィードバック更新ループを学習する。
反復的なステップ毎に、人間モデルからキーポイントを再投影して、クエリフィードバックのためのマップを特徴付けし、リカレントベースの更新器を使用して、モデルを調整して画像に適合させる。
ReFitは逆問題に関する強い知識を符号化するので、以前の回帰モデルよりも訓練が速い。
同時に、ReFitは標準ベンチマークの最先端のパフォーマンスを改善している。
さらに、ReFitはマルチビューフィッティングやシングルビュー形状フィッティングといった他の最適化設定にも適用される。
プロジェクトwebサイト: https://yufu-wang.github.io/refit_humans/
関連論文リスト
- Score-Guided Diffusion for 3D Human Recovery [10.562998991986102]
Score-Guided Human Mesh Recovery (ScoreHMR)を提案する。
ScoreHMRはモデルフィッティングアプローチを模倣するが、拡散モデルの潜在空間におけるスコアガイダンスによって画像観察との整合が達成される。
提案手法は, (i) 単フレームモデルフィッティング, (ii) 複数視点からの再構成, (iii) ビデオシーケンスで人間を再構成することである。
論文 参考訳(メタデータ) (2024-03-14T17:56:14Z) - ZeroShape: Regression-based Zero-shot Shape Reconstruction [56.652766763775226]
単一画像ゼロショット3次元形状再構成の問題点について検討する。
最近の研究は、3Dアセットの生成的モデリングを通してゼロショット形状復元を学習している。
我々はZeroShapeが最先端の手法よりも優れた性能を発揮することを示す。
論文 参考訳(メタデータ) (2023-12-21T01:56:34Z) - Splatter Image: Ultra-Fast Single-View 3D Reconstruction [67.96212093828179]
Splatter ImageはGaussian Splattingをベースにしており、複数の画像から3Dシーンを高速かつ高品質に再現することができる。
テスト時に38FPSでフィードフォワードで再構成を行うニューラルネットワークを学習する。
いくつかの総合、実、マルチカテゴリ、大規模ベンチマークデータセットにおいて、トレーニング中にPSNR、LPIPS、その他のメトリクスでより良い結果を得る。
論文 参考訳(メタデータ) (2023-12-20T16:14:58Z) - Improving Prototypical Visual Explanations with Reward Reweighing, Reselection, and Retraining [4.9572582709699144]
ProtoPNetは、入力の有意義な部分に基づいて画像の分類を試みる。
このアーキテクチャは視覚的に解釈可能な分類を生成することができるが、意味論的に意味を持たない画像の部分に基づいて分類することを学ぶことが多い。
Reward Reweighing, Reselecting, and Retraining (R3)後処理フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-08T03:42:54Z) - ImageReward: Learning and Evaluating Human Preferences for Text-to-Image
Generation [30.977582244445742]
ImageRewardは、人間の嗜好報酬モデルである。
そのトレーニングは、評価やランキングを含む、系統的なアノテーションパイプラインに基づいています。
人間の評価では、ImageRewardは既存のスコアリングモデルやメトリクスよりも優れています。
論文 参考訳(メタデータ) (2023-04-12T16:58:13Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - Deep Feedback Inverse Problem Solver [141.26041463617963]
逆問題に対する効率的で効果的で汎用的なアプローチを提案する。
我々は、フォワードプロセスが提供するフィードバック信号を活用し、反復的な更新モデルを学ぶ。
私たちのアプローチは前もってのプロセスに制限がなく、事前の知識も必要ありません。
論文 参考訳(メタデータ) (2021-01-19T16:49:06Z) - Coherent Reconstruction of Multiple Humans from a Single Image [68.3319089392548]
本研究では,1枚の画像から多人数の3Dポーズ推定を行う問題に対処する。
この問題のトップダウン設定における典型的な回帰アプローチは、まずすべての人間を検出し、それぞれを独立して再構築する。
我々のゴールは、これらの問題を回避し、現場のすべての人間のコヒーレントな3D再構成を生成するために学習する単一のネットワークをトレーニングすることである。
論文 参考訳(メタデータ) (2020-06-15T17:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。