論文の概要: Learning to Fit Morphable Models
- arxiv url: http://arxiv.org/abs/2111.14824v1
- Date: Mon, 29 Nov 2021 18:59:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 17:31:46.197161
- Title: Learning to Fit Morphable Models
- Title(参考訳): 適応可能なモデルを学ぶ
- Authors: Vasileios Choutas, Federica Bogo, Jingjing Shen, Julien Valentin
- Abstract要約: 学習最適化の最近の進歩の上に構築し、古典的なレバンス・マルカルトアルゴリズムに触発された更新ルールを提案する。
本稿では,頭部装着装置による3次元体表面推定問題と2次元ランドマークによる顔の嵌合性に対するニューラルネットワークの有効性を示す。
- 参考スコア(独自算出の注目度): 12.469605679847085
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fitting parametric models of human bodies, hands or faces to sparse input
signals in an accurate, robust, and fast manner has the promise of
significantly improving immersion in AR and VR scenarios. A common first step
in systems that tackle these problems is to regress the parameters of the
parametric model directly from the input data. This approach is fast, robust,
and is a good starting point for an iterative minimization algorithm. The
latter searches for the minimum of an energy function, typically composed of a
data term and priors that encode our knowledge about the problem's structure.
While this is undoubtedly a very successful recipe, priors are often hand
defined heuristics and finding the right balance between the different terms to
achieve high quality results is a non-trivial task. Furthermore, converting and
optimizing these systems to run in a performant way requires custom
implementations that demand significant time investments from both engineers
and domain experts. In this work, we build upon recent advances in learned
optimization and propose an update rule inspired by the classic
Levenberg-Marquardt algorithm. We show the effectiveness of the proposed neural
optimizer on the problems of 3D body surface estimation from a head-mounted
device and face fitting from 2D landmarks. Our method can easily be applied to
new model fitting problems and offers a competitive alternative to well tuned
'traditional' model fitting pipelines, both in terms of accuracy and speed.
- Abstract(参考訳): 人体、手、顔のパラメトリックモデルを用いて、正確な、堅牢で高速な方法で入力信号を分離することで、ARおよびVRシナリオにおける没入性を大幅に改善する、という約束がある。
これらの問題に取り組むシステムにおける一般的な第1ステップは、入力データから直接パラメトリックモデルのパラメータを後退させることである。
このアプローチは高速で堅牢であり、反復最小化アルゴリズムにとって良い出発点である。
後者は、典型的にはデータ項と問題の構造に関する我々の知識をエンコードする事前からなるエネルギー関数の最小値を求める。
これは非常に成功したレシピであることは間違いないが、前者は手作業で定義されるヒューリスティックスであり、高品質な結果を達成するために異なる用語間の適切なバランスを見つけることは、簡単ではない。
さらに、これらのシステムをパフォーマンスの高い方法で動作させるには、エンジニアとドメインの専門家の両方にかなりの時間的投資を必要とするカスタム実装が必要です。
本研究では,近年の学習最適化の進歩と,レベンベルク・マーカルトアルゴリズムに触発された更新規則を提案する。
提案したニューラルオプティマイザが頭部装着装置からの3次元体表面推定と2次元ランドマークからの顔の嵌合に及ぼす影響を示す。
本手法は,新しいモデルフィッティング問題に容易に適用でき,精度と速度の両面で,よく調整された「伝統的な」モデルフィッティングパイプラインの代替手段を提供する。
関連論文リスト
- Uncertainty-Aware Testing-Time Optimization for 3D Human Pose Estimation [68.75387874066647]
本研究では3次元ポーズ推定のための不確実性認識テスト時間最適化フレームワークを提案する。
我々のアプローチは、Human3.6Mの4.5%という大きなマージンで、過去最高の結果を上回っている。
論文 参考訳(メタデータ) (2024-02-04T04:28:02Z) - Adaptive Optimization Algorithms for Machine Learning [0.0]
機械学習は、データ駆動の世界において重要な役割を担います。
この論文は、新しい洞察をもたらし、収束保証を改善した新しいアルゴリズムを導入し、人気のある実用的なアルゴリズムの分析を改善する。
論文 参考訳(メタデータ) (2023-11-16T21:22:47Z) - Fairer and More Accurate Tabular Models Through NAS [14.147928131445852]
本稿では,多目的ニューラルアーキテクチャサーチ (NAS) とハイパーパラメータ最適化 (HPO) を,表データの非常に困難な領域への最初の応用として提案する。
我々はNASで精度のみに最適化されたモデルが、本質的に公正な懸念に対処できないことをしばしば示している。
公平性、正確性、あるいは両方において、最先端のバイアス緩和手法を一貫して支配するアーキテクチャを作成します。
論文 参考訳(メタデータ) (2023-10-18T17:56:24Z) - Vanishing Point Estimation in Uncalibrated Images with Prior Gravity
Direction [82.72686460985297]
我々はマンハッタンのフレームを推定する問題に取り組む。
2つの新しい2行解法が導出され、そのうちの1つは既存の解法に影響を与える特異点に悩まされない。
また、局所最適化の性能を高めるために、任意の行で実行される新しい最小でないメソッドを設計する。
論文 参考訳(メタデータ) (2023-08-21T13:03:25Z) - Adaptive Sparse Gaussian Process [0.0]
これらの問題に対処できる最初の適応スパースガウスプロセス(GP)を提案する。
まず,変分スパースGPアルゴリズムを変形係数によって適応的に再構成する。
そこで我々は,新しいサンプルが到着するたびに,スパースGPモデルの単一誘導点と残りのモデルパラメータを同時に更新することを提案する。
論文 参考訳(メタデータ) (2023-02-20T21:34:36Z) - Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - Back to MLP: A Simple Baseline for Human Motion Prediction [59.18776744541904]
本稿では、歴史的に観察されたシーケンスから将来の身体のポーズを予測することによる、人間の動作予測の課題に取り組む。
これらの手法の性能は、0.14Mパラメータしか持たない軽量で純粋にアーキテクチャアーキテクチャによって超えることができることを示す。
Human3.6M, AMASS, 3DPWデータセットの徹底的な評価は, siMLPeをダブした我々の手法が, 他のアプローチよりも一貫して優れていることを示している。
論文 参考訳(メタデータ) (2022-07-04T16:35:58Z) - Accurate, Interpretable, and Fast Animation: AnIterative, Sparse, and
Nonconvex Approach [0.9176056742068814]
フェイスリグは正確でなければならないと同時に、その問題を解決するために高速に計算する必要がある。
各共通アニメーションモデルのパラメータの1つは、スパーシティ正規化である。
複雑性を低減するため、パラダイム・プライマリゼーション・ミニ(MM)が適用される。
論文 参考訳(メタデータ) (2021-09-17T05:42:07Z) - When Liebig's Barrel Meets Facial Landmark Detection: A Practical Model [87.25037167380522]
正確で、堅牢で、効率的で、一般化可能で、エンドツーエンドのトレーニングが可能なモデルを提案する。
精度を向上させるために,2つの軽量モジュールを提案する。
DQInitは、インプットからデコーダのクエリを動的に初期化し、複数のデコーダ層を持つものと同じ精度でモデルを実現する。
QAMemは、共有するクエリではなく、それぞれのクエリに別々のメモリ値を割り当てることで、低解像度のフィーチャーマップ上のクエリの識別能力を高めるように設計されている。
論文 参考訳(メタデータ) (2021-05-27T13:51:42Z) - Human Body Model Fitting by Learned Gradient Descent [48.79414884222403]
画像に3次元の人体形状を適合させる新しいアルゴリズムを提案する。
このアルゴリズムは高速(約120ms収束)で、データセットに頑健であり、公開評価データセットの最先端結果が得られることを示す。
論文 参考訳(メタデータ) (2020-08-19T14:26:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。