論文の概要: DLow: Diversifying Latent Flows for Diverse Human Motion Prediction
- arxiv url: http://arxiv.org/abs/2003.08386v2
- Date: Wed, 22 Jul 2020 17:53:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 09:59:03.247793
- Title: DLow: Diversifying Latent Flows for Diverse Human Motion Prediction
- Title(参考訳): DLow: 多様な人間の動作予測のための潜水流の多様化
- Authors: Ye Yuan, Kris Kitani
- Abstract要約: 本研究では,事前学習した深部生成モデルから多種多様なサンプル群を生成するために,新しいサンプリング手法であるDLow(Diversifying Latent Flows)を提案する。
トレーニング中、DLowはサンプルの多様性を改善するために潜伏マッピングを最適化する目的として、サンプルよりも多様性を優先する。
実験の結果,DLowはサンプルの多様性と精度で最先端のベースライン法より優れていることがわかった。
- 参考スコア(独自算出の注目度): 32.22704734791378
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep generative models are often used for human motion prediction as they are
able to model multi-modal data distributions and characterize diverse human
behavior. While much care has been taken into designing and learning deep
generative models, how to efficiently produce diverse samples from a deep
generative model after it has been trained is still an under-explored problem.
To obtain samples from a pretrained generative model, most existing generative
human motion prediction methods draw a set of independent Gaussian latent codes
and convert them to motion samples. Clearly, this random sampling strategy is
not guaranteed to produce diverse samples for two reasons: (1) The independent
sampling cannot force the samples to be diverse; (2) The sampling is based
solely on likelihood which may only produce samples that correspond to the
major modes of the data distribution. To address these problems, we propose a
novel sampling method, Diversifying Latent Flows (DLow), to produce a diverse
set of samples from a pretrained deep generative model. Unlike random
(independent) sampling, the proposed DLow sampling method samples a single
random variable and then maps it with a set of learnable mapping functions to a
set of correlated latent codes. The correlated latent codes are then decoded
into a set of correlated samples. During training, DLow uses a
diversity-promoting prior over samples as an objective to optimize the latent
mappings to improve sample diversity. The design of the prior is highly
flexible and can be customized to generate diverse motions with common features
(e.g., similar leg motion but diverse upper-body motion). Our experiments
demonstrate that DLow outperforms state-of-the-art baseline methods in terms of
sample diversity and accuracy. Our code is released on the project page:
https://www.ye-yuan.com/dlow.
- Abstract(参考訳): 深部生成モデルは、複数のモーダルデータ分布をモデル化し、多様な人間の振る舞いを特徴付けることができるため、人間の運動予測によく用いられる。
深層生成モデルの設計と学習に多くの注意が払われているが、訓練後の深層生成モデルから効率的に多様なサンプルを生成する方法はまだ未検討の問題である。
事前訓練された生成モデルからサンプルを得るため、既存の生成的人間の動作予測手法は独立したガウス潜伏符号の集合を描画し、それらを運動サンプルに変換する。
このランダムサンプリング戦略は,(1)独立サンプリングでは標本の多様性を強制できない,(2)データ分布の主要なモードに対応するサンプルのみを生成できる可能性にのみ基づく,2つの理由から,多様なサンプルを生成することが保証されていない。
このような問題に対処するため,本研究では,事前学習した深部生成モデルから多種多様なサンプルを作成するために,新たなサンプリング手法であるDLowを提案する。
ランダム(独立)サンプリングとは異なり、提案するdlowサンプリング法は単一のランダム変数をサンプリングし、学習可能なマッピング関数のセットを関連付けた潜在コードのセットにマップする。
相関潜時符号はその後、相関サンプルの集合に復号される。
トレーニング中、DLowはサンプルの多様性を改善するために潜伏マッピングを最適化する目的として、サンプルよりも多様性を優先する。
前部の設計は非常に柔軟で、共通の特徴を持つ多様な動き(脚の動きは似ているが、上半身の動きは様々)を生成するようにカスタマイズできる。
実験の結果,DLowはサンプルの多様性と精度で最先端のベースライン法より優れていることがわかった。
私たちのコードはプロジェクトページでリリースされています。
関連論文リスト
- DOTA: Distributional Test-Time Adaptation of Vision-Language Models [52.98590762456236]
トレーニングフリーテスト時動的アダプタ(TDA)は、この問題に対処するための有望なアプローチである。
単体テスト時間適応法(Dota)の簡易かつ効果的な方法を提案する。
Dotaは継続的にテストサンプルの分布を推定し、モデルがデプロイメント環境に継続的に適応できるようにします。
論文 参考訳(メタデータ) (2024-09-28T15:03:28Z) - Controlling the Fidelity and Diversity of Deep Generative Models via Pseudo Density [70.14884528360199]
本稿では, GAN や拡散モデルなどのバイアス深層生成モデルへのアプローチを導入し, 忠実度の向上や多様性の向上を図ったデータ生成手法を提案する。
提案手法では, 擬似密度という, 個人サンプルの新たな測定基準を用いて, トレーニングとデータ生成の分布を操作する。
論文 参考訳(メタデータ) (2024-07-11T16:46:04Z) - REAL Sampling: Boosting Factuality and Diversity of Open-Ended Generation via Asymptotic Entropy [93.8400683020273]
大規模言語モデル(LLM)の復号法は通常、事実性の確保と多様性の維持のトレードオフに苦慮する。
核サンプリングにおける事実性および多様性を向上させる復号法であるREALサンプリングを提案する。
論文 参考訳(メタデータ) (2024-06-11T21:44:49Z) - Touring sampling with pushforward maps [3.5897534810405403]
本稿では、生成モデル設定における多くのサンプリングアプローチをレビューし、整理するために理論的スタンスをとる。
拡散モデルを用いたサンプリングにおける現在の課題のいくつかを克服するのに役立つかもしれない。
論文 参考訳(メタデータ) (2023-11-23T08:23:43Z) - Particle Guidance: non-I.I.D. Diverse Sampling with Diffusion Models [41.192240810280424]
本稿では, 粒子間時間進化ポテンシャルが多様性を強制する拡散型生成サンプリングの拡張である粒子誘導法を提案する。
我々は,粒子誘導が生み出す結合分布,最適多様性を達成するポテンシャルの学習方法,および他の分野の手法との関係を理論的に分析する。
論文 参考訳(メタデータ) (2023-10-19T19:01:00Z) - StyleGenes: Discrete and Efficient Latent Distributions for GANs [149.0290830305808]
GAN(Generative Adversarial Networks)のための離散潜在分布を提案する。
連続的な先行点から潜在ベクトルを描く代わりに、学習可能な潜在点の有限集合からサンプリングする。
私たちは生物の情報のエンコーディングからインスピレーションを得ます。
論文 参考訳(メタデータ) (2023-04-30T23:28:46Z) - Unite and Conquer: Plug & Play Multi-Modal Synthesis using Diffusion
Models [54.1843419649895]
拡散確率モデル(DDPM)に基づく解を提案する。
他の生成モデルよりも拡散モデルを選択する動機は、拡散モデルの柔軟な内部構造に由来する。
提案手法は,複数のサブタスクで訓練された複数の拡散モデルを統一し,組み合わせたタスクを克服する。
論文 参考訳(メタデータ) (2022-12-01T18:59:55Z) - Diverse Human Motion Prediction via Gumbel-Softmax Sampling from an
Auxiliary Space [34.83587750498361]
多様な人間の動き予測は、観測されたポーズのシーケンスから、複数の将来のポーズシーケンスを予測することを目的としている。
従来のアプローチでは、通常、データの条件分布をモデル化するために深い生成ネットワークを使用し、その後、分布からランダムにサンプル結果を得る。
不均衡なマルチモーダル分布から非常に多様な結果をサンプリングするための新しいサンプリング手法を提案する。
論文 参考訳(メタデータ) (2022-07-15T09:03:57Z) - Selectively increasing the diversity of GAN-generated samples [8.980453507536017]
本稿では,GAN生成サンプルの多様性を選択的に向上する手法を提案する。
本研究では,CERN における ALICE 実験のZero Degree Calorimeter から得られたデータをシミュレーションする実生活シナリオとともに,本手法の優位性を示す。
論文 参考訳(メタデータ) (2022-07-04T16:27:06Z) - Sampling from Arbitrary Functions via PSD Models [55.41644538483948]
まず確率分布をモデル化し,そのモデルからサンプリングする。
これらのモデルでは, 少数の評価値を用いて, 高精度に多数の密度を近似することが可能であることが示され, それらのモデルから効果的にサンプルする簡単なアルゴリズムが提示される。
論文 参考訳(メタデータ) (2021-10-20T12:25:22Z) - Relaxed-Responsibility Hierarchical Discrete VAEs [3.976291254896486]
textitRelaxed-Responsibility Vector-Quantisationを導入する。
我々は、様々な標準データセットに対して、最先端のビット/ディミット結果を得る。
論文 参考訳(メタデータ) (2020-07-14T19:10:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。