論文の概要: Controlling Character Motions without Observable Driving Source
- arxiv url: http://arxiv.org/abs/2308.06025v1
- Date: Fri, 11 Aug 2023 09:07:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-14 14:35:31.853000
- Title: Controlling Character Motions without Observable Driving Source
- Title(参考訳): 観測可能な駆動源のないキャラクタ動作制御
- Authors: Weiyuan Li, Bin Dai, Ziyi Zhou, Qi Yao and Baoyuan Wang
- Abstract要約: 本稿では,VQ-VAEのメリットを取り入れた体系的枠組みと,強化学習で訓練された新しいトークンレベル制御ポリシを提案する。
我々は現在、駆動源に重点を置いていないが、明示的な駆動源を用いた制御合成のために、我々のフレームワークを一般化することができる。
- 参考スコア(独自算出の注目度): 13.009351573418478
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: How to generate diverse, life-like, and unlimited long head/body sequences
without any driving source? We argue that this under-investigated research
problem is non-trivial at all, and has unique technical challenges behind it.
Without semantic constraints from the driving sources, using the standard
autoregressive model to generate infinitely long sequences would easily result
in 1) out-of-distribution (OOD) issue due to the accumulated error, 2)
insufficient diversity to produce natural and life-like motion sequences and 3)
undesired periodic patterns along the time. To tackle the above challenges, we
propose a systematic framework that marries the benefits of VQ-VAE and a novel
token-level control policy trained with reinforcement learning using carefully
designed reward functions. A high-level prior model can be easily injected on
top to generate unlimited long and diverse sequences. Although we focus on no
driving sources now, our framework can be generalized for controlled synthesis
with explicit driving sources. Through comprehensive evaluations, we conclude
that our proposed framework can address all the above-mentioned challenges and
outperform other strong baselines very significantly.
- Abstract(参考訳): ドライブソースなしで、多種多様で、ライフライクで、無制限なロングヘッド/ボディシーケンスを生成するには?
この未調査の研究課題は、まったく自明なものではありませんし、その背後には独特の技術的課題があります。
駆動源からのセマンティック制約がなければ、無限に長いシーケンスを生成するのに標準自己回帰モデルを使うのは容易である。
1) 累積誤差によるアウト・オブ・ディストリビューション(OOD)問題
2)自然界や生活界のような運動系列を生成できない多様性
3) 好ましくない周期パターンが出現した。
上記の課題に対処するため、VQ-VAEの利点と、慎重に設計された報酬関数を用いて強化学習で訓練された新しいトークンレベル制御ポリシーをマージする体系的な枠組みを提案する。
高レベルの先行モデルは、上から簡単に注入でき、無制限に長く多様なシーケンスを生成することができる。
現時点では駆動源に注目していないが、明示的な駆動源を持つ制御合成のためのフレームワークを一般化することができる。
包括的評価を通じて,提案フレームワークは上記の課題をすべて解決し,他の強固なベースラインを大幅に上回ることができると結論づけた。
関連論文リスト
- ReST meets ReAct: Self-Improvement for Multi-Step Reasoning LLM Agent [50.508669199496474]
外部知識に基づいて推論と行動を行うReAct-style LLMエージェントを開発した。
エージェントをReSTライクな手法で改良し,従来の軌道上で反復的に訓練する。
引き起こされた大きなモデルから始まり、アルゴリズムのたった2イテレーションの後に、微調整された小さなモデルを生成することができる。
論文 参考訳(メタデータ) (2023-12-15T18:20:15Z) - Bayesian Conditional Diffusion Models for Versatile Spatiotemporal
Turbulence Generation [13.278744447861289]
本稿では,乱流発生の確率的拡散モデルに基づく新しい生成フレームワークを提案する。
提案手法の特長は, 自己回帰に基づく条件抽出に基づく長寿命流れ列生成法である。
数値解析実験により, フレームワークの多目的乱流発生能力を実証した。
論文 参考訳(メタデータ) (2023-11-14T04:08:14Z) - Sequential Dexterity: Chaining Dexterous Policies for Long-Horizon
Manipulation [28.37417344133933]
本稿では、長期タスク目標を達成するための複数の厳密なポリシーをチェーンする汎用システムであるSequential Dexterityを提案する。
システムの中核は、連鎖の成功率を高めるためのサブ政治を段階的に微調整する移行実現機能である。
本システムでは,新規な物体形状への一般化能力を実証し,デキスタラスハンドを備えた実世界ロボットへのゼロショット移動を可能にする。
論文 参考訳(メタデータ) (2023-09-02T16:55:48Z) - Self-Supervised Reinforcement Learning that Transfers using Random
Features [41.00256493388967]
本研究では,タスク間の行動の伝達を,報酬の異なる自己指導型強化学習手法を提案する。
我々の手法は、報奨ラベルなしでオフラインデータセットでトレーニングできるが、新しいタスクに素早くデプロイできるという自己教師型である。
論文 参考訳(メタデータ) (2023-05-26T20:37:06Z) - Energy Regularized RNNs for Solving Non-Stationary Bandit Problems [97.72614340294547]
我々は、ニューラルネットワークが特定の行動を支持するのに自信過剰になるのを防ぐエネルギー用語を提案する。
提案手法は,ロッティングバンドのサブプロブレムを解く方法と同じくらい有効であることを示す。
論文 参考訳(メタデータ) (2023-03-12T03:32:43Z) - Toward Certified Robustness Against Real-World Distribution Shifts [65.66374339500025]
我々は、データから摂動を学ぶために生成モデルを訓練し、学習したモデルの出力に関して仕様を定義する。
この設定から生じるユニークな挑戦は、既存の検証者がシグモイドの活性化を厳密に近似できないことである。
本稿では,古典的な反例誘導的抽象的洗練の概念を活用するシグモイドアクティベーションを扱うための一般的なメタアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-06-08T04:09:13Z) - Principled Knowledge Extrapolation with GANs [92.62635018136476]
我々は,知識外挿の新たな視点から,対実合成を研究する。
本稿では, 知識外挿問題に対処するために, クローズド形式判別器を用いた対角ゲームが利用可能であることを示す。
提案手法は,多くのシナリオにおいて,エレガントな理論的保証と優れた性能の両方を享受する。
論文 参考訳(メタデータ) (2022-05-21T08:39:42Z) - On Kernelized Multi-Armed Bandits with Constraints [16.102401271318012]
一般に未知の報酬関数と一般未知の制約関数を併用した帯域幅問題について検討する。
本稿では,アルゴリズムの性能解析のための一般的なフレームワークを提案する。
本稿では,数値実験により提案アルゴリズムの優れた性能を示す。
論文 参考訳(メタデータ) (2022-03-29T14:02:03Z) - Reinforcement Learning as One Big Sequence Modeling Problem [84.84564880157149]
強化学習(Reinforcement Learning, RL)は、通常、単一ステップポリシーや単一ステップモデルの推定に関係している。
我々は、RLをシーケンスモデリング問題とみなし、高い報酬のシーケンスにつながる一連のアクションを予測することを目標としている。
論文 参考訳(メタデータ) (2021-06-03T17:58:51Z) - Unsupervised Controllable Generation with Self-Training [90.04287577605723]
GANによる制御可能な世代は依然として困難な研究課題である。
本稿では,自己学習を通じてジェネレータを制御する潜伏符号の分布を学習するための教師なしフレームワークを提案する。
我々のフレームワークは、変分オートエンコーダのような他の変種と比較して、より良い絡み合いを示す。
論文 参考訳(メタデータ) (2020-07-17T21:50:35Z) - Information Theoretic Regret Bounds for Online Nonlinear Control [35.534829914047336]
未知の非線形力学系における逐次制御の問題について検討する。
この枠組みは、離散的かつ連続的な制御入力と非滑らかで微分不可能な力学を許容する一般的な設定を与える。
実験により, 非線形制御タスクへの応用を実証し, モデル力学の学習における探索の利点を実証する。
論文 参考訳(メタデータ) (2020-06-22T17:46:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。