論文の概要: A Survey on Reinforcement Learning Methods in Character Animation
- arxiv url: http://arxiv.org/abs/2203.04735v1
- Date: Mon, 7 Mar 2022 23:39:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-11 10:48:13.919743
- Title: A Survey on Reinforcement Learning Methods in Character Animation
- Title(参考訳): 文字アニメーションにおける強化学習手法に関する調査研究
- Authors: Ariel Kwiatkowski, Eduardo Alvarado, Vicky Kalogeiton, C. Karen Liu,
Julien Pettr\'e, Michiel van de Panne, Marie-Paule Cani
- Abstract要約: 強化学習(Reinforcement Learning)は、エージェントがシーケンシャルな決定をするためにどのようにトレーニングできるかに焦点を当てた機械学習の分野である。
本稿では,現代のDeep Reinforcement Learning法を調査し,キャラクタアニメーションにおける応用の可能性について考察する。
- 参考スコア(独自算出の注目度): 22.3342752080749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Reinforcement Learning is an area of Machine Learning focused on how agents
can be trained to make sequential decisions, and achieve a particular goal
within an arbitrary environment. While learning, they repeatedly take actions
based on their observation of the environment, and receive appropriate rewards
which define the objective. This experience is then used to progressively
improve the policy controlling the agent's behavior, typically represented by a
neural network. This trained module can then be reused for similar problems,
which makes this approach promising for the animation of autonomous, yet
reactive characters in simulators, video games or virtual reality environments.
This paper surveys the modern Deep Reinforcement Learning methods and discusses
their possible applications in Character Animation, from skeletal control of a
single, physically-based character to navigation controllers for individual
agents and virtual crowds. It also describes the practical side of training DRL
systems, comparing the different frameworks available to build such agents.
- Abstract(参考訳): 強化学習(Reinforcement Learning)は、エージェントがシーケンシャルな意思決定を行い、任意の環境で特定の目標を達成する方法をトレーニングする方法に焦点を当てた機械学習の分野である。
学習中、彼らは環境の観察に基づいて繰り返し行動を取り、目的を定義する適切な報酬を受け取る。
この経験は、通常ニューラルネットワークで表現されるエージェントの振る舞いを制御するポリシーを徐々に改善するために使われる。
このトレーニングされたモジュールは、同様の問題に対して再利用できるため、シミュレータやビデオゲーム、仮想現実環境において、自律的でリアクティブなキャラクタのアニメーションを約束することができる。
本稿では,現代的深層強化学習法を調査し,その文字アニメーションにおける応用可能性について考察する。
また、DRLシステムのトレーニングの実践的な側面についても述べており、そのようなエージェントを構築するために利用可能な様々なフレームワークを比較している。
関連論文リスト
- Learning of Generalizable and Interpretable Knowledge in Grid-Based
Reinforcement Learning Environments [5.217870815854702]
本稿では,強化学習ポリシーを模倣するプログラム合成を提案する。
我々は,グリッド環境における概念学習に最先端のプログラム合成システムDreamCoderを適用した。
論文 参考訳(メタデータ) (2023-09-07T11:46:57Z) - Adaptive Tracking of a Single-Rigid-Body Character in Various
Environments [2.048226951354646]
単剛体キャラクタのシミュレーションに基づく深層強化学習手法を提案する。
中心運動モデル (CDM) を用いて, 全身特性を単一剛体 (SRB) として表現し, 基準運動を追跡する政策を訓練することにより, 様々な未観測環境変化に適応できる政策を得ることができる。
弊社の政策は、超ポータブルラップトップ上で30分以内に効率よく訓練され、学習中に経験されていない環境に対処できることを実証する。
論文 参考訳(メタデータ) (2023-08-14T22:58:54Z) - ASE: Large-Scale Reusable Adversarial Skill Embeddings for Physically
Simulated Characters [123.88692739360457]
汎用運動技術により、人間は複雑な作業を行うことができる。
これらのスキルは、新しいタスクを学ぶときの振る舞いを導くための強力な先駆者も提供します。
物理シミュレーション文字のための汎用的で再利用可能なスキル埋め込みを学習するためのフレームワークを提案する。
論文 参考訳(メタデータ) (2022-05-04T06:13:28Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Action-Conditioned Contrastive Policy Pretraining [39.13710045468429]
深層運動のポリシー学習は、ロボット操作や自律運転などの制御タスクにおいて有望な結果を達成する。
トレーニング環境との膨大な数のオンラインインタラクションが必要です。
本研究では、数時間の未計算YouTubeビデオを用いて、タスクを駆動するためのポリシー表現を事前訓練することを目的とする。
論文 参考訳(メタデータ) (2022-04-05T17:58:22Z) - Evaluating Continual Learning Algorithms by Generating 3D Virtual
Environments [66.83839051693695]
連続学習とは、人間や動物が特定の環境で徐々に学習する能力である。
本稿では3次元仮想環境の最近の進歩を活用して,フォトリアリスティックな外観を持つ潜在的に長寿命な動的シーンの自動生成にアプローチすることを提案する。
本論文の新たな要素は、シーンがパラメトリックな方法で記述され、エージェントが知覚する入力ストリームの視覚的複雑さを完全に制御できることである。
論文 参考訳(メタデータ) (2021-09-16T10:37:21Z) - Backprop-Free Reinforcement Learning with Active Neural Generative
Coding [84.11376568625353]
動的環境におけるエラー(バックプロップ)のバックプロパゲーションを伴わない行動駆動型生成モデルの学習のための計算フレームワークを提案する。
我々は、まばらな報酬でも機能するインテリジェントエージェントを開発し、推論として計画の認知理論からインスピレーションを得ている。
我々のエージェントの堅牢な性能は、神経推論と学習のためのバックプロップフリーアプローチがゴール指向の行動を促進するという有望な証拠を提供する。
論文 参考訳(メタデータ) (2021-07-10T19:02:27Z) - Data-Driven Reinforcement Learning for Virtual Character Animation
Control [0.0]
社会的行動は、世界との物理的相互作用の欠如のために、報酬関数を設計することが困難です。
本稿では,この課題に対処する新しいデータ駆動型ディープRLアプローチであるRLAnimateを提案する。
エージェント,環境,状態,行動といった要素の概念的役割を解明し,エージェントの数学的構造を定式化する。
提案手法を用いて学習したエージェントは,反復的なRL学習プロセスを用いて,多動作を表現するための汎用的アニメーション力学を学習する。
論文 参考訳(メタデータ) (2021-04-13T17:05:27Z) - PsiPhi-Learning: Reinforcement Learning with Demonstrations using
Successor Features and Inverse Temporal Difference Learning [102.36450942613091]
時間差学習(ITD)と呼ばれる逆強化学習アルゴリズムを提案する。
Psi Phi$-learningと呼ばれるデモで強化学習のための新しいアルゴリズムに到達し、オンライン環境の相互作用から学習とITDをシームレスに統合する方法を示します。
論文 参考訳(メタデータ) (2021-02-24T21:12:09Z) - Neural Dynamic Policies for End-to-End Sensorimotor Learning [51.24542903398335]
感覚運動制御における現在の主流パラダイムは、模倣であれ強化学習であれ、生の行動空間で政策を直接訓練することである。
軌道分布空間の予測を行うニューラル・ダイナミック・ポリシー(NDP)を提案する。
NDPは、いくつかのロボット制御タスクにおいて、効率と性能の両面で、これまでの最先端よりも優れている。
論文 参考訳(メタデータ) (2020-12-04T18:59:32Z) - Deep Reinforcement Learning for High Level Character Control [0.9645196221785691]
本稿では,従来のアニメーション,行動,強化学習をコンピュータメディアの知的文字生成に活用することを提案する。
提示されるユースケースは、3D環境での高レベルコントローラを備えたドッグキャラクタで、アイテムのフェッチなど、学習すべき振る舞いを中心に構築されている。
論文 参考訳(メタデータ) (2020-05-20T23:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。