Fugu-MT 論文翻訳(概要): ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model

論文の概要: ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model

arxiv url: http://arxiv.org/abs/2410.07296v1
Date: Tue, 15 Oct 2024 14:12:01 GMT
ステータス: 翻訳完了
システム内更新日: 2024-10-31 21:06:44.122859
Title: ReinDiffuse: Crafting Physically Plausible Motions with Reinforced Diffusion Model
Title（参考訳）: ReinDiffuse: 強化拡散モデルによる物理的に可塑性な運動の創成
Authors: Gaoge Han, Mingjiang Liang, Jinglei Tang, Yongkang Cheng, Wei Liu, Shaoli Huang,
Abstract要約: 本稿では、強化学習と運動拡散モデルを組み合わせることで、物理的に信頼できる人間の動きを生成するEmphReinDiffuseを提案する。動作拡散モデルを用いてパラメータ化された動作分布を出力し、強化学習パラダイムに適合させる。我々のアプローチは、HumanML3DとKIT-MLという2つの主要なデータセット上で、既存の最先端モデルよりも優れています。
参考スコア（独自算出の注目度）: 9.525806425270428
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Generating human motion from textual descriptions is a challenging task. Existing methods either struggle with physical credibility or are limited by the complexities of physics simulations. In this paper, we present \emph{ReinDiffuse} that combines reinforcement learning with motion diffusion model to generate physically credible human motions that align with textual descriptions. Our method adapts Motion Diffusion Model to output a parameterized distribution of actions, making them compatible with reinforcement learning paradigms. We employ reinforcement learning with the objective of maximizing physically plausible rewards to optimize motion generation for physical fidelity. Our approach outperforms existing state-of-the-art models on two major datasets, HumanML3D and KIT-ML, achieving significant improvements in physical plausibility and motion quality. Project: \url{https://reindiffuse.github.io/}
Abstract（参考訳）: 文章の記述から人間の動きを生成することは難しい課題である。既存の方法は物理的信頼性に苦しむか、物理シミュレーションの複雑さによって制限される。本稿では、強化学習と運動拡散モデルを組み合わせることで、テキスト記述と整合した物理的に信頼できる人間の動作を生成する「emph{ReinDiffuse}」を提案する。動作拡散モデルを用いてパラメータ化された動作分布を出力し、強化学習パラダイムに適合させる。我々は,身体的忠実度に対する運動生成を最適化するために,身体的可算報酬の最大化を目的とした強化学習を採用する。提案手法は,HumanML3DとKIT-MLの2つの主要なデータセットにおける既存の最先端モデルよりも優れており,身体的妥当性と運動品質の大幅な向上を実現している。プロジェクト: \url{https://reindiffuse.github.io/}

関連論文リスト

SimGenHOI: Physically Realistic Whole-Body Humanoid-Object Interaction via Generative Modeling and Reinforcement Learning [6.255814224573073]
SimGenHOIは、生成モデリングと強化学習の強みを組み合わせた統一的なフレームワークであり、制御可能で物理的に妥当なHOIを生成する。本研究では,Diffusion Transformers (DiT) に基づくHOI生成モデルを用いて,テキストプロンプト,オブジェクト形状,スパースオブジェクトウェイポイント,初期ヒューマノイドポーズのセットを予測した。身体的現実性を確保するため,強化学習で訓練された接触認識全身制御ポリシーを設計し,その動作をトラッキングし,侵入や足の滑りなどのアーティファクトを補正する。
論文参考訳（メタデータ） (2025-08-18T15:20:46Z)
Half-Physics: Enabling Kinematic 3D Human Model with Physical Interactions [88.01918532202716]
SMPL-Xを周囲との動的物理的相互作用が可能な有形実体に埋め込む新しい手法を提案する。本手法は,シーンやオブジェクトとの物理的に妥当な相互作用を確保しつつ,固有のSMPL-Xポーズの運動制御を維持する。広範かつ複雑な訓練を必要とする強化学習法とは異なり、ハーフフィック法は学習自由であり、あらゆる身体形状や運動に一般化する。
論文参考訳（メタデータ） (2025-07-31T17:58:33Z)
PhysiInter: Integrating Physical Mapping for High-Fidelity Human Interaction Generation [35.563978243352764]
人間のインタラクション生成パイプライン全体に統合された物理マッピングを導入する。具体的には、物理に基づくシミュレーション環境での運動模倣は、ターゲットの動きを物理的に有効な空間に投影するために使用される。実験の結果,人間の運動の質は3%～89%向上した。
論文参考訳（メタデータ） (2025-06-09T06:04:49Z)
Think Before You Diffuse: LLMs-Guided Physics-Aware Video Generation [28.79821758835663]
DiffPhyは、物理的に正確でリアルなビデオ生成を可能にする汎用的なフレームワークである。本手法は大規模言語モデル(LLM)を活用し,テキストプロンプトから包括的物理的文脈を明示的に推論する。また、多様な植物行動やイベントを含む高品質な物理ビデオデータセットを構築し、効果的な微調整を容易にする。
論文参考訳（メタデータ） (2025-05-27T18:26:43Z)
PRIMAL: Physically Reactive and Interactive Motor Model for Avatar Learning [38.004463823796286]
2段階のパラダイムで学習した自己回帰拡散モデルであるPRIMALを提案する。事前学習段階において、モデルは多数のサブ秒動作セグメントから運動力学を学習する。適応段階では、制御ネットのような適応器を用いて、セマンティックアクション生成と空間的目標到達のためのモータ制御を微調整する。
論文参考訳（メタデータ） (2025-03-21T21:27:57Z)
A Plug-and-Play Physical Motion Restoration Approach for In-the-Wild High-Difficulty Motions [56.709280823844374]
動作コンテキストとビデオマスクを利用して、欠陥のある動作を修復するマスクベースの動作補正モジュール(MCM)を導入する。また,運動模倣のための事前訓練および適応手法を用いた物理ベースの運動伝達モジュール (PTM) を提案する。本手法は,高速な移動を含む映像モーションキャプチャ結果を物理的に洗練するためのプラグイン・アンド・プレイモジュールとして設計されている。
論文参考訳（メタデータ） (2024-12-23T08:26:00Z)
PhysMotion: Physics-Grounded Dynamics From a Single Image [24.096925413047217]
物理シミュレーションの原理を取り入れた新しいフレームワークであるPhysMotionを導入し,1つの画像から生成された中間3次元表現をガイドする。我々のアプローチは、従来のデータ駆動生成モデルの限界に対処し、より一貫した物理的に妥当な動きをもたらす。
論文参考訳（メタデータ） (2024-11-26T07:59:11Z)
Morph: A Motion-free Physics Optimization Framework for Human Motion Generation [25.51726849102517]
我々のフレームワークは、身体的可視性を大幅に向上させながら、最先端のモーション生成品質を実現する。テキスト・トゥ・モーション・アンド・ミュージック・トゥ・ダンス・ジェネレーション・タスクの実験は、我々のフレームワークが最先端のモーション・ジェネレーション・クオリティを達成することを示す。
論文参考訳（メタデータ） (2024-11-22T14:09:56Z)
HUMOS: Human Motion Model Conditioned on Body Shape [54.20419874234214]
身体形状に基づく生成運動モデルを構築するための新しいアプローチを提案する。非ペアデータを使ってこのモデルをトレーニングすることが可能であることを示す。得られたモデルは、多種多様で、物理的に妥当で、動的に安定した人間の動きを生成する。
論文参考訳（メタデータ） (2024-09-05T23:50:57Z)
DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative Diffusion Models [102.13968267347553]
本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文参考訳（メタデータ） (2023-11-28T18:58:48Z)
Exploring Model Transferability through the Lens of Potential Energy [78.60851825944212]
トランスファーラーニングは、事前訓練されたディープラーニングモデルが広く利用可能であることから、コンピュータビジョンタスクにおいて重要になっている。既存のトレーニング済みモデルの転送可能性の測定方法は、符号化された静的特徴とタスクラベルの間の統計的相関に依存する。我々はこれらの課題に対処するために,PEDという物理に着想を得たアプローチを提案する。
論文参考訳（メタデータ） (2023-08-29T07:15:57Z)
DexDeform: Dexterous Deformable Object Manipulation with Human Demonstrations and Differentiable Physics [97.75188532559952]
人間の実演から巧妙な操作スキルを抽象化する原理的枠組みを提案する。次に、イマジネーションにおけるアクション抽象化を計画する上で、デモを使ってスキルモデルをトレーニングします。提案手法の有効性を評価するために,6つの難解な変形可能なオブジェクト操作タスクの組を導入する。
論文参考訳（メタデータ） (2023-03-27T17:59:49Z)
PhysDiff: Physics-Guided Human Motion Diffusion Model [101.1823574561535]
既存の運動拡散モデルは、拡散過程における物理学の法則をほとんど無視する。 PhysDiffは拡散過程に物理的制約を組み込む。提案手法は,最先端の動作品質を実現し,身体的可視性を大幅に向上させる。
論文参考訳（メタデータ） (2022-12-05T18:59:52Z)
Differentiable Dynamics for Articulated 3d Human Motion Reconstruction [29.683633237503116]
DiffPhyは、映像から3次元の人間の動きを再現する物理モデルである。モノクロ映像から物理的に可視な3次元動作を正確に再現できることを実証し,本モデルの有効性を検証した。
論文参考訳（メタデータ） (2022-05-24T17:58:37Z)
Physics-based Human Motion Estimation and Synthesis from Videos [0.0]
単眼のRGBビデオから直接、身体的に可視な人間の動きの生成モデルを訓練するための枠組みを提案する。提案手法のコアとなるのは,不完全な画像に基づくポーズ推定を補正する新しい最適化式である。その結果,我々の身体的補正動作は,ポーズ推定における先行作業よりも有意に優れていた。
論文参考訳（メタデータ） (2021-09-21T01:57:54Z)
Physics-Integrated Variational Autoencoders for Robust and Interpretable Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文参考訳（メタデータ） (2021-02-25T20:28:52Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。