Fugu-MT 論文翻訳(概要): Efficient Text-driven Motion Generation via Latent Consistency Training

論文の概要: Efficient Text-driven Motion Generation via Latent Consistency Training

arxiv url: http://arxiv.org/abs/2405.02791v1
Date: Sun, 5 May 2024 02:11:57 GMT
ステータス: 翻訳完了
システム内更新日: 2024-05-07 18:20:16.707631
Title: Efficient Text-driven Motion Generation via Latent Consistency Training
Title（参考訳）: 遅延整合性学習によるテキスト駆動動作の効率的な生成
Authors: Mengxian Hu, Minghao Zhu, Xun Zhou, Qingqing Yan, Shu Li, Chengju Liu, Qijun Chen,
Abstract要約: 動作生成のための動作遅延整合性トレーニング(MLCT)を提案し,推論時の計算量と時間消費を緩和する。低次元運動潜在空間に拡散パイプラインを適用し,各関数評価の計算負担を軽減する。 2つの人体運動生成ベンチマーク実験により、提案モデルが10%未満の時間コストで最先端の性能を達成することを示す。
参考スコア（独自算出の注目度）: 21.348658259929053
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Motion diffusion models have recently proven successful for text-driven human motion generation. Despite their excellent generation performance, they are challenging to infer in real time due to the multi-step sampling mechanism that involves tens or hundreds of repeat function evaluation iterations. To this end, we investigate a motion latent consistency Training (MLCT) for motion generation to alleviate the computation and time consumption during iteration inference. It applies diffusion pipelines to low-dimensional motion latent spaces to mitigate the computational burden of each function evaluation. Explaining the diffusion process with probabilistic flow ordinary differential equation (PF-ODE) theory, the MLCT allows extremely few steps infer between the prior distribution to the motion latent representation distribution via maintaining consistency of the outputs over the trajectory of PF-ODE. Especially, we introduce a quantization constraint to optimize motion latent representations that are bounded, regular, and well-reconstructed compared to traditional variational constraints. Furthermore, we propose a conditional PF-ODE trajectory simulation method, which improves the conditional generation performance with minimal additional training costs. Extensive experiments on two human motion generation benchmarks show that the proposed model achieves state-of-the-art performance with less than 10\% time cost.
Abstract（参考訳）: 動き拡散モデルは最近、テキスト駆動による人間の動き生成に成功している。生成性能は優れていますが,複数ステップのサンプリング機構が複数回,あるいは数百回繰り返し関数評価を繰り返しているため,リアルタイムに推測することは困難です。そこで本研究では、動作生成のための動作遅延整合性トレーニング(MLCT)について検討し、反復推論時の計算と時間消費を緩和する。低次元運動潜在空間に拡散パイプラインを適用し,各関数評価の計算負担を軽減する。 MLCTは、確率フロー常微分方程式(PF-ODE)理論を用いて拡散過程を記述し、PF-ODEの軌道上の出力の整合性を維持することにより、先行分布と運動潜在表現分布の間に非常に少ないステップを推測する。特に、従来の変動制約と比較して、有界、正則、そしてよく再構成された動き潜在表現を最適化する量子化制約を導入する。さらに,条件付きPF-ODEトラジェクトリシミュレーションを提案し,トレーニングコストを最小化して条件付き生成性能を向上させる。 2つの人体運動生成ベンチマークの大規模な実験により,提案モデルが10 % の時間コストで最先端の性能を達成できることが示されている。

関連論文リスト

Beyond Confidence: Adaptive and Coherent Decoding for Diffusion Language Models [64.92045568376705]
コヒーレントコンテキストデコーディング(Coherent Contextual Decoding, CCD)は、2つのコアイノベーションに基づいて構築された新しい推論フレームワークである。 CCDは、歴史的文脈を活用してシーケンスコヒーレンスを高める軌道修正機構を採用している。拡散ステップに基づく厳密なアロケーションの代わりに,各ステップのアンマスク予算を動的に調整する適応型サンプリング戦略を導入する。
論文参考訳（メタデータ） (2025-11-26T09:49:48Z)
DAPS++: Rethinking Diffusion Inverse Problems with Decoupled Posterior Annealing [5.215481191227242]
textbfDAPS++を導入することで,数値安定性を維持しつつ,推論をより直接的にガイドすることができる。 textbfDAPS++は、様々な画像復元タスク間で高い計算効率と堅牢な再構成性能を実現する。
論文参考訳（メタデータ） (2025-11-21T08:28:36Z)
Learning Straight Flows: Variational Flow Matching for Efficient Generation [36.84747986070112]
フローマッチングは、学習された曲線軌道に依存するため、ワンステップ生成の能力に制限がある。 textbfS-VFMは、軌道直線性を明示的に強制し、理想的には線形生成経路を生成する。
論文参考訳（メタデータ） (2025-11-15T22:51:58Z)
Iterative Refinement of Flow Policies in Probability Space for Online Reinforcement Learning [56.47948583452555]
固定ステップのEulerスキームによるフローマッチング推論プロセスの離散化は,最適輸送から変化するJordan-Kinderlehrer-Otto原理と整合する,というキーインサイトに基づいて,SWFP(Stepwise Flow Policy)フレームワークを紹介した。 SWFPは、大域的な流れを、プロキシメート分布間の小さな漸進的な変換の列に分解する。この分解は、小さな流れブロックのカスケードを介して事前訓練された流れを微調整する効率的なアルゴリズムを導き、大きな利点をもたらす。
論文参考訳（メタデータ） (2025-10-17T07:43:51Z)
Projected Coupled Diffusion for Test-Time Constrained Joint Generation [49.69610867216755]
制約付きジョイント生成のための新しいテストタイムフレームワークであるProjected Coupled Diffusion (PCD)を提案する。 PCDは、拡散モデル間の協調を促進するために生成力学に結合したガイダンス項を導入し、各拡散ステップにプロジェクションステップを組み込んで厳しい制約を強制する。その結果,過剰な計算コストを発生させることなく,結合効果の向上と制約満足度が保証された。
論文参考訳（メタデータ） (2025-08-14T11:05:31Z)
Flows and Diffusions on the Neural Manifold [0.0]
拡散およびフローベース生成モデルは、画像合成、ビデオ生成、自然言語モデリングといった領域で顕著に成功している。これらの進歩は、最近の手法を活用して、最適化力学から導かれる構造的事前を組み込むことにより、重み空間学習に拡張する。
論文参考訳（メタデータ） (2025-07-14T02:26:06Z)
CTRLS: Chain-of-Thought Reasoning via Latent State-Transition [57.51370433303236]
チェーン・オブ・シント(CoT)推論は、大規模な言語モデルで複雑な問題を解釈可能な中間ステップに分解することを可能にする。我々は,遅延状態遷移を伴うマルコフ決定プロセス(MDP)としてCoT推論を定式化するフレームワークであるgroundingSを紹介する。我々は、ベンチマーク推論タスクにおける推論精度、多様性、探索効率の改善を示す。
論文参考訳（メタデータ） (2025-07-10T21:32:18Z)
Navigating Sparse Molecular Data with Stein Diffusion Guidance [48.21071466968102]
最適制御(SOC)は、微調整拡散モデルのための原則的フレームワークとして登場した。予測されたクリーンなサンプルに対して,既成の分類器を用いて拡散モデルを導出する,トレーニング不要な手法のクラスが開発されている。本稿では,サロゲート最適制御目標に基づく新しいトレーニングフリーガイダンスフレームワークを提案する。
論文参考訳（メタデータ） (2025-07-07T21:14:27Z)
Aligning Diffusion Model with Problem Constraints for Trajectory Optimization [0.6629765271909505]
本稿では,拡散モデルと問題固有の制約を明示的に整合させる新しい手法を提案する。私たちのアプローチは、Dynamic Data-Driven Application Systems(DDDAS)フレームワークとの統合に適しています。
論文参考訳（メタデータ） (2025-04-01T01:46:05Z)
A First-order Generative Bilevel Optimization Framework for Diffusion Models [57.40597004445473]
拡散モデルは、データサンプルを反復的に分解して高品質な出力を合成する。従来の二値法は無限次元の確率空間と禁制的なサンプリングコストのために失敗する。我々はこの問題を生成的二段階最適化問題として定式化する。従来の2段階法と拡散過程の非互換性を克服する。
論文参考訳（メタデータ） (2025-02-12T21:44:06Z)
Decentralized Inference for Spatial Data Using Low-Rank Models [4.168323530566095]
本稿では,空間的低ランクモデルにおけるパラメータ推論に適した分散化フレームワークを提案する。重要な障害は、観測中の空間的依存から生じ、ログのような状態が要約として表現されるのを防ぐ。提案手法では,効率的なパラメータ最適化のために,マルチセンサと動的コンセンサス平均化を統合したブロック降下法を用いる。
論文参考訳（メタデータ） (2025-02-01T04:17:01Z)
FlowDAS: A Flow-Based Framework for Data Assimilation [15.64941169350615]
FlowDASは、状態遷移ダイナミクスと生成前の学習を統合するために補間剤を用いた新しい生成モデルベースのフレームワークである。実験では,ローレンツシステムから高次元流体超解像タスクに至るまで,様々なベンチマークにおいてFlowDASの優れた性能を示す。
論文参考訳（メタデータ） (2025-01-13T05:03:41Z)
Diffusion Predictive Control with Constraints [51.91057765703533]
制約付き拡散予測制御(DPCC) トレーニングデータから逸脱可能な、明示的な状態と行動制約を持つ拡散制御アルゴリズム。 DPCCは,学習した制御タスクの性能を維持しつつ,新しいテスト時間制約を満たす上で,既存の手法よりも優れるロボットマニピュレータのシミュレーションを通して示す。
論文参考訳（メタデータ） (2024-12-12T15:10:22Z)
Motion-prior Contrast Maximization for Dense Continuous-Time Motion Estimation [34.529280562470746]
コントラスト最大化フレームワークと非直線運動を組み合わせた新たな自己監督的損失を画素レベルの軌跡の形で導入する。連続時間運動の高密度推定では, 合成学習モデルのゼロショット性能を29%向上する。
論文参考訳（メタデータ） (2024-07-15T15:18:28Z)
On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文参考訳（メタデータ） (2024-05-18T15:59:41Z)
Distributed Markov Chain Monte Carlo Sampling based on the Alternating Direction Method of Multipliers [143.6249073384419]
本論文では,乗算器の交互方向法に基づく分散サンプリング手法を提案する。我々は,アルゴリズムの収束に関する理論的保証と,その最先端性に関する実験的証拠の両方を提供する。シミュレーションでは,線形回帰タスクとロジスティック回帰タスクにアルゴリズムを配置し,その高速収束を既存の勾配法と比較した。
論文参考訳（メタデータ） (2024-01-29T02:08:40Z)
Motion Flow Matching for Human Motion Synthesis and Editing [75.13665467944314]
本研究では,効率的なサンプリングと効率性を備えた人体運動生成のための新しい生成モデルであるemphMotion Flow Matchingを提案する。提案手法は, 従来の拡散モデルにおいて, サンプリングの複雑さを1000ステップから10ステップに減らし, テキスト・ツー・モーション・ジェネレーション・ベンチマークやアクション・ツー・モーション・ジェネレーション・ベンチマークで同等の性能を実現する。
論文参考訳（メタデータ） (2023-12-14T12:57:35Z)
EMDM: Efficient Motion Diffusion Model for Fast and High-Quality Motion Generation [57.539634387672656]
現在の最先端生成拡散モデルでは、優れた結果が得られたが、品質を犠牲にすることなく、高速な生成に苦慮している。高速かつ高品質な人体運動生成のための効率的な運動拡散モデル(EMDM)を提案する。
論文参考訳（メタデータ） (2023-12-04T18:58:38Z)
Non-Cross Diffusion for Semantic Consistency [12.645444338043934]
常微分方程式(ODE)モデルを学習するための生成モデリングにおける革新的アプローチであるNon-Cross Diffusionを導入する。提案手法は,2つの分布からサンプリングされた点を非交差経路で効果的に接続する,入力の上昇次元を戦略的に組み込む。
論文参考訳（メタデータ） (2023-11-30T05:53:39Z)
Generative Modeling with Phase Stochastic Bridges [49.4474628881673]
拡散モデル(DM)は、連続入力のための最先端の生成モデルを表す。我々はtextbfphase space dynamics に基づく新しい生成モデリングフレームワークを提案する。我々のフレームワークは、動的伝播の初期段階において、現実的なデータポイントを生成する能力を示す。
論文参考訳（メタデータ） (2023-10-11T18:38:28Z)
DiffuSeq-v2: Bridging Discrete and Continuous Text Spaces for Accelerated Seq2Seq Diffusion Models [58.450152413700586]
ガウス空間に基づく離散突然変異を再構成する学習において拡散モデルを容易にする軟吸収状態を導入する。我々は、サンプリングプロセスの高速化のために、連続空間内で最先端のODEソルバを用いている。提案手法は, トレーニング収束率を4倍に向上させ, 類似品質のサンプルを800倍高速に生成する。
論文参考訳（メタデータ） (2023-10-09T15:29:10Z)
Observation-Guided Diffusion Probabilistic Models [41.749374023639156]
観測誘導拡散確率モデル(OGDM)と呼ばれる新しい拡散に基づく画像生成法を提案する。本手法は,観測プロセスの指導をマルコフ連鎖と統合することにより,トレーニング目標を再構築する。本研究では,強力な拡散モデルベースライン上での多様な推論手法を用いたトレーニングアルゴリズムの有効性を示す。
論文参考訳（メタデータ） (2023-10-06T06:29:06Z)
Distributionally Robust Model-based Reinforcement Learning with Large State Spaces [55.14361269378122]
強化学習における3つの大きな課題は、大きな状態空間を持つ複雑な力学系、コストのかかるデータ取得プロセス、トレーニング環境の展開から現実の力学を逸脱させることである。広範に用いられているKullback-Leibler, chi-square, および全変分不確実性集合の下で, 連続状態空間を持つ分布ロバストなマルコフ決定過程について検討した。本稿では,ガウス過程と最大分散削減アルゴリズムを用いて,多出力名目遷移力学を効率的に学習するモデルベースアプローチを提案する。
論文参考訳（メタデータ） (2023-09-05T13:42:11Z)
Reflected Diffusion Models [93.26107023470979]
本稿では,データのサポートに基づいて進化する反射微分方程式を逆転する反射拡散モデルを提案する。提案手法は,一般化されたスコアマッチング損失を用いてスコア関数を学習し,標準拡散モデルの主要成分を拡張する。
論文参考訳（メタデータ） (2023-04-10T17:54:38Z)
Evolve Smoothly, Fit Consistently: Learning Smooth Latent Dynamics For Advection-Dominated Systems [14.553972457854517]
複雑な物理系のサロゲートモデルを学ぶための,データ駆動・時空連続フレームワークを提案する。ネットワークの表現力と特別に設計された整合性誘導正規化を利用して,低次元かつ滑らかな潜在軌道を得る。
論文参考訳（メタデータ） (2023-01-25T03:06:03Z)
ProgressiveMotionSeg: Mutually Reinforced Framework for Event-Based Motion Segmentation [101.19290845597918]
本稿では,動作推定 (ME) モジュールとイベントデノイング (ED) モジュールを相互に強化された方法で共同最適化する。時間的相関をガイダンスとして、EDモジュールは各イベントが実活動イベントに属するという信頼度を算出し、MEモジュールに送信し、ノイズ抑制のための運動セグメンテーションのエネルギー関数を更新する。
論文参考訳（メタデータ） (2022-03-22T13:40:26Z)
Motion Deblurring with Real Events [50.441934496692376]
本稿では,イベントベースの動作を自己教師型で記述するエンド・ツー・エンドの学習フレームワークを提案する。実世界のイベントは、データ不整合によるパフォーマンス劣化を軽減するために利用される。
論文参考訳（メタデータ） (2021-09-28T13:11:44Z)
Learning a Generative Motion Model from Image Sequences based on a Latent Motion Matrix [8.774604259603302]
画像列の時間的登録をシミュレートして確率的動きモデルを学ぶ。 3つの最先端登録アルゴリズムと比較して,登録精度と時間的にスムーズな整合性が改善された。また, フレームの欠落のあるシーケンスからの動作再構成を改良し, 動作解析, シミュレーション, 超解像に対するモデルの適用性を実証した。
論文参考訳（メタデータ） (2020-11-03T14:44:09Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。