論文の概要: Towards Highly-Constrained Human Motion Generation with Retrieval-Guided Diffusion Noise Optimization
- arxiv url: http://arxiv.org/abs/2605.08054v1
- Date: Fri, 08 May 2026 17:43:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.249276
- Title: Towards Highly-Constrained Human Motion Generation with Retrieval-Guided Diffusion Noise Optimization
- Title(参考訳): 検索誘導拡散雑音最適化による高制約人体運動生成に向けて
- Authors: Hanchao Liu, Fang-Lue Zhang, Shining Zhang, Tai-Jiang Mu, Shi-Min Hu,
- Abstract要約: ゼロ時間目標関数をカスタマイズした動きを生成するための学習自由拡散雑音最適化フレームワークを提案する。
このフレームワークは、制御可能なキャラクターアニメーションや仮想エージェントの動作合成などのアプリケーションを可能にするために使用される。
- 参考スコア(独自算出の注目度): 32.04001045559129
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generating human motion that satisfies customized zero-shot goal functions, enabling applications such as controllable character animation and behavior synthesis for virtual agents, is a critical capability. While current approaches handle many unseen constraints, they fail on tasks with very challenging spatiotemporal restrictions, such as severe spatial obstacles or specified numbers of walking steps. To equip motion generators for these highly constrained tasks, we present a retrieval-guided method built on the training-free diffusion noise optimization framework. The key idea is to search within large motion datasets for guidance that can potentially satisfy difficult constraints. We introduce relational task parsing to group target constraints and identify the difficult ones to be handled by retrieved reference. A better initialization for diffusion noise is then obtained via a reward-guided mask that combines random noise with retrieved noise. By optimizing diffusion noise from this improved initialization, we successfully solve highly constrained generation tasks. By leveraging LLM for relational task parsing, the whole framework is further enabled to automatically reason for what to retrieve, improving the intelligence of moving agents under a training-free optimization scheme.
- Abstract(参考訳): ゼロショットゴール関数をカスタマイズし、制御可能なキャラクターアニメーションや仮想エージェントの動作合成などのアプリケーションを可能にするヒューマンモーションの生成は、重要な機能である。
現在のアプローチは多くの目に見えない制約に対処するが、厳しい空間障害や特定の歩数など、非常に困難な時空間的制約を伴うタスクでは失敗する。
このような高度に制約されたタスクにモーションジェネレータを装備するために,学習自由拡散雑音最適化フレームワーク上に構築された検索誘導方式を提案する。
鍵となるアイデアは、難しい制約を満たす可能性のあるガイダンスのために、大きなモーションデータセット内で検索することである。
グループ目標制約に対するリレーショナルタスク解析を導入し、検索された参照によって扱うのが困難なタスクを識別する。
拡散雑音に対するより良い初期化は、ランダムノイズと検索された雑音を組み合わせた報酬誘導マスクによって得られる。
この改良された初期化から拡散雑音を最適化することにより、高度に制約された生成タスクの解決に成功している。
LLMをリレーショナルタスク解析に活用することにより、フレームワーク全体を自動で検索し、トレーニング不要の最適化スキームの下で移動エージェントのインテリジェンスを改善することができる。
関連論文リスト
- CiMRAG: CiM-Aware Domain-Adaptive and Noise-Resilient Retrieval-Augmented Generation for Edge-Based LLMs [10.372308692379404]
Retrieval-Augmented Generation (RAG)は、関連するプロファイルデータを検索し、調整された応答を生成することでパーソナライズするための重要な方法である。
計算メモリ(CiM)アーキテクチャは、メモリと処理ユニット間のデータ移動をin-situ操作によって排除することで、このボトルネックを軽減する。
本稿では,雑音環境におけるRAGのノイズおよびドメイン適応性を改善するフレームワークである,タスク指向型ノイズ-レジリエントな埋め込み学習を提案する。
論文 参考訳(メタデータ) (2026-01-27T20:30:59Z) - Group-Theoretic Reinforcement Learning of Dynamical Decoupling Sequences [9.136190419305427]
動的デカップリングは、パルスビットの位相デコヒーレンスを効果的に瞬間的な電磁パルスのシーケンスを適用することによって緩和しようとする。
提案手法は,ノイズスペクトルの明示的な知識を必要とせずに,劣化するシーケンスを学習できることを実証する。
論文 参考訳(メタデータ) (2025-12-15T20:48:08Z) - Real-Time Iteration Scheme for Diffusion Policy [23.124189676943757]
本稿では,RTI(Real-Time Iteration)スキームにインスパイアされた新しい手法を導入し,推論を高速化する。
本稿では,ロボット操作における把握などの離散的な動作を効果的に扱うためのスケーリング手法を提案する。
提案方式は蒸留や政策の再設計を必要とせず,実行時の計算コストを大幅に削減する。
論文 参考訳(メタデータ) (2025-08-07T13:49:00Z) - One-step Noisy Label Mitigation [86.57572253460125]
ノイズラベルのトレーニング過程に対する有害な影響の軽減がますます重要になっている。
モデルに依存しないノイズラベル緩和パラダイムである1ステップアンチノイズ(OSA)を提案する。
我々はOSAの優位性を実証的に実証し、トレーニングの堅牢性の向上、タスク転送性の向上、デプロイメントの容易性、計算コストの削減を強調した。
論文 参考訳(メタデータ) (2024-10-02T18:42:56Z) - Towards Robust Continual Learning with Bayesian Adaptive Moment Regularization [51.34904967046097]
継続的な学習は、モデルが以前に学習した情報を忘れてしまう破滅的な忘れ込みの課題を克服しようとする。
本稿では,パラメータ成長の制約を緩和し,破滅的な忘れを減らし,新しい事前手法を提案する。
以上の結果から, BAdamは, 単頭クラスインクリメンタル実験に挑戦する先行手法に対して, 最先端の性能を達成できることが示唆された。
論文 参考訳(メタデータ) (2023-09-15T17:10:51Z) - Improve Noise Tolerance of Robust Loss via Noise-Awareness [60.34670515595074]
本稿では,NARL-Adjuster(NARL-Adjuster for brevity)と呼ばれる,ハイパーパラメータ予測関数を適応的に学習するメタラーニング手法を提案する。
4つのSOTAロバストな損失関数を我々のアルゴリズムに統合し,提案手法の一般性および性能をノイズ耐性と性能の両面で検証した。
論文 参考訳(メタデータ) (2023-01-18T04:54:58Z) - Robust Semantic Communications with Masked VQ-VAE Enabled Codebook [56.63571713657059]
本稿では,ロバストなエンドツーエンドのセマンティック通信システムにおいて,セマンティックノイズに対処するためのフレームワークを提案する。
セマンティックノイズに対処するため、重み付き対向トレーニングを開発し、トレーニングデータセットにセマンティックノイズを組み込む。
ノイズやタスク非関連の特徴を抑える機能重要モジュール (FIM) を開発した。
論文 参考訳(メタデータ) (2022-06-08T16:58:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。