論文の概要: PhysAgent: Automating Physics-Based 4D Synthesis via Trajectory-Grounded Multi-Agent Feedback
- arxiv url: http://arxiv.org/abs/2606.08688v1
- Date: Sun, 07 Jun 2026 15:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.391724
- Title: PhysAgent: Automating Physics-Based 4D Synthesis via Trajectory-Grounded Multi-Agent Feedback
- Title(参考訳): PhysAgent: 軌道周囲のマルチエージェントフィードバックによる物理に基づく4次元合成の自動化
- Authors: Chunji Lv, Jiaxi Ye, Yuchen Jiang, Rexar Lin, Changsheng Li,
- Abstract要約: PhysAgentは、自動で物理的に接地された4D合成のためのシミュレーター・イン・ザ・ループのマルチエージェントフレームワークである。
任意のマルチモーダルプロンプトから安定した多様な物理シーンを生成し、生成の多様性と物理的精度の両方において既存のベースラインを著しく上回っている。
- 参考スコア(独自算出の注目度): 20.18865007569388
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Achieving fully automated, physically plausible 3D motion synthesis is a core objective in graphics and generative AI. However, configuring complex environmental force fields still relies entirely on manual expert intervention, creating a severe bottleneck for large-scale simulation data generation. Existing automated methods primarily focus on material optimization and exhibit severe modality gaps and technical flaws when applied to the vastly more complex force field optimization space: naive Large Language Models (LLMs) lack underlying simulation feedback, causing severe physical inaccuracies, while traditional Score Distillation Sampling (SDS) suffers from sluggish gradients, local optima entrapment, and a mathematical inability to dynamically switch discrete force fields. To address this, we propose PhysAgent, the first simulator-in-the-loop multi-agent framework that leverages multimodal inputs for automated, physically grounded 4D synthesis. By decoupling intrinsic materials from extrinsic dynamics, PhysAgent utilizes a Semantic Agent equipped with an externalized Force Field Skill module to master simulation rules and generate valid initializations. Subsequently, the Refine Agents, driven by Trajectory-Grounded Multi-Agent Feedback, leverage vision foundation models to extract dense point trajectories from rendered frames. By converting these explicit motion trajectories into structured textual descriptors, the agent harnesses LLM commonsense reasoning to execute zero-shot macroscopic leaps, effectively escaping local optima and dynamically switching discrete force fields. Extensive experiments demonstrate that PhysAgent rapidly generates stable, diverse physical scenes from arbitrary multimodal prompts, significantly outperforming existing baselines in both generation diversity and physical accuracy.
- Abstract(参考訳): 完全に自動化され、物理的に妥当な3Dモーション合成を実現することは、グラフィックスと生成AIの中核的な目的である。
しかし、複雑な環境力場の設定は依然として手作業による介入に完全に依存しており、大規模なシミュレーションデータ生成の重大なボトルネックを生み出している。
単純大言語モデル(LLM)は、シミュレーションのフィードバックを欠き、深刻な物理的不正確性を引き起こし、従来のスコア蒸留サンプリング(SDS)は、ゆるい勾配、局所最適エントラップメント、そして、離散力場を動的に切り替える数学的に不可能である。
そこで我々はPhysAgentを提案する。PhysAgentは、マルチモーダル入力を応用して、自動で物理的に基底化された4D合成を行う最初のシミュレータ・イン・ザ・ループ型マルチエージェントフレームワークである。
固有材料を外在力学から切り離すことにより、PhysAgentは外部の力場スキルモジュールを備えたセマンティックエージェントを使用してシミュレーションルールをマスターし、有効な初期化を生成する。
その後、Trajectory-Grounded Multi-Agent Feedbackによって駆動されるRefine Agentsは、視覚基盤モデルを利用してレンダリングフレームから高密度な点軌跡を抽出する。
これらの明示的な運動軌跡を構造化されたテキスト記述子に変換することで、エージェントはLLMコモンセンス推論を利用してゼロショットマクロジャンプを実行し、局所最適を効果的に逃がし、離散力場を動的に切り替える。
大規模な実験により、PhysAgentは任意のマルチモーダルプロンプトから、安定で多様な物理的シーンを迅速に生成し、生成の多様性と物理的精度の両方において、既存のベースラインを著しく上回っていることが示されている。
関連論文リスト
- PhyCo: Learning Controllable Physical Priors for Generative Motion [55.59209981836171]
本稿では,ビデオ生成に連続的,解釈可能,物理的に接地された制御を導入するフレームワークであるPhyCoを紹介する。
i) 摩擦, 再構成, 変形, 力が様々なシナリオで体系的に変化する100K以上のフォトリアリスティック・シミュレーション・ビデオの大規模データセット, (ii) 物理制御された拡散モデルの微調整, (iii) VLM誘導報酬最適化, 微調整された視覚言語モデルにより、対象とする物理クエリを用いて生成されたビデオを評価し、異なるフィードバックを提供する。
論文 参考訳(メタデータ) (2026-04-30T17:53:03Z) - Resonance4D: Frequency-Domain Motion Supervision for Preset-Free Physical Parameter Learning in 4D Dynamic Physical Scene Simulation [53.141181758015186]
Resonance4Dは3次元ガウス散乱と物質点法を結合した物理駆動4次元動的シミュレーションフレームワークである。
我々の重要な洞察は、動的整合性は、相補的領域における共同的拘束運動によって、高密度時間発生なしに強制できるということである。
Resonance4Dは、ピークGPUメモリを35,GB以上から20GB程度に削減しつつ、強力な物理忠実性と運動の整合性を実現する。
論文 参考訳(メタデータ) (2026-04-02T13:00:22Z) - RoboForge: Physically Optimized Text-guided Whole-Body Locomotion for Humanoids [20.796118584632904]
自然言語と全身移動を橋渡しする統合潜在駆動型フレームワークを提案する。
我々のフレームワークは、テキスト誘導型ヒューマノイドインテリジェンスをデプロイするための実践的なパスを提供する。
論文 参考訳(メタデータ) (2026-03-18T17:02:56Z) - Physically Accurate Rigid-Body Dynamics in Particle-Based Simulation [38.44669833143752]
粒子ベースのシミュレータは、現在のシミュレータに代わる魅力的な代替手段を提供する。
位置ベース力学(PBD)は、その計算効率と視覚的可視性で有名な解法である。
物理的に正確な剛体力学を強制する PBD-R を改訂した PBD-R を導入する。
論文 参考訳(メタデータ) (2026-03-15T22:09:42Z) - MotionAnymesh: Physics-Grounded Articulation for Simulation-Ready Digital Twins [25.25391483526521]
MotionAnymeshは、非構造化の静的メッシュをシミュレーション可能なデジタルツインにシームレスに変換するフレームワークである。
提案手法は, VLM推論をSP4D物理先行値で根拠とした運動認識部分分割モジュールを特徴とする。
論文 参考訳(メタデータ) (2026-03-13T12:30:42Z) - D-REX: Differentiable Real-to-Sim-to-Real Engine for Learning Dexterous Grasping [66.22412592525369]
本稿では,ガウスのSplat表現を生かした実--sim-to-realエンジンを導入し,実-sim-to-realエンジンについて述べる。
提案エンジンは, 各種物体の形状と質量値のマス識別において, 高精度かつロバストな性能を実現していることを示す。
これらの最適化された質量値は、力覚的なポリシー学習を促進し、オブジェクトの把握において優れた、高いパフォーマンスを達成する。
論文 参考訳(メタデータ) (2026-03-01T15:32:04Z) - FastPhysGS: Accelerating Physics-based Dynamic 3DGS Simulation via Interior Completion and Adaptive Optimization [56.17833729527066]
我々は物理に基づく動的3DGSシミュレーションのためのフレームワークであるFastPhysGSを提案する。
FastPhysGSは、わずか7GBのランタイムメモリを使用して、1分で高忠実度物理シミュレーションを実現する。
論文 参考訳(メタデータ) (2026-02-02T07:00:42Z) - URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model [76.08429266631823]
3次元マルチモーダル大言語モデル(MLLM)に基づくエンドツーエンドの自動再構築フレームワークを提案する。
URDF-Anythingは、ポイントクラウドとテキストマルチモーダル入力に基づく自己回帰予測フレームワークを使用して、幾何学的セグメンテーションと運動論的パラメータ予測を協調的に最適化する。
シミュレーションと実世界の両方のデータセットの実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2025-11-02T13:45:51Z) - PhyMAGIC: Physical Motion-Aware Generative Inference with Confidence-guided LLM [17.554471769834453]
一つの画像から物理的に一貫した動きを生成するトレーニング不要のフレームワークであるPhyMAGICを提案する。
PhyMAGICは、事前訓練された画像間拡散モデル、LDMによる信頼誘導推論、微分可能な物理シミュレータを統合する。
総合的な実験により、PhyMAGICは最先端のビデオジェネレータや物理対応のベースラインより優れていることが示された。
論文 参考訳(メタデータ) (2025-05-22T09:40:34Z) - PlasticineLab: A Soft-Body Manipulation Benchmark with Differentiable
Physics [89.81550748680245]
PasticineLabと呼ばれる新しい微分可能な物理ベンチマークを導入する。
各タスクにおいて、エージェントはマニピュレータを使用して、プラスチックを所望の構成に変形させる。
本稿では,既存の強化学習(RL)手法と勾配に基づく手法について評価する。
論文 参考訳(メタデータ) (2021-04-07T17:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。