論文の概要: PhysCodeBench: Benchmarking Physics-Aware Symbolic Simulation of 3D Scenes via Self-Corrective Multi-Agent Refinement
- arxiv url: http://arxiv.org/abs/2604.23580v1
- Date: Sun, 26 Apr 2026 07:37:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-28 17:12:07.445017
- Title: PhysCodeBench: Benchmarking Physics-Aware Symbolic Simulation of 3D Scenes via Self-Corrective Multi-Agent Refinement
- Title(参考訳): PhysCodeBench: 自己補正型マルチエージェントリファインメントによる3次元シーンの物理認識シンボリックシミュレーションのベンチマーク
- Authors: Tianyidan Xie, Peiyu Wang, Yuyi Qian, Yuxuan Wang, Rui Ma, Ying Tai, Song Wu, Qian Wang, Lanjun Wang, Zili Yi,
- Abstract要約: 物理を意識した3Dシーンのシンボルシミュレーションは、ロボット工学、AI、科学計算に不可欠である。
我々はPhysCodeBenchを紹介した。PhysCodeBenchは物理学を意識したシンボリックシミュレーションを評価するための、最初の総合的なベンチマークである。
評価フレームワークは、自動的および視覚的評価により、コード実行可能性と身体的精度の両方を測定する。
- 参考スコア(独自算出の注目度): 35.63080643326192
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Physics-aware symbolic simulation of 3D scenes is critical for robotics, embodied AI, and scientific computing, requiring models to understand natural language descriptions of physical phenomena and translate them into executable simulation environments. While large language models (LLMs) excel at general code generation, they struggle with the semantic gap between physical descriptions and simulation implementation. We introduce PhysCodeBench, the first comprehensive benchmark for evaluating physics-aware symbolic simulation, comprising 700 manually-crafted diverse samples across mechanics, fluid dynamics, and soft-body physics with expert annotations. Our evaluation framework measures both code executability and physical accuracy through automated and visual assessment. Building on this, we propose a Self-Corrective Multi-Agent Refinement Framework (SMRF) with three specialized agents (simulation generator, error corrector, and simulation refiner) that collaborate iteratively with domain-specific validation to produce physically accurate simulations. SMRF achieves 67.7 points overall performance compared to 36.3 points for the best baseline among evaluated SOTA models, representing a 31.4-point improvement. Our analysis demonstrates that error correction is critical for accurate physics-aware symbolic simulation and that specialized multi-agent approaches significantly outperform single-agent methods across the tested physical domains.
- Abstract(参考訳): 物理を意識した3Dシーンの記号シミュレーションは、ロボット工学、AI、科学計算において重要であり、物理現象の自然言語記述を理解し、それらを実行可能なシミュレーション環境に変換する必要がある。
大きな言語モデル(LLM)は一般的なコード生成に優れていますが、物理的記述とシミュレーション実装の間の意味的なギャップに苦労しています。
我々はPhysCodeBenchを紹介した。PhysCodeBenchは、機械力学、流体力学、ソフトボディ物理の700個の手作業で作成した多様なサンプルを専門家のアノテーションで評価する、物理学を意識した記号シミュレーションの最初の包括的なベンチマークである。
評価フレームワークは、自動的および視覚的評価により、コード実行可能性と身体的精度の両方を測定する。
そこで本研究では, 3つの特殊エージェント(シミュレーションジェネレータ, エラー修正器, シミュレーション精錬器)を用いた自己補正型マルチエージェント精錬フレームワーク(SMRF)を提案する。
SMRFは、評価されたSOTAモデルの中で最高のベースラインに対して36.3ポイントに対して67.7ポイントの全体的なパフォーマンスを達成し、31.4ポイントの改善を示している。
解析により, 誤差補正は物理を意識した記号シミュレーションにおいて重要であり, 特殊マルチエージェントアプローチは, 試験された物理領域における単一エージェント法よりも有意に優れていることが示された。
関連論文リスト
- Perceptual Self-Reflection in Agentic Physics Simulation Code Generation [0.0]
本稿では,自然言語記述から物理シミュレーションコードを生成するフレームワークを提案する。
主要なイノベーションは知覚的検証であり、視覚能力のある言語モデルを使用してレンダリングされたアニメーションフレームを分析する。
本研究では, 古典力学, 流体力学, 熱力学, 電磁学, 波動物理学, 反応拡散系, 非物理データ可視化を含む7分野にわたるシステム評価を行った。
論文 参考訳(メタデータ) (2026-02-12T15:48:33Z) - SimuScene: Training and Benchmarking Code Generation to Simulate Physical Scenarios [71.65387146697319]
大規模言語モデル(LLM)は、数学の競争、複雑なコーディング、科学的推論といったタスクのために広く研究されている。
物理シナリオをシミュレートしてLLMを訓練し,評価する最初の体系的な研究であるSimuSceneを提案する。
品質を保証するために、人間の検証とともに、データ収集のための自動パイプラインを構築します。
論文 参考訳(メタデータ) (2026-02-11T13:26:02Z) - URDF-Anything: Constructing Articulated Objects with 3D Multimodal Language Model [76.08429266631823]
3次元マルチモーダル大言語モデル(MLLM)に基づくエンドツーエンドの自動再構築フレームワークを提案する。
URDF-Anythingは、ポイントクラウドとテキストマルチモーダル入力に基づく自己回帰予測フレームワークを使用して、幾何学的セグメンテーションと運動論的パラメータ予測を協調的に最適化する。
シミュレーションと実世界の両方のデータセットの実験は、我々の手法が既存の手法よりも大幅に優れていることを示した。
論文 参考訳(メタデータ) (2025-11-02T13:45:51Z) - Scan, Materialize, Simulate: A Generalizable Framework for Physically Grounded Robot Planning [16.193477346643295]
Scan, Materialize, Simulate (SMS) は,正確なシーン再構成のための3次元ガウススプラッティング,セマンティックセグメンテーションのための視覚基盤モデル,物質特性推定のための視覚言語モデル,アクション結果の信頼性予測のための物理シミュレーションを組み合わせた統合フレームワークである。
本研究は,シーン再構築のための異種レンダリング,セマンティック理解のための基礎モデル,物理に基づくシミュレーションにより,多様な環境にまたがる物理的基盤を持つロボット計画を実現する可能性を強調した。
論文 参考訳(メタデータ) (2025-05-20T21:55:01Z) - GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - GaussianProperty: Integrating Physical Properties to 3D Gaussians with LMMs [21.3615403516602]
視覚データに対する物理的特性の推定は、コンピュータビジョン、グラフィックス、ロボット工学において重要な課題である。
教材の物理的特性を3Dガウスアンに割り当てる学習自由フレームワークであるガウスプロパティを紹介する。
物理特性アノテーションを持つ3次元ガウスアンが物理に基づく動的シミュレーションやロボットグルーピングに応用できることを実証する。
論文 参考訳(メタデータ) (2024-12-15T17:44:10Z) - Efficient Physics Simulation for 3D Scenes via MLLM-Guided Gaussian Splatting [32.846428862045634]
Sim Anythingは、静的な3Dオブジェクトにインタラクティブなダイナミクスを与える物理ベースのアプローチである。
人間の視覚的推論に触発されて,MLLMに基づく物理特性知覚を提案する。
また、物理幾何学的適応サンプリングを用いて粒子をサンプリングして、オープンワールドシーンでオブジェクトをシミュレートする。
論文 参考訳(メタデータ) (2024-11-19T12:52:21Z) - DeepSimHO: Stable Pose Estimation for Hand-Object Interaction via
Physics Simulation [81.11585774044848]
我々は、前方物理シミュレーションと後方勾配近似とニューラルネットワークを組み合わせた新しいディープラーニングパイプラインであるDeepSimHOを紹介する。
提案手法は, 評価の安定性を著しく向上し, テスト時間最適化よりも優れた効率性を実現する。
論文 参考訳(メタデータ) (2023-10-11T05:34:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。