論文の概要: Runtime Failure Hunting for Physics Engine Based Software Systems: How Far Can We Go?
- arxiv url: http://arxiv.org/abs/2507.22099v1
- Date: Tue, 29 Jul 2025 17:58:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-31 16:14:17.772909
- Title: Runtime Failure Hunting for Physics Engine Based Software Systems: How Far Can We Go?
- Title(参考訳): 物理エンジンベースのソフトウェアシステムのための実行時フェールハンティング:どこまで進めばいいのか?
- Authors: Shuqing Li, Qiang Chen, Xiaoxue Ren, Michael R. Lyu,
- Abstract要約: 物理エンジン(英: Physics Engines、PE)は、エンターテイメントから安全クリティカルシステムまで、様々なアプリケーションにおける物理的な相互作用をシミュレートする基本的なソフトウェアフレームワークである。
PEは、物理障害、ソフトウェアの信頼性を損なう、ユーザエクスペリエンスを低下させ、自動運転車や医療ロボティクスに重大な障害を引き起こす可能性のある、予想される物理的行動からの逸脱に悩まされる。
本稿では,PEソフトウェアにおける物理障害を特徴付ける大規模な実証的研究について述べる。
- 参考スコア(独自算出の注目度): 32.20899533556529
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physics Engines (PEs) are fundamental software frameworks that simulate physical interactions in applications ranging from entertainment to safety-critical systems. Despite their importance, PEs suffer from physics failures, deviations from expected physical behaviors that can compromise software reliability, degrade user experience, and potentially cause critical failures in autonomous vehicles or medical robotics. Current testing approaches for PE-based software are inadequate, typically requiring white-box access and focusing on crash detection rather than semantically complex physics failures. This paper presents the first large-scale empirical study characterizing physics failures in PE-based software. We investigate three research questions addressing the manifestations of physics failures, the effectiveness of detection techniques, and developer perceptions of current detection practices. Our contributions include: (1) a taxonomy of physics failure manifestations; (2) a comprehensive evaluation of detection methods including deep learning, prompt-based techniques, and large multimodal models; and (3) actionable insights from developer experiences for improving detection approaches. To support future research, we release PhysiXFails, code, and other materials at https://sites.google.com/view/physics-failure-detection.
- Abstract(参考訳): 物理エンジン(英: Physics Engines、PE)は、エンターテイメントから安全クリティカルシステムまで、様々なアプリケーションにおける物理的な相互作用をシミュレートする基本的なソフトウェアフレームワークである。
その重要性にもかかわらず、PEは物理学的な失敗、ソフトウェアの信頼性を損なう、ユーザーエクスペリエンスを低下させ、自動運転車や医療ロボティクスに重大な障害を引き起こす可能性のある物理的行動からの逸脱に悩まされている。
PEベースのソフトウェアに対する現在のテストアプローチは不十分で、一般的にはホワイトボックスアクセスを必要とし、セマンティックに複雑な物理障害ではなくクラッシュ検出に重点を置いている。
本稿では,PEソフトウェアにおける物理障害を特徴付ける大規模な実証的研究について述べる。
本研究は,物理障害の顕在化,検出技術の有効性,現在の検出プラクティスに対する開発者の認識に関する3つの研究課題について考察する。
本研究は,(1)物理障害の分類,(2)深層学習,プロンプトベース技術,大規模マルチモーダルモデルを含む検出手法の包括的評価,(3)開発者エクスペリエンスから得られる実践的洞察から,検出アプローチを改善する。
将来の研究を支援するため、https://sites.google.com/view/physics-failure-detectionでPhysicalXFails、コード、その他の材料をリリースする。
関連論文リスト
- PhysUniBench: An Undergraduate-Level Physics Reasoning Benchmark for Multimodal Models [69.73115077227969]
大規模言語モデル(MLLM)の推論能力の評価と改善を目的とした大規模ベンチマークであるPhysUniBenchを提案する。
PhysUniBenchは、3,304の物理問題から成っている。
ベンチマークの構成には、複数のロールアウト、専門家レベルの評価、解決が容易な問題の自動フィルタリング、そして5段階の難易度グレーディングシステムを含む、厳格な多段階プロセスが含まれていた。
論文 参考訳(メタデータ) (2025-06-21T09:55:42Z) - Can Theoretical Physics Research Benefit from Language Agents? [50.57057488167844]
大規模言語モデル(LLM)は、様々な領域にわたって急速に進歩しているが、理論物理学研究への応用はまだ成熟していない。
このポジションペーパーは、LLMエージェントが、ドメイン知識やツールボックスと適切に統合された場合、理論的、計算的、応用物理学を加速するのに役立つと主張している。
マルチモーダルデータを処理し、検証可能な仮説を提案し、設計実験を行う物理特殊化LSMを構想する。
論文 参考訳(メタデータ) (2025-06-06T16:20:06Z) - Scaling Physical Reasoning with the PHYSICS Dataset [32.956687630330116]
PHYSICSは、被験者と難易度にまたがる16,568の高品質な物理問題を含むデータセットである。
力学、電磁気学、熱力学、光学、現代物理学の5つの分野を網羅している。
また、高校から大学院レベルの物理学コースまで幅広い難易度がある。
論文 参考訳(メタデータ) (2025-05-21T17:06:28Z) - Physics simulation capabilities of LLMs [0.0]
大規模言語モデル(LLM)は、学部レベルから大学院レベルの物理学教科書の問題を解くことができ、コーディングに精通している。
本稿では、PhDレベルから研究レベルの計算物理問題に対するSOTA (State-of-the-art) LLMの評価を行う。
論文 参考訳(メタデータ) (2023-12-04T18:06:41Z) - Physics-Guided Adversarial Machine Learning for Aircraft Systems
Simulation [9.978961706999833]
この研究は、物理誘導型逆機械学習(ML)という新しいアプローチを示し、モデルの物理一貫性に対する信頼性を向上させる。
2つの航空機システムの性能モデルに対する実証的な評価は、我々の敵MLアプローチの有効性を示している。
論文 参考訳(メタデータ) (2022-09-07T19:23:45Z) - Privacy-preserving machine learning with tensor networks [37.01494003138908]
テンソルネットワークアーキテクチャは、特にプライバシー保護機械学習に期待できる特性を持つことを示す。
まず、フィードフォワードニューラルネットワークに存在する新たなプライバシ脆弱性を説明し、それを合成および実世界のデータセットで説明する。
このような条件がテンソルネットワークアーキテクチャによって満たされていることを厳密に証明する。
論文 参考訳(メタデータ) (2022-02-24T19:04:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。