論文の概要: RealPDEBench: A Benchmark for Complex Physical Systems with Real-World Data
- arxiv url: http://arxiv.org/abs/2601.01829v1
- Date: Mon, 05 Jan 2026 06:49:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:22.823031
- Title: RealPDEBench: A Benchmark for Complex Physical Systems with Real-World Data
- Title(参考訳): RealPDEBench: 実世界データを用いた複雑な物理システムのベンチマーク
- Authors: Peiyan Hu, Haodong Feng, Hongyuan Liu, Tongtong Yan, Wenhao Deng, Tianrun Gao, Rong Zheng, Haoren Zheng, Chenglei Yu, Chuanrui Wang, Kaiwen Li, Zhi-Ming Ma, Dezhi Zhou, Xingcai Lu, Dixia Fan, Tailin Wu,
- Abstract要約: 本稿では,実世界計測とペア数値シミュレーションを統合した科学機械学習(ML)の最初のベンチマークであるRealPDEBenchを紹介する。
RealPDEBenchは5つのデータセット、3つのタスク、8つのメトリクス、10のベースラインで構成される。
実験では、シミュレーションデータと実世界のデータの間に大きな相違点が示され、シミュレーションデータによる事前学習は、精度と収束性の両方を一貫して改善することを示した。
- 参考スコア(独自算出の注目度): 25.53943767088309
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Predicting the evolution of complex physical systems remains a central problem in science and engineering. Despite rapid progress in scientific Machine Learning (ML) models, a critical bottleneck is the lack of expensive real-world data, resulting in most current models being trained and validated on simulated data. Beyond limiting the development and evaluation of scientific ML, this gap also hinders research into essential tasks such as sim-to-real transfer. We introduce RealPDEBench, the first benchmark for scientific ML that integrates real-world measurements with paired numerical simulations. RealPDEBench consists of five datasets, three tasks, eight metrics, and ten baselines. We first present five real-world measured datasets with paired simulated datasets across different complex physical systems. We further define three tasks, which allow comparisons between real-world and simulated data, and facilitate the development of methods to bridge the two. Moreover, we design eight evaluation metrics, spanning data-oriented and physics-oriented metrics, and finally benchmark ten representative baselines, including state-of-the-art models, pretrained PDE foundation models, and a traditional method. Experiments reveal significant discrepancies between simulated and real-world data, while showing that pretraining with simulated data consistently improves both accuracy and convergence. In this work, we hope to provide insights from real-world data, advancing scientific ML toward bridging the sim-to-real gap and real-world deployment. Our benchmark, datasets, and instructions are available at https://realpdebench.github.io/.
- Abstract(参考訳): 複雑な物理システムの進化を予測することは、科学と工学の中心的な問題である。
科学機械学習(ML)モデルの急速な進歩にもかかわらず、重要なボトルネックは、高価な実世界のデータが不足していることであり、その結果、ほとんどの現在のモデルは、シミュレートされたデータに基づいてトレーニングされ、検証される。
科学MLの開発と評価の制限に加えて、このギャップはsim-to-realトランスファーのような本質的なタスクの研究を妨げる。
本稿では,実世界の実測値とペア数値シミュレーションを統合した科学MLの最初のベンチマークであるRealPDEBenchを紹介する。
RealPDEBenchは5つのデータセット、3つのタスク、8つのメトリクス、10のベースラインで構成される。
まず、異なる複雑な物理システムにまたがって、ペア化されたシミュレーションデータセットを用いて、実世界の5つのデータセットを提示する。
さらに,実世界とシミュレーションデータの比較を可能にする3つのタスクを定義し,その2つをブリッジする手法の開発を容易にする。
さらに、データ指向および物理指向のメトリクスにまたがる8つの評価指標を設計し、最後に、最先端モデル、事前訓練されたPDE基礎モデル、従来の方法を含む10の代表的なベースラインをベンチマークする。
実験では、シミュレーションデータと実世界のデータの間に大きな相違点が示され、シミュレーションデータによる事前学習は、精度と収束性の両方を一貫して改善することを示した。
この研究では、実世界のデータから洞察を提供し、科学的なMLを実践し、シミュレーションから現実へのギャップと実世界の展開を橋渡ししたいと考えています。
ベンチマーク、データセット、インストラクションはhttps://realpdebench.github.io/.com/で公開されています。
関連論文リスト
- HD-GEN: A High-Performance Software System for Human Mobility Data Generation Based on Patterns of Life [1.9739979974462676]
大規模な個人レベルの人体移動データセットの校正、生成、処理、可視化のための包括的ソフトウェアパイプラインを導入する。
データ生成エンジンは、OpenStreetMapデータを用いて地理的に接地されたシミュレーションを構築する。
遺伝的アルゴリズムに基づくキャリブレーションモジュールの微調整パラメータは、実世界の移動特性に適合する。
データ処理スイートは、生のシミュレーションログを下流アプリケーションに適した構造化フォーマットに変換する。
論文 参考訳(メタデータ) (2026-01-03T16:01:00Z) - SimBench: Benchmarking the Ability of Large Language Models to Simulate Human Behaviors [58.87134689752605]
我々は,LLMシミュレーションの堅牢で再現可能な科学のための,最初の大規模標準ベンチマークであるSimBenchを紹介する。
現在、最高のLLMでさえシミュレーション能力が限られ(スコア: 40.80/100)、性能はモデルサイズと対数的にスケールする。
シミュレーション能力は、深い知識集約的推論と最も強く相関していることを示す。
論文 参考訳(メタデータ) (2025-10-20T13:14:38Z) - High-Fidelity Digital Twins for Bridging the Sim2Real Gap in LiDAR-Based ITS Perception [3.1508266388327324]
本稿では,実世界の背景形状,レーンレベルの道路トポロジ,センサ固有の仕様と配置を組み込んだ高忠実なディジタルツイン(HiFi DT)フレームワークを提案する。
実験の結果、DT訓練モデルでは、実際のデータでトレーニングされた同等のモデルを4.8%上回る結果が得られた。
論文 参考訳(メタデータ) (2025-09-03T00:12:58Z) - Physics-Learning AI Datamodel (PLAID) datasets: a collection of physics simulations for machine learning [0.15469999759898032]
PLAIDは物理シミュレーションのデータセットを表現および共有するためのフレームワークである。
PLAIDはシミュレーションデータを記述するための統一標準を定義する。
PLAID標準の下で,構造力学と計算流体力学を網羅した6つのデータセットをリリースする。
論文 参考訳(メタデータ) (2025-05-05T18:59:17Z) - GausSim: Foreseeing Reality by Gaussian Simulator for Elastic Objects [55.02281855589641]
GausSimは、ガウスカーネルを通して表現される現実の弾性物体の動的挙動をキャプチャするために設計された、ニューラルネットワークベースの新しいシミュレータである。
我々は連続体力学を活用し、各カーネルを連続体を表すCenter of Mass System (CMS)として扱う。
さらに、ガウスシムは質量や運動量保存のような明示的な物理制約を取り入れ、解釈可能な結果と堅牢で物理的に妥当なシミュレーションを確実にする。
論文 参考訳(メタデータ) (2024-12-23T18:58:17Z) - MBDS: A Multi-Body Dynamics Simulation Dataset for Graph Networks Simulators [4.5353840616537555]
物理現象をモデル化する主要な手法として,グラフネットワークシミュレータ (GNS) が登場している。
我々は,1D,2D,3Dシーンを含む高品質な物理シミュレーションデータセットを構築した。
私たちのデータセットの重要な特徴は、物理世界のより現実的なシミュレーションを促進する、正確な多体ダイナミクスを取り入れることである。
論文 参考訳(メタデータ) (2024-10-04T03:03:06Z) - Waymax: An Accelerated, Data-Driven Simulator for Large-Scale Autonomous
Driving Research [76.93956925360638]
Waymaxは、マルチエージェントシーンにおける自動運転のための新しいデータ駆動シミュレータである。
TPU/GPUなどのハードウェアアクセラレータで完全に動作し、トレーニング用のグラフ内シミュレーションをサポートする。
我々は、一般的な模倣と強化学習アルゴリズムのスイートをベンチマークし、異なる設計決定に関するアブレーション研究を行った。
論文 参考訳(メタデータ) (2023-10-12T20:49:15Z) - Quantifying the LiDAR Sim-to-Real Domain Shift: A Detailed Investigation
Using Object Detectors and Analyzing Point Clouds at Target-Level [1.1999555634662635]
自律運転のためのニューラルネットワークに基づくLiDARオブジェクト検出アルゴリズムは、トレーニング、検証、テストのために大量のデータを必要とする。
ニューラルネットワークのトレーニングにシミュレーションデータを使用することで、シーン、シナリオ、分布の違いによるトレーニングデータとテストデータのドメインシフトが生じることを示す。
論文 参考訳(メタデータ) (2023-03-03T12:52:01Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。