論文の概要: PhysScene: A Scene Graph Dataset for Scientific Visual Reasoning in Physics Experiments
- arxiv url: http://arxiv.org/abs/2606.09368v1
- Date: Mon, 08 Jun 2026 11:40:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-09 14:42:06.949427
- Title: PhysScene: A Scene Graph Dataset for Scientific Visual Reasoning in Physics Experiments
- Title(参考訳): PhysScene:物理実験における科学的ビジュアル推論のためのグラフデータセット
- Authors: Minghao Zou, Qingtian Zeng, Shangkun Liu, Yanda Meng, Guanghui Yue, Baoquan Zhao, Abdulmotaleb El Saddik, Wei Zhou,
- Abstract要約: SG(Scene Graphs)は、オブジェクトとそのペア関係をモデル化することで、視覚的なシーンの構造化された表現を提供する。
PhysSceneは物理実験に適した最初のSGデータセットである。
PhysSceneは、特殊な機器、構造化された実験装置、実験環境に固有の機能的関係を含んでいる。
- 参考スコア(独自算出の注目度): 37.632499627458714
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Scene Graphs (SGs) provide structured representations of visual scenes by modeling objects and their pairwise relationships. Despite recent progress, existing datasets primarily focus on generic natural contexts, leaving domain-specific and function-oriented scenes largely underexplored. This limitation restricts the evaluation of relational reasoning in scientific experimental scenes, thereby hindering the development of intelligent monitoring, analysis, and related applications in such scenes. To address this gap, we introduce PhysScene, the first SG dataset tailored to physics experiments. PhysScene encompasses specialized instruments, structured experimental setups, and functional relations intrinsic to experimental environments, enabling reasoning that extends beyond spatial co-occurrence to logical dependencies. Rather than pursuing large data scale, PhysScene focuses on strong semantic constraints and high relation density in experimental scenes, posing new challenges for existing scene parsing algorithms while offering opportunities for further improvements. Extensive analyses and experiments show that PhysScene complements existing benchmarks and establishes a valuable testbed for advancing scientific visual reasoning. The dataset is publicly available at https://github.com/ZMH-SDUST/PhysScene.
- Abstract(参考訳): SG(Scene Graphs)は、オブジェクトとそのペア関係をモデル化することで、視覚的なシーンの構造化された表現を提供する。
最近の進歩にもかかわらず、既存のデータセットは主に汎用的な自然コンテキストに焦点を当てており、ドメイン固有の機能指向のシーンはほとんど探索されていない。
この制限は、科学的実験シーンにおける関係推論の評価を制限するため、このようなシーンにおけるインテリジェントなモニタリング、分析、および関連するアプリケーションの開発を妨げる。
このギャップに対処するために、物理実験に適した最初のSGデータセットであるPhysSceneを紹介します。
PhysSceneは、特別な機器、構造化された実験装置、実験環境に固有の機能的関係を含み、空間的共起から論理的依存関係まで及ぶ推論を可能にする。
大規模なデータスケールを追求する代わりに、PhysSceneでは、実験シーンにおける強いセマンティック制約と高い関係密度に注目し、既存のシーン解析アルゴリズムに新たな課題を提起し、さらなる改善の機会を提供する。
大規模な分析と実験により、PhysSceneは既存のベンチマークを補完し、科学的な視覚的推論を促進するための貴重なテストベッドを確立することが示されている。
データセットはhttps://github.com/ZMH-SDUST/PhysSceneで公開されている。
関連論文リスト
- The Perception-Physics Paradox: Probing Scientific Alignment with TC-Bench [30.054788656949636]
科学領域における表現学習の暗黙的な目的として科学的アライメントを導入する。
我々は、構造的同型性を通して、科学的アライメントの原則的かつ検証可能な側面を研究する。
熱帯サイクロン研究のための自動構築パイプラインを備えた,グローバルで再現可能なベンチマークデータセットであるTC-Benchをリリースする。
論文 参考訳(メタデータ) (2026-05-23T23:51:19Z) - PhyScensis: Physics-Augmented LLM Agents for Complex Physical Scene Arrangement [89.35154754765502]
PhyScensisは物理エンジンを動力とするエージェントベースのフレームワークで、物理的に可視なシーン構成を生成する。
本フレームワークは,微粒なテキスト記述や数値パラメータに対する強い制御性を保っている。
実験の結果,本手法はシーンの複雑さ,視覚的品質,身体的精度において,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2026-02-16T17:55:25Z) - PhysLab: A Benchmark Dataset for Multi-Granularity Visual Parsing of Physics Experiments [16.800647681719045]
我々は、複雑な物理実験を行う学生をキャプチャする最初のビデオデータセットであるPhysLabを紹介した。
このデータセットには4つの代表的な実験が含まれており、多様な科学機器と豊かな人間と物体の相互作用(HOI)パターンが特徴である。
PhysLabは620の長ビデオで構成され、さまざまなビジョンタスクをサポートするマルチレベルアノテーションを提供する。
論文 参考訳(メタデータ) (2025-06-07T02:28:24Z) - PhysGaia: A Physics-Aware Dataset of Multi-Body Interactions for Dynamic Novel View Synthesis [62.283499219361595]
PhysGaiaは動的ノベルビュー合成(DyNVS)のために設計された物理対応のデータセットである。
私たちのデータセットは、複数のオブジェクト間のリッチな相互作用を伴う複雑な動的シナリオを提供します。
PhysGaiaは、動的ビュー合成、物理に基づくシーン理解、および物理シミュレーションと統合されたディープラーニングモデルの研究を著しく前進させる。
論文 参考訳(メタデータ) (2025-06-03T12:19:18Z) - LLM and Simulation as Bilevel Optimizers: A New Paradigm to Advance Physical Scientific Discovery [141.39722070734737]
本稿では,大規模言語モデルの知識駆動型抽象推論能力をシミュレーションの計算力で強化することを提案する。
本稿では,2段階最適化フレームワークであるSGA(Scientific Generative Agent)を紹介する。
法発見と分子設計における枠組みの有効性を実証するための実験を行った。
論文 参考訳(メタデータ) (2024-05-16T03:04:10Z) - X-VoE: Measuring eXplanatory Violation of Expectation in Physical Events [75.94926117990435]
本研究では,AIエージェントによる直感的な物理の把握を評価するベンチマークデータセットであるX-VoEを紹介する。
X-VoEは直感的な物理モデルの説明能力を高めるためのより高いバーを確立する。
本稿では、物理力学を捉え、隠蔽対象状態を推定する説明に基づく学習システムを提案する。
論文 参考訳(メタデータ) (2023-08-21T03:28:23Z) - Learning dynamics from partial observations with structured neural ODEs [5.757156314867639]
本稿では,ニューラルODEに基づくシステム識別に関する幅広い物理的知見を取り入れたフレキシブルなフレームワークを提案する。
本稿では,ロボット外骨格を用いた数値シミュレーションおよび実験データセットにおける提案手法の性能について述べる。
論文 参考訳(メタデータ) (2022-05-25T07:54:10Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。