論文の概要: Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations
- arxiv url: http://arxiv.org/abs/2604.08863v1
- Date: Fri, 10 Apr 2026 01:52:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-13 17:57:53.63115
- Title: Hidden in Plain Sight: Visual-to-Symbolic Analytical Solution Inference from Field Visualizations
- Title(参考訳): プレーンな視点に隠れた:フィールド・ビジュアライゼーションからのビジュアル・シンボリック・アナリシス・ソリューション・推論
- Authors: Pengze Li, Jiaquan Zhang, Yunbo Long, Xinping Liu, Zhou wenjie, Encheng Su, Zihang Zeng, Jiaqi Liu, Jiyao Liu, Junchi Yu, Lihao Liu, Philip Torr, Shixiang Tang, Aoran Wang, Xi Chen,
- Abstract要約: 二次元線形定常場に対する視覚-記号型解析解推論(ViSA)について検討した。
我々は、ViSA-R2を導入し、それを自己検証、ソリューション中心のチェーン・オブ・思想パイプラインと整合させる。
また、30の線形定常状態シナリオをカバーするVLM対応の人工ベンチマークであるViSA-Benchをリリースする。
- 参考スコア(独自算出の注目度): 37.91491674261653
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recovering analytical solutions of physical fields from visual observations is a fundamental yet underexplored capability for AI-assisted scientific reasoning. We study visual-to-symbolic analytical solution inference (ViSA) for two-dimensional linear steady-state fields: given field visualizations (and first-order derivatives) plus minimal auxiliary metadata, the model must output a single executable SymPy expression with fully instantiated numeric constants. We introduce ViSA-R2 and align it with a self-verifying, solution-centric chain-of-thought pipeline that follows a physicist-like pathway: structural pattern recognition solution-family (ansatz) hypothesis parameter derivation consistency verification. We also release ViSA-Bench, a VLM-ready synthetic benchmark covering 30 linear steady-state scenarios with verifiable analytical/symbolic annotations, and evaluate predictions by numerical accuracy, expression-structure similarity, and character-level accuracy. Using an 8B open-weight Qwen3-VL backbone, ViSA-R2 outperforms strong open-source baselines and the evaluated closed-source frontier VLMs under a standardized protocol.
- Abstract(参考訳): 視覚的な観察から物理分野の分析的解を復元することは、AIによる科学推論の基礎的かつ未解明の能力である。
2次元線形定常場に対する視覚-記号型解析解推論 (ViSA) について検討する: 与えられたフィールドの可視化(および1次微分)と最小の補助メタデータにより、モデルは完全にインスタンス化された数値定数を持つ単一の実行可能なSymPy式を出力しなければならない。
我々は,ViSA-R2を導入し,このパイプラインを,構造パターン認識ソリューションファミリー(アンザッツ)仮説パラメータの導出整合性検証という,物理学者のような経路に従う自己検証型ソリューション中心のチェーン・オブ・思想パイプラインと整合させる。
また,検証可能な解析的・記号的アノテーションを用いた30の線形定常状態シナリオをカバーするVLM対応のベンチマークViSA-Benchをリリースし,数値的精度,表現構造的類似性,文字レベルの精度で予測を評価する。
8BのオープンウェイトなQwen3-VLバックボーンを使用して、ViSA-R2は強力なオープンソースベースラインと評価されたクローズドソースフロンティアVLMを標準化されたプロトコルで上回っている。
関連論文リスト
- Molecular Identifier Visual Prompt and Verifiable Reinforcement Learning for Chemical Reaction Diagram Parsing [52.825281124618535]
反応図解析(RxnDP)は、文献から化学合成情報を抽出するために重要である。
近年の視覚言語モデル(VLM)はこの複雑な視覚的推論タスクを自動化するための有望なパラダイムとして登場した。
この研究はVLMベースのRxnDPを2つの相補的視点、すなわち表現の促進と学習パラダイムから強化する。
論文 参考訳(メタデータ) (2026-03-16T09:17:05Z) - Analysis of Converged 3D Gaussian Splatting Solutions: Density Effects and Prediction Limit [26.560853188856342]
標準的な多視点最適化から3次元ガウススプラッティング(3DGS)の解にどのような構造が現れるかを検討する。
密度領域は、レンダリング不要な予測が可能な幾何学的関連パラメータを示し、スパース領域は体系的な失敗を示す。
点雲が十分である幾何学的プリミティブと、多視点制約が不可欠であるビュー合成プリミティブである。
論文 参考訳(メタデータ) (2026-02-09T17:09:08Z) - The Vekua Layer: Exact Physical Priors for Implicit Neural Representations via Generalized Analytic Functions [0.0]
Inlicit Neural Representations (INR)は、物理場をパラメータ化するための強力なパラダイムとして登場した。
一般化分析理論に基づく微分スペクトル法を導入する。
本手法は物理インフォームドスペクトルフィルタとして効果的に機能することを示す。
論文 参考訳(メタデータ) (2025-12-11T21:57:21Z) - Spatially Aware Dictionary-Free Eigenfunction Identification for Modeling and Control of Nonlinear Dynamical Systems [0.0]
基本関数の集合を定義せずにクープマン固有関数をデータ駆動で発見する新しい手法を提案する。
このアプローチは、いくつかのベンチマーク非線形力学系でうまくテストされている。
論文 参考訳(メタデータ) (2025-11-27T17:33:40Z) - HEDGE: Hallucination Estimation via Dense Geometric Entropy for VQA with Vision-Language Models [4.099133096025821]
視覚言語モデル(VLM)は、オープンエンドの視覚的質問応答を可能にするが、幻覚に苦しむ傾向にある。
我々は、制御された視覚摂動、セマンティッククラスタリング、堅牢な不確実性メトリクスを組み合わせた幻覚検出のための統合フレームワークであるHEDGEを提案する。
論文 参考訳(メタデータ) (2025-11-16T17:16:31Z) - Guided Diffusion Sampling on Function Spaces with Applications to PDEs [112.09025802445329]
PDEに基づく逆問題における条件付きサンプリングのための一般的なフレームワークを提案する。
これは、関数空間拡散モデルと条件付けのためのプラグアンドプレイガイダンスによって達成される。
提案手法は,最先端の固定解像度拡散ベースラインに対して平均32%の精度向上を実現する。
論文 参考訳(メタデータ) (2025-05-22T17:58:12Z) - Revisiting the Evaluation of Image Synthesis with GANs [55.72247435112475]
本研究では, 合成性能の評価に関する実証的研究を行い, 生成モデルの代表としてGAN(Generative Adversarial Network)を用いた。
特に、表現空間におけるデータポイントの表現方法、選択したサンプルを用いた公平距離の計算方法、各集合から使用可能なインスタンス数など、さまざまな要素の詳細な分析を行う。
論文 参考訳(メタデータ) (2023-04-04T17:54:32Z) - Controlling for sparsity in sparse factor analysis models: adaptive
latent feature sharing for piecewise linear dimensionality reduction [2.896192909215469]
本稿では,現在潜伏している特徴分解技術の鍵となる限界に対処できる,シンプルでトラクタブルな特徴割り当てモデルを提案する。
適応型因子分析(aFA)と適応型確率的原理成分分析(aPPCA)を応用し,柔軟な構造発見と次元減少を実現する。
APPCAとaFAは、生のMNISTに適用した場合と、オートエンコーダの特徴を解釈する場合の両方において、高いレベルの特徴を推測できることを示す。
論文 参考訳(メタデータ) (2020-06-22T16:09:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。