論文の概要: A Survey on World Models Grounded in Acoustic Physical Information
- arxiv url: http://arxiv.org/abs/2506.13833v1
- Date: Mon, 16 Jun 2025 04:59:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.178873
- Title: A Survey on World Models Grounded in Acoustic Physical Information
- Title(参考訳): 音響物理情報に基づく世界モデルに関する調査
- Authors: Xiaoliang Chen, Le Chang, Xin Yu, Yunhe Huang, Xianling Tu,
- Abstract要約: 本調査は, 音波物理情報に基づく世界モデルの新しい分野を包括的に概観する。
理論的基盤、重要な方法論の枠組み、最近の技術進歩について考察する。
この調査では、ロボット工学、自律運転、ヘルスケア、ファイナンスにおけるアコースティックワールドモデルの重要な応用について詳述している。
- 参考スコア(独自算出の注目度): 12.985712909050502
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This survey provides a comprehensive overview of the emerging field of world models grounded in the foundation of acoustic physical information. It examines the theoretical underpinnings, essential methodological frameworks, and recent technological advancements in leveraging acoustic signals for high-fidelity environmental perception, causal physical reasoning, and predictive simulation of dynamic events. The survey explains how acoustic signals, as direct carriers of mechanical wave energy from physical events, encode rich, latent information about material properties, internal geometric structures, and complex interaction dynamics. Specifically, this survey establishes the theoretical foundation by explaining how fundamental physical laws govern the encoding of physical information within acoustic signals. It then reviews the core methodological pillars, including Physics-Informed Neural Networks (PINNs), generative models, and self-supervised multimodal learning frameworks. Furthermore, the survey details the significant applications of acoustic world models in robotics, autonomous driving, healthcare, and finance. Finally, it systematically outlines the important technical and ethical challenges while proposing a concrete roadmap for future research directions toward robust, causal, uncertainty-aware, and responsible acoustic intelligence. These elements collectively point to a research pathway towards embodied active acoustic intelligence, empowering AI systems to construct an internal "intuitive physics" engine through sound.
- Abstract(参考訳): 本調査は, 音波物理情報の基礎となる世界モデルの新しい分野を包括的に概観する。
高忠実な環境認識、因果的物理的推論、動的事象の予測シミュレーションに音響信号を活用するための理論的基盤、重要な方法論の枠組み、最近の技術進歩について検討する。
この調査では、物理的事象からの機械波エネルギーの直接キャリアとしての音響信号が、材料特性、内部幾何学構造、複雑な相互作用のダイナミクスに関するリッチで潜時的な情報をエンコードする方法について説明している。
具体的には,基本的物理法則が音響信号の物理情報の符号化をいかに支配するかを説明することによって,理論的基礎を確立する。
次に、Physics-Informed Neural Networks (PINN)、生成モデル、自己教師型マルチモーダル学習フレームワークなど、中核となる方法論の柱をレビューする。
さらにこの調査では、ロボット工学、自律運転、医療、金融におけるアコースティックワールドモデルの重要な応用について詳述している。
最後に、それは体系的に重要な技術的および倫理的課題を概説し、また、堅牢で因果性があり、不確実性を認識し、責任ある音響インテリジェンスに向けた将来の研究方向性のための具体的なロードマップを提案している。
これらの要素は集合的にアクティブ音響インテリジェンスを具現化するための研究経路を示し、AIシステムに音を通して内部の「直観的物理」エンジンを構築する権限を与える。
関連論文リスト
- Generative Physical AI in Vision: A Survey [78.07014292304373]
遺伝子人工知能(AI)は、コンピュータビジョンの分野を急速に進歩させ、機械が前例のない高度なビジュアルデータを作成し、解釈できるようにする。
この変換は、現実的な画像、ビデオ、および3D/4Dコンテンツを生成するための生成モデルの基礎の上に構築されている。
生成モデルが進化して物理リアリズムと動的シミュレーションを統合するにつれ、「世界シミュレータ」として機能する可能性が拡大する。
論文 参考訳(メタデータ) (2025-01-19T03:19:47Z) - The Sound of Water: Inferring Physical Properties from Pouring Liquids [85.30865788636386]
注水液の音響・視覚観測と物理の関連性について検討した。
本研究の目的は, 液位, 容器形状, 注水速度, 充填時間などの物性を自動的に推定することである。
論文 参考訳(メタデータ) (2024-11-18T01:19:37Z) - Physics and Deep Learning in Computational Wave Imaging [24.99422165859396]
計算波イメージング(CWI)は、物質体積の隠れ構造と物理的性質を抽出する。
CWI問題を解くための現在のアプローチは、伝統的な物理学に根ざしたものと、ディープラーニングに基づくものに分けられる。
機械学習ベースの計算手法が登場し、これらの課題に対処するための異なる視点を提供する。
論文 参考訳(メタデータ) (2024-10-10T19:32:17Z) - Point Neuron Learning: A New Physics-Informed Neural Network Architecture [8.545030794905584]
本稿では,新しい物理インフォームドニューラルネットワークアーキテクチャを提案する。
これは、波動方程式の基本的な解をネットワークアーキテクチャに埋め込んで、学習したモデルが厳密に波動方程式を満たすことを可能にする。
他のPINN手法と比較して、我々の手法は複素数を直接処理し、より優れた解釈可能性と一般化性を提供する。
論文 参考訳(メタデータ) (2024-08-30T02:07:13Z) - ContPhy: Continuum Physical Concept Learning and Reasoning from Videos [86.63174804149216]
ContPhyは、マシン物理常識を評価するための新しいベンチマークである。
私たちは、さまざまなAIモデルを評価し、ContPhyで満足なパフォーマンスを達成するのに依然として苦労していることがわかった。
また、近年の大規模言語モデルとパーティクルベースの物理力学モデルを組み合わせるためのオラクルモデル(ContPRO)を導入する。
論文 参考訳(メタデータ) (2024-02-09T01:09:21Z) - Taming Waves: A Physically-Interpretable Machine Learning Framework for
Realizable Control of Wave Dynamics [3.4530027457862]
本研究では,アクティベートされたメタマテリアル設計による音波の制御に関する研究を目的とした環境について紹介する。
我々は,この環境を深層ニューラルネットワークに基づく新しい機械学習手法の開発に活用する。
本モデルは完全に解釈可能であり,実音響環境の物理的制約と固有特性をその潜時情報表現にマッピングする。
論文 参考訳(メタデータ) (2023-11-27T03:34:28Z) - Constructing Neural Network-Based Models for Simulating Dynamical
Systems [59.0861954179401]
データ駆動モデリングは、真のシステムの観測からシステムの力学の近似を学ぼうとする代替パラダイムである。
本稿では,ニューラルネットワークを用いた動的システムのモデル構築方法について検討する。
基礎的な概要に加えて、関連する文献を概説し、このモデリングパラダイムが克服すべき数値シミュレーションから最も重要な課題を概説する。
論文 参考訳(メタデータ) (2021-11-02T10:51:42Z) - Neural Networks with Physics-Informed Architectures and Constraints for
Dynamical Systems Modeling [19.399031618628864]
軌道データから動的モデルを学ぶためのフレームワークを開発する。
出力の値とモデルの内部状態に制約を課す。
様々な力学系に対する提案手法の利点を実験的に実証した。
論文 参考訳(メタデータ) (2021-09-14T02:47:51Z) - Physics-Coupled Spatio-Temporal Active Learning for Dynamical Systems [15.923190628643681]
主な課題の1つは、認識されたデータストリームを生成する根本原因を推測することである。
機械学習ベースの予測モデルの成功は、モデルトレーニングに大量の注釈付きデータを必要とする。
提案するST-PCNNは, 実世界のデータセットと実世界のデータセットの両方において, 極めて少ないインスタンスで最適精度に収束することを示した。
論文 参考訳(メタデータ) (2021-08-11T18:05:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。