論文の概要: Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction
- arxiv url: http://arxiv.org/abs/2412.12870v1
- Date: Tue, 17 Dec 2024 12:51:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-18 13:57:51.111877
- Title: Towards Physically Interpretable World Models: Meaningful Weakly Supervised Representations for Visual Trajectory Prediction
- Title(参考訳): 物理的に解釈可能な世界モデルに向けて:視覚軌道予測のための無意味な弱ビジョン表現
- Authors: Zhenjiang Mao, Ivan Ruchkin,
- Abstract要約: ディープラーニングモデルは、複雑なシステムの認識、予測、制御にますます使われています。
これらのモデルに物理的な知識を組み込むことは、現実的で一貫性のある出力を達成するために不可欠である。
本研究では,学習した潜在表現を実世界の物理量と整合させる新しいアーキテクチャである物理解釈可能世界モデルを提案する。
- 参考スコア(独自算出の注目度): 0.1534667887016089
- License:
- Abstract: Deep learning models are increasingly employed for perception, prediction, and control in complex systems. Embedding physical knowledge into these models is crucial for achieving realistic and consistent outputs, a challenge often addressed by physics-informed machine learning. However, integrating physical knowledge with representation learning becomes difficult when dealing with high-dimensional observation data, such as images, particularly under conditions of incomplete or imprecise state information. To address this, we propose Physically Interpretable World Models, a novel architecture that aligns learned latent representations with real-world physical quantities. Our method combines a variational autoencoder with a dynamical model that incorporates unknown system parameters, enabling the discovery of physically meaningful representations. By employing weak supervision with interval-based constraints, our approach eliminates the reliance on ground-truth physical annotations. Experimental results demonstrate that our method improves the quality of learned representations while achieving accurate predictions of future states, advancing the field of representation learning in dynamic systems.
- Abstract(参考訳): ディープラーニングモデルは、複雑なシステムの認識、予測、制御にますます使われています。
これらのモデルに物理的な知識を組み込むことは、現実的で一貫性のある出力を達成するために不可欠である。
しかし、画像などの高次元観測データを扱う場合、特に不完全な状態情報や不正確な状態情報の条件下では、物理知識と表現学習の統合が困難になる。
そこで本研究では,学習した潜在表現を実世界の物理量と整合させる新しいアーキテクチャである物理解釈可能世界モデルを提案する。
本手法は,変分オートエンコーダと未知のシステムパラメータを組み込んだ動的モデルを組み合わせることで,物理的に意味のある表現の発見を可能にする。
本手法は, 時間的制約による弱い監督を生かして, 地味な物理的なアノテーションへの依存を排除している。
実験により,動的システムにおける表現学習の分野を推し進めつつ,将来の状態を正確に予測しながら,学習した表現の質を向上することを示す。
関連論文リスト
- ContPhy: Continuum Physical Concept Learning and Reasoning from Videos [86.63174804149216]
ContPhyは、マシン物理常識を評価するための新しいベンチマークである。
私たちは、さまざまなAIモデルを評価し、ContPhyで満足なパフォーマンスを達成するのに依然として苦労していることがわかった。
また、近年の大規模言語モデルとパーティクルベースの物理力学モデルを組み合わせるためのオラクルモデル(ContPRO)を導入する。
論文 参考訳(メタデータ) (2024-02-09T01:09:21Z) - Bridging the Gap to Real-World Object-Centric Learning [66.55867830853803]
自己教師付き方法で訓練されたモデルから特徴を再構成することは、完全に教師なしの方法でオブジェクト中心表現が生じるための十分な訓練信号であることを示す。
我々のアプローチであるDINOSAURは、シミュレーションデータ上で既存のオブジェクト中心学習モデルよりも大幅に優れています。
論文 参考訳(メタデータ) (2022-09-29T15:24:47Z) - Knowledge-based Deep Learning for Modeling Chaotic Systems [7.075125892721573]
本稿では,極端事象とその力学を考察し,知識ベースディープラーニング(KDL)と呼ばれる,深層ニューラルネットワークに基づくモデルを提案する。
提案するKDLは,実データとシミュレーションデータとの協調学習により,カオスシステムを管理する複雑なパターンを学習することができる。
我々は,エルニーニョ海表面温度,サンフアン・デング熱感染,ブヨルノヤ日降水という3つの実世界のベンチマークデータセットを用いて,我々のモデルを検証した。
論文 参考訳(メタデータ) (2022-09-09T11:46:25Z) - Learning dynamics from partial observations with structured neural ODEs [5.757156314867639]
本稿では,ニューラルODEに基づくシステム識別に関する幅広い物理的知見を取り入れたフレキシブルなフレームワークを提案する。
本稿では,ロボット外骨格を用いた数値シミュレーションおよび実験データセットにおける提案手法の性能について述べる。
論文 参考訳(メタデータ) (2022-05-25T07:54:10Z) - Leveraging the structure of dynamical systems for data-driven modeling [111.45324708884813]
トレーニングセットとその構造が長期予測の品質に与える影響を考察する。
トレーニングセットのインフォームドデザインは,システムの不変性と基盤となるアトラクションの構造に基づいて,結果のモデルを大幅に改善することを示す。
論文 参考訳(メタデータ) (2021-12-15T20:09:20Z) - Causal Navigation by Continuous-time Neural Networks [108.84958284162857]
本研究では,連続時間ニューラルネットワークを用いた因果表現学習のための理論的,実験的枠組みを提案する。
本手法は,ドローンの視覚制御学習の文脈において,一連の複雑なタスクにおいて評価する。
論文 参考訳(メタデータ) (2021-06-15T17:45:32Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z) - Bridging the Gap: Machine Learning to Resolve Improperly Modeled
Dynamics [4.940323406667406]
本稿では,複雑な時間的挙動を示すシステムに対して,不適切にモデル化された力学を克服するためのデータ駆動型モデリング戦略を提案する。
本稿では,システムの真の力学と,不正確あるいは不適切に記述されたシステムのモデルによって与えられる力学の相違を解決するためのディープラーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-23T04:57:02Z) - Heteroscedastic Uncertainty for Robust Generative Latent Dynamics [7.107159120605662]
本稿では,潜在状態表現と関連するダイナミクスを協調的に学習する手法を提案する。
我々の主な貢献として、我々の表現がヘテロスセダスティックあるいは入力固有の不確実性の概念を捉えることができるかを説明します。
画像に基づく2つのタスクの予測と制御実験の結果を示す。
論文 参考訳(メタデータ) (2020-08-18T21:04:33Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。