論文の概要: Mechanisms of Misgeneralization in Physical Sequence Modeling
- arxiv url: http://arxiv.org/abs/2605.20299v1
- Date: Tue, 19 May 2026 12:34:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.281482
- Title: Mechanisms of Misgeneralization in Physical Sequence Modeling
- Title(参考訳): 物理シーケンスモデリングにおけるミスジェネリゼーションのメカニズム
- Authors: Kento Nishi, Raphael Tang, Karun Kumar, Core Francisco Park, Hidenori Tanaka,
- Abstract要約: 生成シーケンスモデルは、物理領域の運動を計画するためにしばしば訓練される。
私たちは、標準的なディープラーニングがこの意図に反する可能性があることに気付きます。
制御された合成タスクを用いて、モデルクラスの典型的な局所誤差が伝播する際に、物理的誤一般化が発生することを示す。
- 参考スコア(独自算出の注目度): 24.933676954548357
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generative sequence models are often trained to plan motion in physical domains, from robotics to mechanical simulations. When constructing a dataset to train such a model, engineers may curate demonstrations to specify how trajectories should be distributed over a physical quantity like travel distance or mechanical energy. For example, a roboticist building a maze navigation agent might choose demonstrations whose travel distances cover a fixed range uniformly, hoping to constrain the agent's expected power usage. We find that standard deep learning can violate this intent: each generated trajectory can seem plausible on its own, but the aggregate distribution over the physical quantity is wrong. We call this failure physical misgeneralization, and develop an account of its mechanism. Using controlled synthetic tasks, we show that physical misgeneralization arises when local errors typical of the model class propagate through the physical measurement to shift the recovered distribution. We estimate these errors with a data deviation kernel, and we use it to predict which physical quantities gain or lose mass in both our synthetic and more applied maze navigation and double-pendulum motion tasks. Finally, our mechanistic interpretation helps identify which mitigation strategies are structurally promising, and we use it to propose a kernel-informed intervention.
- Abstract(参考訳): 生成シーケンスモデルは、しばしばロボット工学から機械シミュレーションまで、物理領域の運動を計画するために訓練される。
このようなモデルをトレーニングするためのデータセットを構築する場合、エンジニアは、旅行距離や機械的エネルギーといった物理的な量で軌道をどのように分散すべきかを示すために、デモをキュレートすることができる。
例えば、迷路ナビゲーションエージェントを構築するロボット学者は、エージェントの期待する電力使用を制限するために、一定範囲を均一にカバーする走行距離のデモンストレーションを選択するかもしれない。
それぞれの生成した軌跡は、それ自体で妥当に思えるが、物理量に対する総和分布は間違っている。
この失敗を物理的誤一般化と呼び、そのメカニズムを考察する。
制御された合成タスクを用いて、モデルクラスで典型的な局所的な誤差が物理測定を通して伝播し、回復した分布をシフトしたとき、物理的誤一般化が生じることを示す。
データ偏差カーネルを用いてこれらの誤差を推定し、合成およびより応用された迷路ナビゲーションと二重振り子動作タスクの両方において、どの物理量が質量を獲得するかを予測する。
最後に、我々の機械的解釈は、どの緩和戦略が構造的に有望かを特定するのに役立ち、カーネルにインフォームドされた介入を提案するのに役立ちます。
関連論文リスト
- Learning Hamiltonians for solid-state quantum simulators [0.0]
固体量子系の実験データから直接実効ハミルトニアンの同定を学習するための一般化可能なフレームワークを提案する。
我々のアプローチは、物理的制約を直接モデル構造に埋め込む物理インフォームドニューラルネットワークアーキテクチャに基づいている。
論文 参考訳(メタデータ) (2026-03-03T11:37:43Z) - Integrating Fourier Neural Operators with Diffusion Models to improve Spectral Representation of Synthetic Earthquake Ground Motion Response [0.0]
原子炉施設は、強震動による動的負荷に耐えるように設計されなければならない。
本研究では,人工地動を生成するためのAI物理に基づくアプローチを提案する。
以上の結果から,このような手法が生成した人工地震計の現実性を高めることが示唆された。
論文 参考訳(メタデータ) (2025-04-01T13:08:09Z) - Towards Understanding Extrapolation: a Causal Lens [53.15488984371969]
我々は、外挿がいつ可能かを理論的に理解し、それを実現するための原則的な方法を提供する。
この定式化の下では、外挿問題を潜在変数識別問題にキャストする。
この理論は、基礎となる多様体の滑らかさとシフト特性の間の複雑な相互作用を明らかにする。
論文 参考訳(メタデータ) (2025-01-15T21:29:29Z) - Nonisotropic Gaussian Diffusion for Realistic 3D Human Motion Prediction [36.0214360692653]
スケルトン拡散(Skeleton Diffusion)は、人体に明らかな誘導バイアスを埋め込む潜伏拡散モデルである。
我々のアプローチは、手足の歪みのような人工物を避けながら、常に現実的な予測を生成する。
現実世界のデータセットに新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2025-01-10T15:13:43Z) - Probabilistic Latent Variable Modeling for Dynamic Friction Identification and Estimation [2.638878351659023]
ロボット工学における動的モデルの同定は、制御設計、摩擦補償、出力トルク推定をサポートするために不可欠である。
本稿では,潜伏状態を用いたロボット関節の未同定ダイナミクスについて考察する。
予測最大化 (EM) アルゴリズムを用いてモデルパラメータの近似最大推定 (MLE) を求める。
論文 参考訳(メタデータ) (2024-12-20T10:16:18Z) - Towards Generalizable and Interpretable Motion Prediction: A Deep
Variational Bayes Approach [54.429396802848224]
本稿では,分布外ケースに対する頑健な一般化性を有する動き予測のための解釈可能な生成モデルを提案する。
このモデルでは, 長期目的地の空間分布を推定することにより, 目標駆動動作予測を実現する。
動き予測データセットの実験は、適合したモデルが解釈可能で一般化可能であることを検証した。
論文 参考訳(メタデータ) (2024-03-10T04:16:04Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - Diagnosing failures of fairness transfer across distribution shift in
real-world medical settings [60.44405686433434]
分散シフト下でのモデルフェアネスの変化の診断と緩和は、医療環境における機械学習の安全な展開の重要な構成要素である。
この知識は、文献でしばしば想定されるよりも現実のシフトがより複雑である事例を含む、公平性伝達の失敗の診断に有効であることを示す。
論文 参考訳(メタデータ) (2022-02-02T13:59:23Z) - Discovering Latent Causal Variables via Mechanism Sparsity: A New
Principle for Nonlinear ICA [81.4991350761909]
ICA(Independent component analysis)は、この目的を定式化し、実用的な応用のための推定手順を提供する手法の集合を指す。
潜伏変数は、潜伏機構をスパースに正則化すれば、置換まで復元可能であることを示す。
論文 参考訳(メタデータ) (2021-07-21T14:22:14Z) - Physics-Integrated Variational Autoencoders for Robust and Interpretable
Generative Modeling [86.9726984929758]
我々は、不完全物理モデルの深部生成モデルへの統合に焦点を当てる。
本稿では,潜在空間の一部が物理によって基底づけられたVAEアーキテクチャを提案する。
合成および実世界のデータセットの集合に対して生成的性能改善を示す。
論文 参考訳(メタデータ) (2021-02-25T20:28:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。