論文の概要: Forward Prediction for Physical Reasoning
- arxiv url: http://arxiv.org/abs/2006.10734v2
- Date: Mon, 29 Mar 2021 19:41:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-19 09:42:15.750638
- Title: Forward Prediction for Physical Reasoning
- Title(参考訳): 物理推論の前方予測
- Authors: Rohit Girdhar, Laura Gustafson, Aaron Adcock and Laurens van der
Maaten
- Abstract要約: PHYREベンチマークの複雑な物理推論タスクにおける最先端の予測モデルの性能について検討する。
フォワードプレディションモデルは、特に多くのオブジェクトを含む複雑なタスクにおいて、物理共振性能を向上させることができる。
しかし、これらの改善は、テストタスクは列車タスクの小さなバリエーションであり、完全に新しいタスクテンプレートへの一般化は困難である。
- 参考スコア(独自算出の注目度): 26.946563606537126
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Physical reasoning requires forward prediction: the ability to forecast what
will happen next given some initial world state. We study the performance of
state-of-the-art forward-prediction models in the complex physical-reasoning
tasks of the PHYRE benchmark. We do so by incorporating models that operate on
object or pixel-based representations of the world into simple
physical-reasoning agents. We find that forward-prediction models can improve
physical-reasoning performance, particularly on complex tasks that involve many
objects. However, we also find that these improvements are contingent on the
test tasks being small variations of train tasks, and that generalization to
completely new task templates is challenging. Surprisingly, we observe that
forward predictors with better pixel accuracy do not necessarily lead to better
physical-reasoning performance.Nevertheless, our best models set a new
state-of-the-art on the PHYRE benchmark.
- Abstract(参考訳): 物理的な推論には前進予測が必要である: 初期の世界状態から次に何が起こるかを予測する能力。
PHYREベンチマークの複雑な物理推論タスクにおける最先端予測モデルの性能について検討する。
我々は、世界のオブジェクトやピクセルベースの表現を操作するモデルを、シンプルな物理推論エージェントに組み込むことで実現している。
前方予測モデルは、特に多くのオブジェクトを含む複雑なタスクにおいて、物理的推論性能を向上させることができる。
しかし、これらの改善は、列車のタスクの小さなバリエーションであるテストタスクに近づき、全く新しいタスクテンプレートへの一般化が難しいことも判明した。
驚くべきことに、私たちは、ピクセル精度が良いフォワード予測器は必ずしも物理的に理屈的なパフォーマンスをもたらすものではないことを観察しています。
関連論文リスト
- DINO-WM: World Models on Pre-trained Visual Features enable Zero-shot Planning [38.749045283035365]
本稿では、視覚世界を再構築することなく、視覚力学をモデル化する新しい手法であるDINO-WMを提案する。
迷路ナビゲーション,テーブルトッププッシュ,粒子操作など,様々な領域でDINO-WMを評価した。
論文 参考訳(メタデータ) (2024-11-07T18:54:37Z) - Optimizing Predictive AI in Physical Design Flows with Mini Pixel Batch
Gradient Descent [5.413212114044892]
MSEの平均化効果は、モデルトレーニングとデプロイメントの両方において制限をもたらすと我々は主張する。
プラグ・アンド・プレイ最適化アルゴリズムであるMPGDを提案する。
代表的ベンチマークスーツの実験は、様々な物理設計予測タスクにおけるMPGDの顕著な利点を示している。
論文 参考訳(メタデータ) (2024-02-08T20:14:35Z) - Physion++: Evaluating Physical Scene Understanding that Requires Online
Inference of Different Physical Properties [100.19685489335828]
この研究は、人工システムにおける視覚的身体的予測を厳格に評価する新しいデータセットとベンチマークであるPhysylon++を提案する。
正確な予測が質量、摩擦、弾性、変形性などの特性の推定に依存するシナリオをテストする。
我々は,様々なレベルの学習と組込み知識にまたがる最先端予測モデルの性能を評価し,その性能を人間の予測と比較した。
論文 参考訳(メタデータ) (2023-06-27T17:59:33Z) - A Control-Centric Benchmark for Video Prediction [69.22614362800692]
本稿では,アクション条件付きビデオ予測のベンチマークを,制御ベンチマークの形式で提案する。
私たちのベンチマークには、11のタスクカテゴリと310のタスクインスタンス定義を備えたシミュレーション環境が含まれています。
次に、ベンチマークを活用して、スケールするモデルサイズ、トレーニングデータの量、モデルアンサンブルの影響を調査します。
論文 参考訳(メタデータ) (2023-04-26T17:59:45Z) - Physics-informed machine learning for Structural Health Monitoring [0.0]
この章では、エンジニアがモデル化または評価しようとしている構造についてしばしば持つ物理的な洞察を考慮に入れたMLアルゴリズムを適用する、物理インフォームド機械学習の概念を紹介します。
この章では、単純な物理モデルとデータ駆動モデルを組み合わせたグレーボックスモデルによって、SHM設定における予測能力が向上することを示す。
SHMアプリケーションは、オフショアや航空宇宙構造物の負荷監視タスクから、ロングスパンブリッジのパフォーマンス監視まで、幅広いアプリケーションがデモされる。
論文 参考訳(メタデータ) (2022-06-30T14:16:33Z) - FitVid: Overfitting in Pixel-Level Video Prediction [117.59339756506142]
われわれはFitVidという新しいアーキテクチャを導入し、一般的なベンチマークに厳しいオーバーフィッティングを行えるようにした。
FitVidは、4つの異なるメトリクスで4つの異なるビデオ予測ベンチマークで現在の最先端モデルを上回っている。
論文 参考訳(メタデータ) (2021-06-24T17:20:21Z) - Models, Pixels, and Rewards: Evaluating Design Trade-offs in Visual
Model-Based Reinforcement Learning [109.74041512359476]
視覚的MBRLアルゴリズムにおける予測モデルの設計決定について検討する。
潜在空間の使用など、しばしば重要と見なされる設計上の決定は、タスクのパフォーマンスにはほとんど影響しないことが分かりました。
我々は,この現象が探索とどのように関係しているか,および標準ベンチマークにおける下位スコーリングモデルのいくつかが,同じトレーニングデータでトレーニングされた場合のベストパフォーマンスモデルと同等の性能を発揮するかを示す。
論文 参考訳(メタデータ) (2020-12-08T18:03:21Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。