論文の概要: A Benchmark for Modeling Violation-of-Expectation in Physical Reasoning
Across Event Categories
- arxiv url: http://arxiv.org/abs/2111.08826v1
- Date: Tue, 16 Nov 2021 22:59:25 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-18 13:45:50.649546
- Title: A Benchmark for Modeling Violation-of-Expectation in Physical Reasoning
Across Event Categories
- Title(参考訳): イベントカテゴリ間の物理推論における振動のモデル化のためのベンチマーク
- Authors: Arijit Dasgupta, Jiafei Duan, Marcelo H. Ang Jr, Yi Lin, Su-hua Wang,
Ren\'ee Baillargeon, Cheston Tan
- Abstract要約: VoE(Violation-of-Expectation)は、期待されたシーンのみの知識で、期待されたシーンまたは驚きのシーンをラベル付けするために用いられる。
物理推論における既存のVoEベースの3Dデータセットは、ほとんど真実や帰納バイアスのない視覚データを提供する。
我々は、因果関係のある特徴と規則の基調ラベルを組み込んだ、新しい大規模合成3D VoEデータセットをキュレートすることで、身体的推論を研究するためのベンチマークを構築した。
- 参考スコア(独自算出の注目度): 4.4920673251997885
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent work in computer vision and cognitive reasoning has given rise to an
increasing adoption of the Violation-of-Expectation (VoE) paradigm in synthetic
datasets. Inspired by infant psychology, researchers are now evaluating a
model's ability to label scenes as either expected or surprising with knowledge
of only expected scenes. However, existing VoE-based 3D datasets in physical
reasoning provide mainly vision data with little to no heuristics or inductive
biases. Cognitive models of physical reasoning reveal infants create high-level
abstract representations of objects and interactions. Capitalizing on this
knowledge, we established a benchmark to study physical reasoning by curating a
novel large-scale synthetic 3D VoE dataset armed with ground-truth heuristic
labels of causally relevant features and rules. To validate our dataset in five
event categories of physical reasoning, we benchmarked and analyzed human
performance. We also proposed the Object File Physical Reasoning Network
(OFPR-Net) which exploits the dataset's novel heuristics to outperform our
baseline and ablation models. The OFPR-Net is also flexible in learning an
alternate physical reality, showcasing its ability to learn universal causal
relationships in physical reasoning to create systems with better
interpretability.
- Abstract(参考訳): コンピュータビジョンと認知推論における最近の研究は、合成データセットにおけるVoE(Violation-of-Expectation)パラダイムの採用の増加につながっている。
幼児心理学に触発されて、研究者は、予測されたシーンのみの知識で、期待または予想外のシーンをラベル付けするモデルの能力を評価している。
しかし、既存のvoeベースの物理推論の3dデータセットは、主にヒューリスティックや帰納バイアスの少ないビジョンデータを提供する。
身体的推論の認知モデルは、幼児が物体と相互作用の高レベルな抽象表現を創造することを明らかにする。
この知識を活かし, 因果関係のある特徴や規則の接地ヒューリスティックラベルを組み込んだ, 新たな大規模合成3dvoeデータセットをキュレーションすることにより, 物理的推論を研究するベンチマークを構築した。
物理的推論の5つのイベントカテゴリでデータセットを検証するため、人間のパフォーマンスをベンチマークし分析した。
我々はまた,データセットの新たなヒューリスティックを活用し,ベースラインモデルやアブレーションモデルを上回るオブジェクトファイル物理推論ネットワーク(ofpr-net)を提案する。
ofpr-netはまた、物理的な推論における普遍的な因果関係を学習し、より良い解釈性を持つシステムを構築する能力を示す、別の物理的な現実を学ぶのにも柔軟である。
関連論文リスト
- Compositional Physical Reasoning of Objects and Events from Videos [122.6862357340911]
本稿では,物体の動きや相互作用から隠れた物理的特性を推定するという課題に対処する。
我々は、ComPhyの最先端ビデオ推論モデルを評価し、これらの隠れプロパティをキャプチャする限られた能力を明らかにする。
また,視覚的および隠れた物理的特性を学習し,原因を解明する,新しいニューロシンボリックな枠組みであるPhysical Concept Reasoner(PCR)を提案する。
論文 参考訳(メタデータ) (2024-08-02T15:19:55Z) - Learning Discrete Concepts in Latent Hierarchical Models [73.01229236386148]
自然の高次元データから学習する概念は、ヒューマンアライメントと解釈可能な機械学習モデルの構築の可能性を秘めている。
我々は概念を階層的因果モデルを通して関連付けられた離散潜在因果変数として定式化する。
我々は、理論的な主張を合成データ実験で裏付ける。
論文 参考訳(メタデータ) (2024-06-01T18:01:03Z) - ContPhy: Continuum Physical Concept Learning and Reasoning from Videos [86.63174804149216]
ContPhyは、マシン物理常識を評価するための新しいベンチマークである。
私たちは、さまざまなAIモデルを評価し、ContPhyで満足なパフォーマンスを達成するのに依然として苦労していることがわかった。
また、近年の大規模言語モデルとパーティクルベースの物理力学モデルを組み合わせるためのオラクルモデル(ContPRO)を導入する。
論文 参考訳(メタデータ) (2024-02-09T01:09:21Z) - Visual cognition in multimodal large language models [12.603212933816206]
近年の進歩は、人間のような認知能力をエミュレートする可能性への関心を再燃させた。
本稿では、直観物理学、因果推論、直観心理学の分野における視覚に基づく大規模言語モデルの現状を評価する。
論文 参考訳(メタデータ) (2023-11-27T18:58:34Z) - X-VoE: Measuring eXplanatory Violation of Expectation in Physical Events [75.94926117990435]
本研究では,AIエージェントによる直感的な物理の把握を評価するベンチマークデータセットであるX-VoEを紹介する。
X-VoEは直感的な物理モデルの説明能力を高めるためのより高いバーを確立する。
本稿では、物理力学を捉え、隠蔽対象状態を推定する説明に基づく学習システムを提案する。
論文 参考訳(メタデータ) (2023-08-21T03:28:23Z) - InDL: A New Dataset and Benchmark for In-Diagram Logic Interpretation
based on Visual Illusion [1.7980584146314789]
本稿では,深層学習モデルの論理解釈能力を評価するための新しい手法を提案する。
これらのモデルを厳格にテストし、ベンチマークするために設計された、ユニークなデータセットであるInDLを構築します。
我々は、6つの古典的な幾何学的錯視を利用して、人間と機械の視覚知覚の比較フレームワークを構築した。
論文 参考訳(メタデータ) (2023-05-28T13:01:32Z) - PTR: A Benchmark for Part-based Conceptual, Relational, and Physical
Reasoning [135.2892665079159]
PTRと呼ばれる大規模診断用視覚推論データセットを新たに導入する。
PTRは70kのRGBD合成画像と地上の真実のオブジェクトと部分レベルのアノテーションを含んでいる。
このデータセット上で、いくつかの最先端の視覚的推論モデルを調べ、それらがまだ多くの驚くべき誤りを犯していることを観察する。
論文 参考訳(メタデータ) (2021-12-09T18:59:34Z) - AVoE: A Synthetic 3D Dataset on Understanding Violation of Expectation
for Artificial Cognition [2.561649173827544]
VoE(Violation-of-Expectation)は、期待されたシーンと驚くべきシーンを区別するモデルの能力を評価するために用いられる。
物理推論における既存のVoEベースの3Dデータセットは、視覚データのみを提供する。
AVoE - 複数の新しいサブカテゴリから刺激を提示する合成3D VoEベースのデータセット。
論文 参考訳(メタデータ) (2021-10-12T08:59:19Z) - Physion: Evaluating Physical Prediction from Vision in Humans and
Machines [46.19008633309041]
我々は、この能力を正確に測定する視覚的および身体的予測ベンチマークを示す。
我々は、様々な物理予測を行う能力について、アルゴリズムの配列を比較した。
物理的な状態にアクセス可能なグラフニューラルネットワークは、人間の振る舞いを最もよく捉えている。
論文 参考訳(メタデータ) (2021-06-15T16:13:39Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。