論文の概要: SRNN: Spatiotemporal Relational Neural Network for Intuitive Physics Understanding
- arxiv url: http://arxiv.org/abs/2511.06761v2
- Date: Wed, 19 Nov 2025 03:13:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 13:41:21.048405
- Title: SRNN: Spatiotemporal Relational Neural Network for Intuitive Physics Understanding
- Title(参考訳): SRNN:直観的物理理解のための時空間関係ニューラルネットワーク
- Authors: Fei Yang,
- Abstract要約: 本稿では、ニューラルオブジェクト属性、関係、タイムラインの統一表現を確立するモデルである、時空間ネットワーク(SRNN)を紹介する。
CLEVRベンチマークでは、SRNNは競合性能を達成し、視覚ストリームから重要な言語関係を表現する能力を確認する。
我々の研究は、制約された環境での直感的な物理理解のために、重要なニューラルネットワークをエンジニアリングシステムに翻訳する可能性を確認する概念実証を提供する。
- 参考スコア(独自算出の注目度): 5.9229807497571665
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human prowess in intuitive physics remains unmatched by machines. To bridge this gap, we argue for a fundamental shift towards brain-inspired computational principles. This paper introduces the Spatiotemporal Relational Neural Network (SRNN), a model that establishes a unified neural representation for object attributes, relations, and timeline, with computations governed by a Hebbian ``Fire Together, Wire Together'' mechanism across dedicated \textit{What} and \textit{How} pathways. This unified representation is directly used to generate structured linguistic descriptions of the visual scene, bridging perception and language within a shared neural substrate. On the CLEVRER benchmark, SRNN achieves competitive performance, thereby confirming its capability to represent essential spatiotemporal relations from the visual stream. Cognitive ablation analysis further reveals a benchmark bias, outlining a path for a more holistic evaluation. Finally, the white-box nature of SRNN enables precise pinpointing of error root causes. Our work provides a proof-of-concept that confirms the viability of translating key principles of biological intelligence into engineered systems for intuitive physics understanding in constrained environments.
- Abstract(参考訳): 直感的な物理学における人間の才能は、機械に縛られないままである。
このギャップを埋めるために、脳にインスパイアされた計算原理への根本的なシフトを議論する。
本稿では、オブジェクト属性、関係、タイムラインの統一的ニューラル表現を確立するモデルである、時空間関係ニューラルネットワーク(SRNN)を紹介し、専用の \textit{What} と \textit{How} 経路にまたがる Hebbian ``Fire Together, Wire Together'' 機構によって制御される計算について述べる。
この統一表現は、視覚シーンの構造化言語記述、認識と言語を共有神経基板内で直接的に生成するために使用される。
CLEVRERベンチマークでは、SRNNは競合性能を達成し、視覚ストリームから重要な時空間関係を表現する能力を確認する。
認知的アブレーション分析は、さらにベンチマークバイアスを明らかにし、より包括的な評価の道筋を概説する。
最後に、SRNNのホワイトボックスの性質は、エラー原因の正確なピンポインティングを可能にする。
我々の研究は、制約された環境での直感的な物理理解のために、生物学的知能の重要な原理を工学的なシステムに翻訳することの可能性を実証する概念実証を提供する。
関連論文リスト
- Steinmetz Neural Networks for Complex-Valued Data [23.80312814400945]
本稿では,並列実数値処理と結合出力を組み合わせたDNNを用いた複素数値データ処理手法を提案する。
提案するアーキテクチャのクラスは、Steinmetz Neural Networksと呼ばれ、多視点学習を取り入れて、潜在空間におけるより解釈可能な表現を構築する。
この数値実験では,提案するネットワークがベンチマークデータセットと合成例を用いて提案する付加雑音に対する性能改善と頑健性について述べる。
論文 参考訳(メタデータ) (2024-09-16T08:26:06Z) - GINN-KAN: Interpretability pipelining with applications in Physics Informed Neural Networks [5.2969467015867915]
本稿では,解釈可能性パイプラインの概念を導入し,複数の解釈可能性技術を導入し,各手法の精度を向上する。
我々は、標準的なニューラルネットワークアーキテクチャに解釈可能性を導入する可能性のために選択された2つの最近のモデルを評価する。
両モデルの利点を合成する新しい解釈可能なニューラルネットワークGINN-KANを提案する。
論文 参考訳(メタデータ) (2024-08-27T04:57:53Z) - Temporal Spiking Neural Networks with Synaptic Delay for Graph Reasoning [91.29876772547348]
スパイキングニューラルネットワーク(SNN)は、生物学的にインスパイアされたニューラルネットワークモデルとして研究されている。
本稿では,SNNがシナプス遅延と時間符号化とを併用すると,グラフ推論の実行(知識)に長けていることを明らかにする。
論文 参考訳(メタデータ) (2024-05-27T05:53:30Z) - Contextualizing MLP-Mixers Spatiotemporally for Urban Data Forecast at Scale [54.15522908057831]
本稿では,STTD予測を大規模に行うためのコンピュータ・ミクサーの適応版を提案する。
我々の結果は、この単純な効率の良いソリューションが、いくつかのトラフィックベンチマークでテストした場合、SOTAベースラインに匹敵する可能性があることを驚くほど示している。
本研究は, 実世界のSTTD予測において, 簡便な有効モデルの探索に寄与する。
論文 参考訳(メタデータ) (2023-07-04T05:19:19Z) - Neural-Symbolic Recursive Machine for Systematic Generalization [113.22455566135757]
我々は、基底記号システム(GSS)のコアとなるニューラル・シンボリック再帰機械(NSR)を紹介する。
NSRは神経知覚、構文解析、意味推論を統合している。
我々はNSRの有効性を,系統的一般化能力の探索を目的とした4つの挑戦的ベンチマークで評価した。
論文 参考訳(メタデータ) (2022-10-04T13:27:38Z) - Knowledge Enhanced Neural Networks for relational domains [83.9217787335878]
我々は、ニューラルネットワークに事前論理的知識を注入するニューラルネットワークアーキテクチャであるKENNに焦点を当てる。
本稿では,関係データに対するKENNの拡張を提案する。
論文 参考訳(メタデータ) (2022-05-31T13:00:34Z) - Neural Networks Enhancement with Logical Knowledge [83.9217787335878]
関係データに対するKENNの拡張を提案する。
その結果、KENNは、存在関係データにおいても、基礎となるニューラルネットワークの性能を高めることができることがわかった。
論文 参考訳(メタデータ) (2020-09-13T21:12:20Z) - Neural Networks with Recurrent Generative Feedback [61.90658210112138]
畳み込みニューラルネットワーク(CNN)でこの設計をインスタンス化する
実験では、標準ベンチマーク上の従来のフィードフォワードCNNに対して、CNN-Fは敵のロバスト性を大幅に改善した。
論文 参考訳(メタデータ) (2020-07-17T19:32:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。