論文の概要: Symmetry and Complexity in Object-Centric Deep Active Inference Models
- arxiv url: http://arxiv.org/abs/2304.14493v1
- Date: Fri, 14 Apr 2023 10:21:26 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-07 16:21:37.096788
- Title: Symmetry and Complexity in Object-Centric Deep Active Inference Models
- Title(参考訳): 物体中心深部アクティブ推論モデルにおける対称性と複雑性
- Authors: Stefano Ferraro, Toon Van de Maele, Tim Verbelen, and Bart Dhoedt
- Abstract要約: 生成モデルの潜在状態空間における特定の対象の固有対称性が、深いアクティブな推論の下で学習されることを示す。
特に,対象中心の表現に焦点をあて,エージェントが視点を移すにつれて,新しい対象の視点を予測するために画素から学習する。
- 参考スコア(独自算出の注目度): 4.298360054690217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Humans perceive and interact with hundreds of objects every day. In doing so,
they need to employ mental models of these objects and often exploit symmetries
in the object's shape and appearance in order to learn generalizable and
transferable skills. Active inference is a first principles approach to
understanding and modeling sentient agents. It states that agents entertain a
generative model of their environment, and learn and act by minimizing an upper
bound on their surprisal, i.e. their Free Energy. The Free Energy decomposes
into an accuracy and complexity term, meaning that agents favor the least
complex model, that can accurately explain their sensory observations. In this
paper, we investigate how inherent symmetries of particular objects also emerge
as symmetries in the latent state space of the generative model learnt under
deep active inference. In particular, we focus on object-centric
representations, which are trained from pixels to predict novel object views as
the agent moves its viewpoint. First, we investigate the relation between model
complexity and symmetry exploitation in the state space. Second, we do a
principal component analysis to demonstrate how the model encodes the principal
axis of symmetry of the object in the latent space. Finally, we also
demonstrate how more symmetrical representations can be exploited for better
generalization in the context of manipulation.
- Abstract(参考訳): 人間は毎日何百もの物体を知覚し、相互作用する。
そのためには、これらのオブジェクトのメンタルモデルを採用し、一般化可能で伝達可能なスキルを学ぶために、しばしばオブジェクトの形状と外観の対称性を利用する必要がある。
アクティブ推論は、感覚エージェントの理解とモデリングのための最初の原則アプローチである。
エージェントは彼らの環境の生成モデルを楽しませ、彼らの前提、すなわち彼らの自由エネルギーの上限を最小化することによって学習し、行動する。
自由エネルギーは精度と複雑さの項に分解され、エージェントはその感覚観察を正確に説明できる最小の複雑なモデルを好む。
本稿では,特定の対象の固有対称性が,深部能動推論の下で学習した生成モデルの潜在状態空間における対称性として現れるかを検討する。
特に,オブジェクト中心の表現に焦点が当てられ,エージェントが視点を移動するにつれて,新しいオブジェクトビューを予測するために画素から訓練される。
まず, 状態空間におけるモデル複雑性と対称性の利用との関係について検討する。
次に,モデルが潜在空間における物体の対称性の主軸をどのようにエンコードするかを示すために主成分分析を行う。
最後に、操作の文脈におけるより優れた一般化のために、対称表現がいかに利用されるかを示す。
関連論文リスト
- Probing the effects of broken symmetries in machine learning [0.0]
我々は,非対称モデルがデータから対称性を学習できることを示す。
我々は、対称性の破れによって、直接的または間接的に影響を受けやすい物理的観測物に特に焦点を合わせ、モデルが補間的でバルクな状態で使用されるとき、無視可能な結果を見つける。
論文 参考訳(メタデータ) (2024-06-25T17:34:09Z) - Binding Dynamics in Rotating Features [72.80071820194273]
本稿では,特徴間のアライメントを明示的に計算し,それに応じて重みを調整する「コサイン結合」機構を提案する。
これにより、自己注意と生物学的神経プロセスに直接接続し、回転する特徴に現れるオブジェクト中心の表現の基本的なダイナミクスに光を当てることができます。
論文 参考訳(メタデータ) (2024-02-08T12:31:08Z) - Learning Physical Dynamics with Subequivariant Graph Neural Networks [99.41677381754678]
グラフニューラルネットワーク(GNN)は、物理力学を学習するための一般的なツールとなっている。
物理法則は、モデル一般化に必須な帰納バイアスである対称性に従属する。
本モデルは,RigidFall上でのPhysylonと2倍低ロールアウトMSEの8つのシナリオにおいて,平均3%以上の接触予測精度の向上を実現している。
論文 参考訳(メタデータ) (2022-10-13T10:00:30Z) - Robust and Controllable Object-Centric Learning through Energy-based
Models [95.68748828339059]
我々の研究は概念的にシンプルで一般的なアプローチであり、エネルギーベースモデルを通してオブジェクト中心の表現を学習する。
既存のアーキテクチャに容易に統合でき、高品質なオブジェクト中心表現を効果的に抽出できることを示す。
論文 参考訳(メタデータ) (2022-10-11T15:11:15Z) - Disentangling Shape and Pose for Object-Centric Deep Active Inference
Models [4.298360054690217]
本稿では,3次元オブジェクト表現の問題点を考察し,ShapeNetデータセットの異なるインスタンスに着目した。
深層ニューラルネットワークを用いて各因子の表現を学習しながら,対象の形状,ポーズ,カテゴリを分解するモデルを提案する。
論文 参考訳(メタデータ) (2022-09-16T12:53:49Z) - Sparse Relational Reasoning with Object-Centric Representations [78.83747601814669]
対象中心表現の操作において,リレーショナルニューラルアーキテクチャによって学習されたソフトルールの構成可能性について検討する。
特に特徴量の増加は,いくつかのモデルの性能を向上し,より単純な関係をもたらすことが判明した。
論文 参考訳(メタデータ) (2022-07-15T14:57:33Z) - Symmetry-Based Representations for Artificial and Biological General
Intelligence [4.39338211982718]
対称性変換は、よい表現となるものを探すための基本的な原理であると主張する。
対称性は機械学習でも注目され始めており、より多くのデータ効率と一般化可能なアルゴリズムが生まれている。
脳における表現学習における対称性変換の重要性の最初の実証は、神経科学において始まっている。
論文 参考訳(メタデータ) (2022-03-17T11:18:34Z) - Suspected Object Matters: Rethinking Model's Prediction for One-stage
Visual Grounding [93.82542533426766]
疑似オブジェクト間の対象オブジェクト選択を促進するため,疑似オブジェクト変換機構(SOT)を提案する。
SOTは既存のCNNとTransformerベースのワンステージ視覚グラウンドにシームレスに統合できる。
実験の結果,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-03-10T06:41:07Z) - Visual Grounding of Learned Physical Models [66.04898704928517]
人間は、物体の物理的特性を直感的に認識し、複雑な相互作用に従事している場合でも、その動きを予測する。
我々は、物理を同時に推論し、視覚と力学の先行に基づく将来の予測を行うニューラルモデルを提案する。
実験により、我々のモデルはいくつかの観測範囲内で物理的特性を推測できることが示され、モデルが目に見えないシナリオに迅速に適応し、将来正確な予測を行うことができる。
論文 参考訳(メタデータ) (2020-04-28T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。