論文の概要: Binding Dancers Into Attractors
- arxiv url: http://arxiv.org/abs/2206.02558v1
- Date: Wed, 1 Jun 2022 22:01:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-12 08:46:04.017039
- Title: Binding Dancers Into Attractors
- Title(参考訳): ダンサーを誘引者に縛る
- Authors: Franziska Kaltenberger, Sebastian Otte, Martin V. Butz
- Abstract要約: 特徴結合と視点取りは重要な認知能力である。
両課題を解消する再帰型ニューラルネットワークモデルを提案する。
まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。
そして、新しい視点と特徴配置を持つ類似の運動力学を提示する。
- 参考スコア(独自算出の注目度): 0.5801044612920815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To effectively perceive and process observations in our environment, feature
binding and perspective taking are crucial cognitive abilities. Feature binding
combines observed features into one entity, called a Gestalt. Perspective
taking transfers the percept into a canonical, observer-centered frame of
reference. Here we propose a recurrent neural network model that solves both
challenges. We first train an LSTM to predict 3D motion dynamics from a
canonical perspective. We then present similar motion dynamics with novel
viewpoints and feature arrangements. Retrospective inference enables the
deduction of the canonical perspective. Combined with a robust mutual-exclusive
softmax selection scheme, random feature arrangements are reordered and
precisely bound into known Gestalt percepts. To corroborate evidence for the
architecture's cognitive validity, we examine its behavior on the silhouette
illusion, which elicits two competitive Gestalt interpretations of a rotating
dancer. Our system flexibly binds the information of the rotating figure into
the alternative attractors resolving the illusion's ambiguity and imagining the
respective depth interpretation and the corresponding direction of rotation. We
finally discuss the potential universality of the proposed mechanisms.
- Abstract(参考訳): 環境下での観察を効果的に知覚し、プロセスする上で、特徴結合と視点取りは重要な認知能力である。
特徴結合は観測された特徴を1つのエンティティに結合し、ゲシュタルトと呼ばれる。
パースペクティブテイキングは、知覚を標準的なオブザーバ中心の参照フレームに転送する。
本稿では,両課題を解決する再帰的ニューラルネットワークモデルを提案する。
まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。
次に,新しい視点と特徴配置で類似した動作ダイナミクスを示す。
振り返り推論は、標準的視点の推論を可能にする。
頑健な相互排他的ソフトマックス選択スキームと組み合わせて、ランダムな特徴配置を並べ替え、既知のゲシュタルト知覚に正確に結び付ける。
アーキテクチャの認知的妥当性の証拠を裏付けるために、回転するダンサーの2つのゲシュタルト解釈を取り入れたシルエット錯覚の挙動を検証した。
本システムは、錯覚の曖昧さを解消する代替アトラクタに回転図形の情報を柔軟に結合し、各深さ解釈と対応する回転方向を想像する。
最後に,提案手法の普遍性について考察する。
関連論文リスト
- Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction [60.964512894143475]
本稿では,空間的局所化とビュー予測を共同で扱う新しい自動回帰フレームワークである生成空間変換器(GST)を提案する。
本モデルでは,カメラのポーズを1つの画像から同時に推定し,新しいカメラのポーズから視点を予測し,空間認識と視覚予測のギャップを効果的に埋める。
論文 参考訳(メタデータ) (2024-10-24T17:58:05Z) - Artificial Kuramoto Oscillatory Neurons [65.16453738828672]
しきい値単位の動的代替として人工内蔵ニューロン(AKOrN)を導入する。
このアイデアは、幅広いタスクにまたがってパフォーマンス改善をもたらすことを示しています。
これらの経験的結果は、神経表現の最も基本的なレベルにおいて、私たちの仮定の重要性を示していると信じている。
論文 参考訳(メタデータ) (2024-10-17T17:47:54Z) - Spherical World-Locking for Audio-Visual Localization in Egocentric Videos [53.658928180166534]
我々は,エゴセントリックなシーン表現のための一般的なフレームワークとして,球状ワールドロックを提案する。
従来の2次元平面場を持つ自己中心表現と比較して、SWLは自動による課題を効果的に相殺する。
シーン表現の球面構造を保存する統一エンコーダデコーダトランスアーキテクチャを設計する。
論文 参考訳(メタデータ) (2024-08-09T22:29:04Z) - Neural Concept Binder [22.074896812195437]
本稿では、離散概念表現と連続概念表現の両方を導出するフレームワークであるNeural Concept Binder (NCB)を紹介する。
NCBの概念表現の構造的性質は、直感的な検査と外部知識の直接的な統合を可能にする。
新たに導入したCLEVR-Sudokuデータセットを用いて,NCBの有効性を評価する。
論文 参考訳(メタデータ) (2024-06-14T11:52:09Z) - Binding Dynamics in Rotating Features [72.80071820194273]
本稿では,特徴間のアライメントを明示的に計算し,それに応じて重みを調整する「コサイン結合」機構を提案する。
これにより、自己注意と生物学的神経プロセスに直接接続し、回転する特徴に現れるオブジェクト中心の表現の基本的なダイナミクスに光を当てることができます。
論文 参考訳(メタデータ) (2024-02-08T12:31:08Z) - Computing a human-like reaction time metric from stable recurrent vision
models [11.87006916768365]
我々は,刺激計算可能なタスク最適化モデルから,反応時間の計算量を構築するための汎用方法論をスケッチする。
評価基準は,4つの異なる視覚的意思決定タスクの刺激操作において,人間の反応時間のパターンと一致していることを示す。
この研究は、他の様々な認知タスクの文脈において、モデルと人間の視覚戦略の時間的アライメントを探索する方法を開拓する。
論文 参考訳(メタデータ) (2023-06-20T14:56:02Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。
我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。
モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文 参考訳(メタデータ) (2021-06-02T16:30:02Z) - Binding and Perspective Taking as Inference in a Generative Neural
Network Model [1.0323063834827415]
生成エンコーダ・デコーダアーキテクチャはその観点に適応し、振り返り推論によって特徴を結合する。
得られた勾配に基づく推論プロセスは、既知の生体運動パターンに対する視点の取扱いと結合の問題を解く。
論文 参考訳(メタデータ) (2020-12-09T16:43:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。