論文の概要: Binding Dancers Into Attractors
- arxiv url: http://arxiv.org/abs/2206.02558v1
- Date: Wed, 1 Jun 2022 22:01:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-12 08:46:04.017039
- Title: Binding Dancers Into Attractors
- Title(参考訳): ダンサーを誘引者に縛る
- Authors: Franziska Kaltenberger, Sebastian Otte, Martin V. Butz
- Abstract要約: 特徴結合と視点取りは重要な認知能力である。
両課題を解消する再帰型ニューラルネットワークモデルを提案する。
まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。
そして、新しい視点と特徴配置を持つ類似の運動力学を提示する。
- 参考スコア(独自算出の注目度): 0.5801044612920815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: To effectively perceive and process observations in our environment, feature
binding and perspective taking are crucial cognitive abilities. Feature binding
combines observed features into one entity, called a Gestalt. Perspective
taking transfers the percept into a canonical, observer-centered frame of
reference. Here we propose a recurrent neural network model that solves both
challenges. We first train an LSTM to predict 3D motion dynamics from a
canonical perspective. We then present similar motion dynamics with novel
viewpoints and feature arrangements. Retrospective inference enables the
deduction of the canonical perspective. Combined with a robust mutual-exclusive
softmax selection scheme, random feature arrangements are reordered and
precisely bound into known Gestalt percepts. To corroborate evidence for the
architecture's cognitive validity, we examine its behavior on the silhouette
illusion, which elicits two competitive Gestalt interpretations of a rotating
dancer. Our system flexibly binds the information of the rotating figure into
the alternative attractors resolving the illusion's ambiguity and imagining the
respective depth interpretation and the corresponding direction of rotation. We
finally discuss the potential universality of the proposed mechanisms.
- Abstract(参考訳): 環境下での観察を効果的に知覚し、プロセスする上で、特徴結合と視点取りは重要な認知能力である。
特徴結合は観測された特徴を1つのエンティティに結合し、ゲシュタルトと呼ばれる。
パースペクティブテイキングは、知覚を標準的なオブザーバ中心の参照フレームに転送する。
本稿では,両課題を解決する再帰的ニューラルネットワークモデルを提案する。
まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。
次に,新しい視点と特徴配置で類似した動作ダイナミクスを示す。
振り返り推論は、標準的視点の推論を可能にする。
頑健な相互排他的ソフトマックス選択スキームと組み合わせて、ランダムな特徴配置を並べ替え、既知のゲシュタルト知覚に正確に結び付ける。
アーキテクチャの認知的妥当性の証拠を裏付けるために、回転するダンサーの2つのゲシュタルト解釈を取り入れたシルエット錯覚の挙動を検証した。
本システムは、錯覚の曖昧さを解消する代替アトラクタに回転図形の情報を柔軟に結合し、各深さ解釈と対応する回転方向を想像する。
最後に,提案手法の普遍性について考察する。
関連論文リスト
- Binding Dynamics in Rotating Features [72.80071820194273]
本稿では,特徴間のアライメントを明示的に計算し,それに応じて重みを調整する「コサイン結合」機構を提案する。
これにより、自己注意と生物学的神経プロセスに直接接続し、回転する特徴に現れるオブジェクト中心の表現の基本的なダイナミクスに光を当てることができます。
論文 参考訳(メタデータ) (2024-02-08T12:31:08Z) - Computing a human-like reaction time metric from stable recurrent vision
models [11.87006916768365]
我々は,刺激計算可能なタスク最適化モデルから,反応時間の計算量を構築するための汎用方法論をスケッチする。
評価基準は,4つの異なる視覚的意思決定タスクの刺激操作において,人間の反応時間のパターンと一致していることを示す。
この研究は、他の様々な認知タスクの文脈において、モデルと人間の視覚戦略の時間的アライメントを探索する方法を開拓する。
論文 参考訳(メタデータ) (2023-06-20T14:56:02Z) - MonoHuman: Animatable Human Neural Field from Monocular Video [30.113937856494726]
そこで我々は,任意のポーズの下で,ビュー一貫性と高忠実度アバターを強固に描画する新しいフレームワークMonoHumanを提案する。
我々のキーとなる洞察は、変形場を双方向の制約でモデル化し、オフザペグ情報を明示的に活用して、特徴を一貫性のある結果の推論を行うことである。
論文 参考訳(メタデータ) (2023-04-04T17:55:03Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Hybrid Predictive Coding: Inferring, Fast and Slow [62.997667081978825]
本稿では,反復型と償却型の両方を原則的に組み合わせたハイブリッド予測符号化ネットワークを提案する。
我々は,本モデルが本質的に不確実性に敏感であり,最小計算費用を用いて正確な信念を得るためにバランスを適応的にバランスさせることを実証した。
論文 参考訳(メタデータ) (2022-04-05T12:52:45Z) - MoCaNet: Motion Retargeting in-the-wild via Canonicalization Networks [77.56526918859345]
そこで本研究では,制御された環境から3次元動作タスクを実現する新しいフレームワークを提案する。
モーションキャプチャシステムや3D再構成手順を使わずに、2Dモノクロ映像のキャラクタから3Dキャラクタへの体動を可能にする。
論文 参考訳(メタデータ) (2021-12-19T07:52:05Z) - Towards Robust and Adaptive Motion Forecasting: A Causal Representation
Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。
我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。
合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文 参考訳(メタデータ) (2021-11-29T18:59:09Z) - Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。
我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。
モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文 参考訳(メタデータ) (2021-06-02T16:30:02Z) - Binding and Perspective Taking as Inference in a Generative Neural
Network Model [1.0323063834827415]
生成エンコーダ・デコーダアーキテクチャはその観点に適応し、振り返り推論によって特徴を結合する。
得られた勾配に基づく推論プロセスは、既知の生体運動パターンに対する視点の取扱いと結合の問題を解く。
論文 参考訳(メタデータ) (2020-12-09T16:43:26Z) - Unsupervised Discovery of Disentangled Manifolds in GANs [74.24771216154105]
解釈可能な生成プロセスは、様々な画像編集アプリケーションに有用である。
本稿では,任意の学習された生成逆数ネットワークが与えられた潜在空間における解釈可能な方向を検出する枠組みを提案する。
論文 参考訳(メタデータ) (2020-11-24T02:18:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。