Fugu-MT 論文翻訳(概要): Binding Dancers Into Attractors

論文の概要: Binding Dancers Into Attractors

arxiv url: http://arxiv.org/abs/2206.02558v1
Date: Wed, 1 Jun 2022 22:01:29 GMT
ステータス: 翻訳完了
システム内更新日: 2022-06-12 08:46:04.017039
Title: Binding Dancers Into Attractors
Title（参考訳）: ダンサーを誘引者に縛る
Authors: Franziska Kaltenberger, Sebastian Otte, Martin V. Butz
Abstract要約: 特徴結合と視点取りは重要な認知能力である。両課題を解消する再帰型ニューラルネットワークモデルを提案する。まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。そして、新しい視点と特徴配置を持つ類似の運動力学を提示する。
参考スコア（独自算出の注目度）: 0.5801044612920815
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: To effectively perceive and process observations in our environment, feature binding and perspective taking are crucial cognitive abilities. Feature binding combines observed features into one entity, called a Gestalt. Perspective taking transfers the percept into a canonical, observer-centered frame of reference. Here we propose a recurrent neural network model that solves both challenges. We first train an LSTM to predict 3D motion dynamics from a canonical perspective. We then present similar motion dynamics with novel viewpoints and feature arrangements. Retrospective inference enables the deduction of the canonical perspective. Combined with a robust mutual-exclusive softmax selection scheme, random feature arrangements are reordered and precisely bound into known Gestalt percepts. To corroborate evidence for the architecture's cognitive validity, we examine its behavior on the silhouette illusion, which elicits two competitive Gestalt interpretations of a rotating dancer. Our system flexibly binds the information of the rotating figure into the alternative attractors resolving the illusion's ambiguity and imagining the respective depth interpretation and the corresponding direction of rotation. We finally discuss the potential universality of the proposed mechanisms.
Abstract（参考訳）: 環境下での観察を効果的に知覚し、プロセスする上で、特徴結合と視点取りは重要な認知能力である。特徴結合は観測された特徴を1つのエンティティに結合し、ゲシュタルトと呼ばれる。パースペクティブテイキングは、知覚を標準的なオブザーバ中心の参照フレームに転送する。本稿では,両課題を解決する再帰的ニューラルネットワークモデルを提案する。まずLSTMをトレーニングし、標準的視点から3次元運動力学を予測する。次に,新しい視点と特徴配置で類似した動作ダイナミクスを示す。振り返り推論は、標準的視点の推論を可能にする。頑健な相互排他的ソフトマックス選択スキームと組み合わせて、ランダムな特徴配置を並べ替え、既知のゲシュタルト知覚に正確に結び付ける。アーキテクチャの認知的妥当性の証拠を裏付けるために、回転するダンサーの2つのゲシュタルト解釈を取り入れたシルエット錯覚の挙動を検証した。本システムは、錯覚の曖昧さを解消する代替アトラクタに回転図形の情報を柔軟に結合し、各深さ解釈と対応する回転方向を想像する。最後に,提案手法の普遍性について考察する。

関連論文リスト

Convergent transformations of visual representation in brains and models [0.0]
認知神経科学における根本的な疑問は、視覚的知覚(外界の構造や脳の内部構造)をどう形成するかである。人間の視覚と人工視覚の両方において、外界の構造によって駆動される視覚的エンコーディングのための収束した計算解を示す。
論文参考訳（メタデータ） (2025-07-18T14:13:54Z)
Concept-Guided Interpretability via Neural Chunking [54.73787666584143]
ニューラルネットワークは、トレーニングデータの規則性を反映した生の集団活動のパターンを示す。本稿では,ラベルの可利用性と次元性に基づいて,これら新たな実体を抽出する3つの手法を提案する。私たちの研究は、認知原則と自然主義的データの構造の両方を活用する、解釈可能性の新しい方向性を指し示しています。
論文参考訳（メタデータ） (2025-05-16T13:49:43Z)
Where Am I and What Will I See: An Auto-Regressive Model for Spatial Localization and View Prediction [60.964512894143475]
本稿では,空間的局所化とビュー予測を共同で扱う新しい自動回帰フレームワークである生成空間変換器(GST)を提案する。本モデルでは,カメラのポーズを1つの画像から同時に推定し,新しいカメラのポーズから視点を予測し,空間認識と視覚予測のギャップを効果的に埋める。
論文参考訳（メタデータ） (2024-10-24T17:58:05Z)
Artificial Kuramoto Oscillatory Neurons [65.16453738828672]
しきい値単位の動的代替として人工内蔵ニューロン(AKOrN)を導入する。このアイデアは、幅広いタスクにまたがってパフォーマンス改善をもたらすことを示しています。これらの経験的結果は、神経表現の最も基本的なレベルにおいて、私たちの仮定の重要性を示していると信じている。
論文参考訳（メタデータ） (2024-10-17T17:47:54Z)
Spherical World-Locking for Audio-Visual Localization in Egocentric Videos [53.658928180166534]
我々は,エゴセントリックなシーン表現のための一般的なフレームワークとして,球状ワールドロックを提案する。従来の2次元平面場を持つ自己中心表現と比較して、SWLは自動による課題を効果的に相殺する。シーン表現の球面構造を保存する統一エンコーダデコーダトランスアーキテクチャを設計する。
論文参考訳（メタデータ） (2024-08-09T22:29:04Z)
Neural Concept Binder [22.074896812195437]
本稿では、離散概念表現と連続概念表現の両方を導出するフレームワークであるNeural Concept Binder (NCB)を紹介する。 NCBの概念表現の構造的性質は、直感的な検査と外部知識の直接的な統合を可能にする。新たに導入したCLEVR-Sudokuデータセットを用いて,NCBの有効性を評価する。
論文参考訳（メタデータ） (2024-06-14T11:52:09Z)
Binding Dynamics in Rotating Features [72.80071820194273]
本稿では,特徴間のアライメントを明示的に計算し,それに応じて重みを調整する「コサイン結合」機構を提案する。これにより、自己注意と生物学的神経プロセスに直接接続し、回転する特徴に現れるオブジェクト中心の表現の基本的なダイナミクスに光を当てることができます。
論文参考訳（メタデータ） (2024-02-08T12:31:08Z)
Computing a human-like reaction time metric from stable recurrent vision models [11.87006916768365]
我々は,刺激計算可能なタスク最適化モデルから,反応時間の計算量を構築するための汎用方法論をスケッチする。評価基準は,4つの異なる視覚的意思決定タスクの刺激操作において,人間の反応時間のパターンと一致していることを示す。この研究は、他の様々な認知タスクの文脈において、モデルと人間の視覚戦略の時間的アライメントを探索する方法を開拓する。
論文参考訳（メタデータ） (2023-06-20T14:56:02Z)
Stochastic Coherence Over Attention Trajectory For Continuous Learning In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文参考訳（メタデータ） (2022-04-26T09:52:31Z)
Towards Robust and Adaptive Motion Forecasting: A Causal Representation Perspective [72.55093886515824]
本稿では,3つの潜伏変数群からなる動的過程として,運動予測の因果的形式化を導入する。我々は、因果グラフを近似するために、不変なメカニズムやスタイルの共創者の表現を分解するモジュラーアーキテクチャを考案する。合成および実データを用いた実験結果から,提案した3つの成分は,学習した動き表現の頑健性と再利用性を大幅に向上することが示された。
論文参考訳（メタデータ） (2021-11-29T18:59:09Z)
Fully Steerable 3D Spherical Neurons [14.86655504533083]
本稿では,球面決定曲面からなり,点雲上で動作可能なフィードフォワード学習方式を提案する。我々の理論の固有の幾何学的3次元構造のため、我々はその原子部分に対して3次元の操舵性制約を導出する。モデルパラメータが推論時にどのように完全に制御可能であるかを示す。
論文参考訳（メタデータ） (2021-06-02T16:30:02Z)
Binding and Perspective Taking as Inference in a Generative Neural Network Model [1.0323063834827415]
生成エンコーダ・デコーダアーキテクチャはその観点に適応し、振り返り推論によって特徴を結合する。得られた勾配に基づく推論プロセスは、既知の生体運動パターンに対する視点の取扱いと結合の問題を解く。
論文参考訳（メタデータ） (2020-12-09T16:43:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。