論文の概要: Learning Hierarchical Integration of Foveal and Peripheral Vision for
Vergence Control by Active Efficient Coding
- arxiv url: http://arxiv.org/abs/2103.05100v1
- Date: Fri, 29 Jan 2021 08:53:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 13:09:09.817395
- Title: Learning Hierarchical Integration of Foveal and Peripheral Vision for
Vergence Control by Active Efficient Coding
- Title(参考訳): 能動符号化による頂点制御のための焦点・周辺視の階層的統合学習
- Authors: Zhetuo Zhao, Jochen Triesch, Bertram E. Shi
- Abstract要約: Vergenceは、フォヴェアと周辺の両方の情報によって駆動される。
このような2段階の階層的アプローチを提案する。
この階層的アプローチは,実環境において従来のアプローチよりも優れた性能を示す。
- 参考スコア(独自算出の注目度): 5.653716495767271
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The active efficient coding (AEC) framework parsimoniously explains the joint
development of visual processing and eye movements, e.g., the emergence of
binocular disparity selective neurons and fusional vergence, the disjunctive
eye movements that align left and right eye images. Vergence can be driven by
information in both the fovea and periphery, which play complementary roles.
The high resolution fovea can drive precise short range movements. The lower
resolution periphery supports coarser long range movements. The fovea and
periphery may also contain conflicting information, e.g. due to objects at
different depths. While past AEC models did integrate peripheral and foveal
information, they did not explicitly take into account these characteristics.
We propose here a two-level hierarchical approach that does. The bottom level
generates different vergence actions from foveal and peripheral regions. The
top level selects one. We demonstrate that the hierarchical approach performs
better than prior approaches in realistic environments, exhibiting better
alignment and less oscillation.
- Abstract(参考訳): 能動的高能率符号化(AEC)フレームワークは、視覚処理と眼球運動のジョイント発達、例えば両眼差選択性ニューロンの出現と、左右の眼像を整列する解離性眼球運動の融合頂点をパロニクス的に説明する。
Vergenceは、相補的な役割を果たす葉と周辺の両方の情報によって駆動される。
高分解能フォビアは正確な短距離運動を駆動することができる。
低解像度周辺は、粗い長距離運動をサポートする。
fovea と periphery は、例えば、矛盾する情報を含むこともある。
物体の深さが異なるためです
過去のAECモデルは周辺情報と胎児情報を統合していたが、これらの特徴を明示的に考慮しなかった。
ここでは2段階の階層的アプローチを提案する。
下部レベルは、窩および周辺領域から異なるバージェンス作用を生成する。
トップレベルは1つを選ぶ。
階層的アプローチは現実的な環境において従来のアプローチよりも優れており、アライメントが良く、振動も少ないことを示す。
関連論文リスト
- Dual-Image Enhanced CLIP for Zero-Shot Anomaly Detection [58.228940066769596]
本稿では,統合視覚言語スコアリングシステムを活用したデュアルイメージ強化CLIP手法を提案する。
提案手法は,画像のペアを処理し,それぞれを視覚的参照として利用することにより,視覚的コンテキストによる推論プロセスを強化する。
提案手法は視覚言語による関節異常検出の可能性を大幅に活用し,従来のSOTA法と同等の性能を示す。
論文 参考訳(メタデータ) (2024-05-08T03:13:20Z) - Pose-Guided Self-Training with Two-Stage Clustering for Unsupervised Landmark Discovery [17.455841673719625]
オブジェクトカテゴリの教師なしランドマーク発見(ULD)は、コンピュータビジョンの問題である。
堅牢な ULD フレームワークの開発を追求するために,拡散モデルとして知られる,近年の自己教師型学習アルゴリズムの可能性を探る。
提案手法は, AFLW, MAFL, CatHeads, LS3Dの4つの挑戦的ベンチマークにおいて, 最先端の手法を著しく上回っている。
論文 参考訳(メタデータ) (2024-03-24T15:24:04Z) - A Contrastive Variational Graph Auto-Encoder for Node Clustering [10.52321770126932]
最先端のクラスタリング手法には多くの課題がある。
既存のVGAEは、推論と生成モデルの相違を考慮していない。
私たちのソリューションには、フィーチャーランダムネスとフィーチャードリフトのトレードオフを制御する2つのメカニズムがあります。
論文 参考訳(メタデータ) (2023-12-28T05:07:57Z) - HiH: A Multi-modal Hierarchy in Hierarchy Network for Unconstrained Gait Recognition [3.431054404120758]
本稿では,階層型ネットワーク(HiH)におけるマルチモーダル階層(Hierarchy in Hierarchy Network)について述べる。
HiH は階層的なゲイト・デコンポザ・モジュールを用いてシルエットデータから一般的なゲイト・パターンの深度的およびモジュール内階層的な検証を行う主ブランチを特徴とする。
2次元関節配列に基づく補助枝は、歩行解析の空間的側面と時間的側面を豊かにする。
論文 参考訳(メタデータ) (2023-11-19T03:25:14Z) - Bilevel Fast Scene Adaptation for Low-Light Image Enhancement [50.639332885989255]
低照度シーンにおける画像の強調は、コンピュータビジョンにおいて難しいが、広く懸念されている課題である。
主な障害は、異なるシーンにまたがる分散の相違によるモデリングの混乱にある。
上述の潜在対応をモデル化するための双レベルパラダイムを導入する。
エンコーダのシーン非関連な一般化を多様なシーンにもたらすために、双方向学習フレームワークを構築した。
論文 参考訳(メタデータ) (2023-06-02T08:16:21Z) - Joint fMRI Decoding and Encoding with Latent Embedding Alignment [77.66508125297754]
我々はfMRIデコーディングと符号化の両方に対処する統合フレームワークを導入する。
本モデルでは、fMRI信号から視覚刺激を同時に回復し、統合された枠組み内の画像から脳活動を予測する。
論文 参考訳(メタデータ) (2023-03-26T14:14:58Z) - Spatiotemporal Multi-scale Bilateral Motion Network for Gait Recognition [3.1240043488226967]
本稿では,光学的流れに動機づけられた両動方向の特徴について述べる。
動作コンテキストを多段階の時間分解能でリッチに記述する多段階の時間表現を開発する。
論文 参考訳(メタデータ) (2022-09-26T01:36:22Z) - Unsupervised Video Domain Adaptation for Action Recognition: A
Disentanglement Perspective [37.45565756522847]
我々は2つの潜在要因からドメイン間ビデオを生成することを検討する。
TranSVAEフレームワークはそのような世代をモデル化するために開発される。
UCF-HMDB、Jester、Epic-Kitchensデータセットの実験は、TranSVAEの有効性と優位性を検証する。
論文 参考訳(メタデータ) (2022-08-15T17:59:31Z) - Hierarchical Feature Alignment Network for Unsupervised Video Object
Segmentation [99.70336991366403]
外観・動作特徴アライメントのための簡潔で実用的で効率的なアーキテクチャを提案する。
提案されたHFANはDAVIS-16の最先端性能に到達し、88.7ドルのmathcalJ&mathcalF$Meanを達成した。
論文 参考訳(メタデータ) (2022-07-18T10:10:14Z) - Stochastic Coherence Over Attention Trajectory For Continuous Learning
In Video Streams [64.82800502603138]
本稿では,映像ストリーム中のピクセルワイズ表現を段階的かつ自律的に開発するための,ニューラルネットワークに基づく新しいアプローチを提案する。
提案手法は, 参加者の入場地を観察することで, エージェントが学習できる, 人間の様の注意機構に基づく。
実験では,3次元仮想環境を利用して,映像ストリームを観察することで,エージェントが物体の識別を学べることを示す。
論文 参考訳(メタデータ) (2022-04-26T09:52:31Z) - Unsupervised Motion Representation Learning with Capsule Autoencoders [54.81628825371412]
Motion Capsule Autoencoder (MCAE) は、2レベル階層のモーションをモデル化する。
MCAEは、新しいTrajectory20モーションデータセットと、様々な現実世界の骨格に基づく人間のアクションデータセットで評価されている。
論文 参考訳(メタデータ) (2021-10-01T16:52:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。