論文の概要: The Challenge of Appearance-Free Object Tracking with Feedforward Neural
Networks
- arxiv url: http://arxiv.org/abs/2110.02772v1
- Date: Thu, 30 Sep 2021 17:58:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-10 09:15:53.494323
- Title: The Challenge of Appearance-Free Object Tracking with Feedforward Neural
Networks
- Title(参考訳): フィードフォワードニューラルネットワークによる外見自由物体追跡の課題
- Authors: Girik Malik, Drew Linsley, Thomas Serre, Ennio Mingolla
- Abstract要約: $itPathTracker$は、観察者が自分の動きだけでオブジェクトを追跡することを学べる機能をテストする。
標準的な3D畳み込み型ディープネットワークモデルは,この問題の解決に苦慮している。
生物学的視覚からの外見のない物体追跡のための戦略は、解決策を刺激することができる。
- 参考スコア(独自算出の注目度): 12.081808043723937
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Nearly all models for object tracking with artificial neural networks depend
on appearance features extracted from a "backbone" architecture, designed for
object recognition. Indeed, significant progress on object tracking has been
spurred by introducing backbones that are better able to discriminate objects
by their appearance. However, extensive neurophysiology and psychophysics
evidence suggests that biological visual systems track objects using both
appearance and motion features. Here, we introduce $\textit{PathTracker}$, a
visual challenge inspired by cognitive psychology, which tests the ability of
observers to learn to track objects solely by their motion. We find that
standard 3D-convolutional deep network models struggle to solve this task when
clutter is introduced into the generated scenes, or when objects travel long
distances. This challenge reveals that tracing the path of object motion is a
blind spot of feedforward neural networks. We expect that strategies for
appearance-free object tracking from biological vision can inspire solutions
these failures of deep neural networks.
- Abstract(参考訳): ニューラルネットワークを用いた物体追跡のほとんど全てのモデルは、物体認識のために設計された"バックボーン"アーキテクチャから抽出された外観特徴に依存する。
実際、オブジェクト追跡の大幅な進歩は、その外観によってオブジェクトを識別しやすくするバックボーンの導入によって加速された。
しかし、神経生理学と心理物理学の広範な証拠は、生物学的視覚システムが外見と運動の特徴の両方を用いて物体を追跡することを示唆している。
これは認知心理学に触発された視覚的チャレンジで、観察者が自分の動きだけで物体を追跡することを学ぶ能力をテストする。
標準の3次元畳み込み深層ネットワークモデルは、生成されたシーンに乱れが生じたり、物体が長距離を移動するときに、この課題を解決するのに苦労している。
この課題は、物体の動きの経路を辿ることが、フィードフォワードニューラルネットワークの盲点であることを明らかにする。
我々は、生物学的ビジョンから外見のない物体追跡の戦略が、ディープニューラルネットワークのこれらの障害を解き起こすことを期待する。
関連論文リスト
- Discovering Chunks in Neural Embeddings for Interpretability [53.80157905839065]
本稿では, チャンキングの原理を応用して, 人工神経集団活動の解釈を提案する。
まず、この概念を正則性を持つ人工シーケンスを訓練したリカレントニューラルネットワーク(RNN)で実証する。
我々は、これらの状態に対する摂動が関連する概念を活性化または阻害すると共に、入力における概念に対応する同様の繰り返し埋め込み状態を特定する。
論文 参考訳(メタデータ) (2025-02-03T20:30:46Z) - Tracking objects that change in appearance with phase synchrony [14.784044408031098]
ニューラルシンクロニーにより,新たな深層学習回路が,世界の場所と独立して特徴への注意を制御できることが示される。
大規模課題であるFeatureTrackerを用いて、人間、CV-RNN、その他のディープニューラルネットワーク(DNN)のオブジェクト追跡を比較した。
我々のCV-RNNは、この課題において人間と同じような振る舞いをし、相同期の役割の計算的概念実証を提供する。
論文 参考訳(メタデータ) (2024-10-02T23:30:05Z) - Learning Object-Centric Representation via Reverse Hierarchy Guidance [73.05170419085796]
OCL(Object-Centric Learning)は、ニューラルネットワークが視覚的なシーンで個々のオブジェクトを識別できるようにする。
RHGNetは、トレーニングと推論プロセスにおいて、さまざまな方法で機能するトップダウンパスを導入している。
我々のモデルは、よく使われる複数のデータセット上でSOTA性能を達成する。
論文 参考訳(メタデータ) (2024-05-17T07:48:27Z) - BI AVAN: Brain inspired Adversarial Visual Attention Network [67.05560966998559]
機能的脳活動から直接人間の視覚的注意を特徴付ける脳誘発対人視覚注意ネットワーク(BI-AVAN)を提案する。
本モデルは,人間の脳が監督されていない方法で焦点を絞った映画フレーム内の視覚的物体を識別・発見するために,注意関連・無視対象間の偏りのある競合過程を模倣する。
論文 参考訳(メタデータ) (2022-10-27T22:20:36Z) - Adapting Brain-Like Neural Networks for Modeling Cortical Visual
Prostheses [68.96380145211093]
皮質補綴は視覚野に移植された装置で、電気的にニューロンを刺激することで失った視力を回復しようとする。
現在、これらのデバイスが提供する視覚は限られており、刺激による視覚知覚を正確に予測することはオープンな課題である。
我々は、視覚システムの有望なモデルとして登場した「脳様」畳み込みニューラルネットワーク(CNN)を活用することで、この問題に対処することを提案する。
論文 参考訳(メタデータ) (2022-09-27T17:33:19Z) - Learning What and Where -- Unsupervised Disentangling Location and
Identity Tracking [0.44040106718326594]
教師なしLOCation and Identity Tracking System(Loci)を導入する。
ローチは脳の背腹側経路にインスパイアされ、自己監督された分離機構を用いて、何とどこにも結合する問題に取り組む。
Lociは、より深い説明指向のビデオ処理のステージを設定できる。
論文 参考訳(メタデータ) (2022-05-26T13:30:14Z) - The Right Spin: Learning Object Motion from Rotation-Compensated Flow
Fields [61.664963331203666]
人間がどのように動く物体を知覚するかは、コンピュータービジョンにおける長年の研究課題である。
この問題の1つのアプローチは、これらすべての効果をモデル化するためのディープネットワークを教えることである。
運動場からカメラの回転を推定する新しい確率モデルを提案する。
論文 参考訳(メタデータ) (2022-02-28T22:05:09Z) - Capturing the objects of vision with neural networks [0.0]
人間の視覚知覚はその物理的関節でシーンを彫り、世界をオブジェクトに分解する。
対照的に、視覚物体認識のディープニューラルネットワーク(DNN)モデルは、主に感覚入力と結びついている。
両分野の関連研究をレビューし、これらの分野が相互にどのように役立つかを検討する。
論文 参考訳(メタデータ) (2021-09-07T21:49:53Z) - Tracking Without Re-recognition in Humans and Machines [12.591847867999636]
我々は、ビジュアルトラッキングのための最先端のディープニューラルネットワークが、同じことができるかどうか検討する。
PathTrackerは人間の観察者や機械に対象物を追跡するための視覚的課題である。
動作手がかりに基づく物体追跡に関係した生体脳の回路機構をモデル化する。
論文 参考訳(メタデータ) (2021-05-27T17:56:37Z) - Deep Spiking Convolutional Neural Network for Single Object Localization
Based On Deep Continuous Local Learning [0.0]
グレースケール画像における単一物体の局所化のための深部畳み込みスパイクニューラルネットワークを提案する。
Oxford-IIIT-Petで報告された結果は、教師付き学習アプローチによるスパイクニューラルネットワークの活用を検証する。
論文 参考訳(メタデータ) (2021-05-12T12:02:05Z) - Learning Contact Dynamics using Physically Structured Neural Networks [81.73947303886753]
ディープニューラルネットワークと微分方程式の接続を用いて、オブジェクト間の接触ダイナミクスを表現するディープネットワークアーキテクチャのファミリを設計する。
これらのネットワークは,ノイズ観測から不連続な接触事象をデータ効率良く学習できることを示す。
以上の結果から,タッチフィードバックの理想化形態は,この学習課題を扱いやすくするための重要な要素であることが示唆された。
論文 参考訳(メタデータ) (2021-02-22T17:33:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。