論文の概要: Saccade Mechanisms for Image Classification, Object Detection and
Tracking
- arxiv url: http://arxiv.org/abs/2206.05102v1
- Date: Fri, 10 Jun 2022 13:50:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-13 18:44:33.824436
- Title: Saccade Mechanisms for Image Classification, Object Detection and
Tracking
- Title(参考訳): 画像分類・物体検出・追跡のためのサッケード機構
- Authors: Saurabh Farkya, Zachary Daniels, Aswin Nadamuni Raghavan, David Zhang,
and Michael Piacentino
- Abstract要約: 生体視覚からのササード機構を用いて、ディープニューラルネットワークを分類や物体検出の問題をより効率的にする方法について検討する。
提案手法は、注意駆動型視覚処理とササードのアイデアに基づいており、注意に影響された眼球運動のミニチュア化を図っている。
- 参考スコア(独自算出の注目度): 12.751552698602744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We examine how the saccade mechanism from biological vision can be used to
make deep neural networks more efficient for classification and object
detection problems. Our proposed approach is based on the ideas of
attention-driven visual processing and saccades, miniature eye movements
influenced by attention. We conduct experiments by analyzing: i) the robustness
of different deep neural network (DNN) feature extractors to partially-sensed
images for image classification and object detection, and ii) the utility of
saccades in masking image patches for image classification and object tracking.
Experiments with convolutional nets (ResNet-18) and transformer-based models
(ViT, DETR, TransTrack) are conducted on several datasets (CIFAR-10, DAVSOD,
MSCOCO, and MOT17). Our experiments show intelligent data reduction via
learning to mimic human saccades when used in conjunction with state-of-the-art
DNNs for classification, detection, and tracking tasks. We observed minimal
drop in performance for the classification and detection tasks while only using
about 30\% of the original sensor data. We discuss how the saccade mechanism
can inform hardware design via ``in-pixel'' processing.
- Abstract(参考訳): 深層ニューラルネットワークの分類や物体検出の問題をより効率的にするために,生体ビジョンによるサッケード機構をどのように利用できるか検討する。
提案手法は,注意駆動視覚処理とサッケード,注意の影響を受けるミニチュアアイムーブメントの考え方に基づいている。
分析して実験を行います
一 画像分類及び物体検出のための部分センシング画像に対する異なるディープニューラルネットワーク(DNN)特徴抽出器の堅牢性
二 画像分類及び物体追跡のためのマスキング画像パッチにおけるサッケードの有用性
畳み込みネット(ResNet-18)とトランスフォーマーベースモデル(ViT, DETR, TransTrack)を複数のデータセット(CIFAR-10, DAVSOD, MSCOCO, MOT17)で実験した。
実験では,人間のサッケードを模倣する学習によるインテリジェントなデータ削減と,最先端のdnnを併用して分類,検出,追跡を行う。
センサデータの約30\%のみを使用しながら,分類・検出タスクにおける性能の低下を最小とした。
我々は、saccade機構が ‘in-pixel'' 処理によってハードウェア設計にどのように影響を与えるかについて議論する。
関連論文リスト
- Visual Context-Aware Person Fall Detection [52.49277799455569]
画像中の個人とオブジェクトを半自動分離するセグメンテーションパイプラインを提案する。
ベッド、椅子、車椅子などの背景オブジェクトは、転倒検知システムに挑戦し、誤ったポジティブアラームを引き起こす。
トレーニング中のオブジェクト固有のコンテキスト変換が、この課題を効果的に軽減することを示す。
論文 参考訳(メタデータ) (2024-04-11T19:06:36Z) - Image complexity based fMRI-BOLD visual network categorization across
visual datasets using topological descriptors and deep-hybrid learning [3.522950356329991]
本研究の目的は,視覚的データセットと異なる視覚刺激に応答して,ネットワークトポロジがどう異なるかを検討することである。
これを実現するために、COCO、ImageNet、SUNを表す視覚ネットワーク毎に0次元および1次元の永続図を演算する。
抽出したK平均クラスター特徴は、これらの視覚ネットワークの分類において90%-95%の範囲で精度の高い新しいディープハイブリッドモデルに供給される。
論文 参考訳(メタデータ) (2023-11-03T14:05:57Z) - Forged Image Detection using SOTA Image Classification Deep Learning
Methods for Image Forensics with Error Level Analysis [2.719418335747252]
画像法医学はコンピュータビジョンアプリケーションの主要な分野の1つである。
forgery of image is sub-category of image forensics and can detected using Error Level Analysis。
我々は,CASIA ITDE v.2データセットを用いた誤りレベルの解析により,最先端の画像分類モデルを用いて転送学習を行う。
論文 参考訳(メタデータ) (2022-11-28T10:10:42Z) - Active Gaze Control for Foveal Scene Exploration [124.11737060344052]
本研究では,葉型カメラを用いた人間とロボットが現場を探索する方法をエミュレートする手法を提案する。
提案手法は,同数の視線シフトに対してF1スコアを2~3ポイント増加させる。
論文 参考訳(メタデータ) (2022-08-24T14:59:28Z) - FuNNscope: Visual microscope for interactively exploring the loss
landscape of fully connected neural networks [77.34726150561087]
ニューラルネットワークの高次元景観特性を探索する方法を示す。
我々は、小さなニューラルネットワークの観測結果をより複雑なシステムに一般化する。
インタラクティブダッシュボードは、いくつかのアプリケーションネットワークを開放する。
論文 参考訳(メタデータ) (2022-04-09T16:41:53Z) - Vision Transformer with Convolutions Architecture Search [72.70461709267497]
本稿では,畳み込み型アーキテクチャサーチ(VTCAS)を用いたアーキテクチャ探索手法を提案する。
VTCASによって探索された高性能バックボーンネットワークは、畳み込みニューラルネットワークの望ましい特徴をトランスフォーマーアーキテクチャに導入する。
これは、特に低照度屋内シーンにおいて、物体認識のためのニューラルネットワークの堅牢性を高める。
論文 参考訳(メタデータ) (2022-03-20T02:59:51Z) - Hybrid Optimized Deep Convolution Neural Network based Learning Model
for Object Detection [0.0]
物体の識別はコンピュータビジョンにおける最も基本的で難しい問題の1つである。
近年,ディープラーニングに基づく物体検出技術が大衆の関心を集めている。
本研究では,自律型物体検出システムを構築するために,独自のディープラーニング分類手法を用いる。
提案するフレームワークは検出精度0.9864であり、現在の技術よりも高い。
論文 参考訳(メタデータ) (2022-03-02T04:39:37Z) - Robust Region Feature Synthesizer for Zero-Shot Object Detection [87.79902339984142]
我々は,クラス内セマンティック・ディバージングコンポーネントとクラス間構造保存コンポーネントを含む,新しいゼロショットオブジェクト検出フレームワークを構築した。
リモートセンシング画像においてゼロショット物体検出を行う最初の研究である。
論文 参考訳(メタデータ) (2022-01-01T03:09:15Z) - Distractor-Aware Neuron Intrinsic Learning for Generic 2D Medical Image
Classifications [30.62607811479386]
我々は、畳み込みニューラルネットワーク(CNN)が障害的干渉に弱いことを観察する。
本稿では,ニューロン固有の学習手法を提案することで,CNN特徴空間からの逸脱を探索する。
提案手法は最先端のアプローチに対して良好に機能する。
論文 参考訳(メタデータ) (2020-07-20T09:59:04Z) - Ventral-Dorsal Neural Networks: Object Detection via Selective Attention [51.79577908317031]
我々はVDNet(Ventral-Dorsal Networks)と呼ばれる新しいフレームワークを提案する。
人間の視覚システムの構造にインスパイアされた我々は「Ventral Network」と「Dorsal Network」の統合を提案する。
実験の結果,提案手法は最先端の物体検出手法よりも優れていることがわかった。
論文 参考訳(メタデータ) (2020-05-15T23:57:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。