論文の概要: Lightweight Delivery Detection on Doorbell Cameras
- arxiv url: http://arxiv.org/abs/2305.07812v2
- Date: Mon, 6 Nov 2023 04:36:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-07 22:55:29.112190
- Title: Lightweight Delivery Detection on Doorbell Cameras
- Title(参考訳): ドアベルカメラの軽量化検出
- Authors: Pirazh Khorramshahi, Zhe Wu, Tianchen Wang, Luke Deluccia, Hongcheng
Wang
- Abstract要約: 本研究では,重要なホームアプリケーション,ビデオベースの配信検出について検討し,簡単な軽量パイプラインを提案する。
提案手法は,移動自在な3DCNNネットワークを用いて,一連の粗い活動キューを生成するために拘束された動きに依存している。
- 参考スコア(独自算出の注目度): 9.735137325682825
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent advances in video-based action recognition and robust
spatio-temporal modeling, most of the proposed approaches rely on the abundance
of computational resources to afford running huge and computation-intensive
convolutional or transformer-based neural networks to obtain satisfactory
results. This limits the deployment of such models on edge devices with limited
power and computing resources. In this work we investigate an important smart
home application, video based delivery detection, and present a simple and
lightweight pipeline for this task that can run on resource-constrained
doorbell cameras. Our method relies on motion cues to generate a set of coarse
activity proposals followed by their classification with a mobile-friendly
3DCNN network. To train we design a novel semi-supervised attention module that
helps the network to learn robust spatio-temporal features and adopt an
evidence-based optimization objective that allows for quantifying the
uncertainty of predictions made by the network. Experimental results on our
curated delivery dataset shows the significant effectiveness of our pipeline
and highlights the benefits of our training phase novelties to achieve free and
considerable inference-time performance gains.
- Abstract(参考訳): 近年の映像ベース行動認識と強固な時空間モデリングの進歩にもかかわらず、提案手法の多くは計算資源の豊富さに頼り、大規模で計算集約的な畳み込みやトランスフォーマーベースのニューラルネットワークを実行して十分な結果を得る。
これにより、電力とコンピューティングリソースが制限されたエッジデバイスへのそのようなモデルのデプロイが制限される。
本研究では、重要なスマートホームアプリケーション、ビデオベースの配信検出、リソース制約されたドアベルカメラ上で動作可能な、このタスクのためのシンプルで軽量なパイプラインを提案する。
提案手法は,移動自在な3DCNNネットワークを用いて,一連の粗い活動提案を生成するための動作手段に依存している。
そこで我々は,ネットワークが強固な時空間的特徴を学習することを支援する新しい半教師付きアテンションモジュールを設計し,ネットワークによる予測の不確かさを定量化するためのエビデンスに基づく最適化目標を採用する。
当社のキュレーションしたデリバリデータセットにおける実験結果は,パイプラインの有意な有効性を示し,自由かつ相当な推論時間パフォーマンス向上を達成するためのトレーニングフェーズノベルティのメリットを強調する。
関連論文リスト
- Fast Quantum Convolutional Neural Networks for Low-Complexity Object
Detection in Autonomous Driving Applications [18.34157974553066]
量子畳み込みに基づく物体検出(QCOD)を提案し,高速に物体検出を行う。
QCODは、提案した高速量子畳み込みを利用して、入力チャネル情報をアップロードし、出力チャネルを再構築する。
KITTI自律走行物体検出データセットを用いた実験により,提案した高速量子畳み込みとQCODが実物体検出アプリケーションで正常に動作することを確認した。
論文 参考訳(メタデータ) (2023-12-28T00:38:10Z) - Neuromorphic Optical Flow and Real-time Implementation with Event
Cameras [47.11134388304464]
イベントベースのビジョンとスパイクニューラルネットワークの最新の開発の上に構築しています。
我々は、最先端の自己監督型光フロー精度を向上させる新しいネットワークアーキテクチャを提案する。
約2桁の複雑さで高速な光流予測を行う。
論文 参考訳(メタデータ) (2023-04-14T14:03:35Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [9.365794791156972]
本稿では、インターネットトラフィック分類のための新しい軽量・効率的・eXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。
具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。
提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文 参考訳(メタデータ) (2020-12-26T19:41:15Z) - MS-RANAS: Multi-Scale Resource-Aware Neural Architecture Search [94.80212602202518]
我々は,MS-RANAS(Multi-Scale Resource-Aware Neural Architecture Search)を提案する。
我々は,検索コストの削減を図るために,ワンショットのアーキテクチャ探索手法を採用した。
我々は精度-速度トレードオフの観点から最先端の結果を得る。
論文 参考訳(メタデータ) (2020-09-29T11:56:01Z) - Offloading Optimization in Edge Computing for Deep Learning Enabled
Target Tracking by Internet-of-UAVs [22.143742665920573]
無人航空機(UAV)は標的追跡などの情報提供に広く利用されている。
プレトレーニングされた畳み込みニューラルネットワーク(CNN)がUAVに展開され、キャプチャされたビデオフレームからターゲットを特定する。
この種の視覚目標追跡は、所望の高推論精度と厳格な遅延要求のため、多くの計算資源を必要とする。
これは、このようなディープラーニング(DL)タスクをモバイルエッジコンピューティング(MEC)サーバにオフロードすることを検討する動機となります。
論文 参考訳(メタデータ) (2020-08-18T16:00:36Z) - Dynamic Inference: A New Approach Toward Efficient Video Action
Recognition [69.9658249941149]
ビデオにおけるアクション認識は近年大きな成功を収めているが、膨大な計算コストのために依然として難しい課題である。
本稿では,異なるビデオの識別可能性の変動を利用して,推論効率を向上させるための一般的な動的推論手法を提案する。
論文 参考訳(メタデータ) (2020-02-09T11:09:56Z) - Object-Adaptive LSTM Network for Real-time Visual Tracking with
Adversarial Data Augmentation [31.842910084312265]
本稿では,オブジェクト適応型LSTMネットワークを用いて,映像の逐次的依存関係を効果的に捕捉し,オブジェクトの外観変化を適応的に学習する,新しいリアルタイムビジュアルトラッキング手法を提案する。
4つのビジュアルトラッキングベンチマーク実験により,トラッキング精度と速度の両面から,提案手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2020-02-07T03:06:07Z) - Depthwise Non-local Module for Fast Salient Object Detection Using a
Single Thread [136.2224792151324]
本稿では,高速な物体検出のための新しいディープラーニングアルゴリズムを提案する。
提案アルゴリズムは,1つのCPUスレッドと同時に,競合精度と高い推論効率を実現する。
論文 参考訳(メタデータ) (2020-01-22T15:23:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。