論文の概要: Lightweight Delivery Detection on Doorbell Cameras
- arxiv url: http://arxiv.org/abs/2305.07812v1
- Date: Sat, 13 May 2023 01:28:28 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 19:38:05.873714
- Title: Lightweight Delivery Detection on Doorbell Cameras
- Title(参考訳): ドアベルカメラの軽量化検出
- Authors: Pirazh Khorramshahi, Zhe Wu, Tianchen Wang, Luke Deluccia, Hongcheng
Wang
- Abstract要約: 本研究は、ホームアプリケーション、ビデオベースの配信検出、および、このタスクのための簡単な軽量パイプラインについて検討する。
我々のパイプラインは、一連の粗いアクティビティを生成するためにモーションキューに依存し、続いてモバイルフレンドリーな3DCNNネットワークで分類する。
- 参考スコア(独自算出の注目度): 13.62298036478145
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite recent advances in video-based action recognition and robust
spatio-temporal modeling, most of the proposed approaches rely on the abundance
of computational resources to afford running huge and computation-intensive
convolutional or transformer-based neural networks to obtain satisfactory
results. This limits the deployment of such models on edge devices with limited
power and computing resources. In this work we investigate an important smart
home application, video based delivery detection, and present a simple and
lightweight pipeline for this task that can run on resource-constrained
doorbell cameras. Our proposed pipeline relies on motion cues to generate a set
of coarse activity proposals followed by their classification with a
mobile-friendly 3DCNN network. For training we design a novel semi-supervised
attention module that helps the network to learn robust spatio-temporal
features and adopt an evidence-based optimization objective that allows for
quantifying the uncertainty of predictions made by the network. Experimental
results on our curated delivery dataset shows the significant effectiveness of
our pipeline compared to alternatives and highlights the benefits of our
training phase novelties to achieve free and considerable inference-time
performance gains.
- Abstract(参考訳): 近年の映像ベース行動認識と強固な時空間モデリングの進歩にもかかわらず、提案手法の多くは計算資源の豊富さに頼り、大規模で計算集約的な畳み込みやトランスフォーマーベースのニューラルネットワークを実行して十分な結果を得る。
これにより、電力とコンピューティングリソースが制限されたエッジデバイスへのそのようなモデルのデプロイが制限される。
本研究では、重要なスマートホームアプリケーション、ビデオベースの配信検出、リソース制約されたドアベルカメラ上で動作可能な、このタスクのためのシンプルで軽量なパイプラインを提案する。
提案するパイプラインは,動きの手がかりに基づいて,粗いアクティビティ提案のセットを生成し,さらに,モバイルフレンドリーな3dcnnネットワークで分類する。
トレーニングのために、ネットワークが強固な時空間的特徴を学ぶのに役立つ新しい半教師付きアテンションモジュールを設計し、ネットワークによってなされる予測の不確かさを定量化するためのエビデンスベースの最適化目標を採用する。
私たちのキュレーションされたデリバリデータセットにおける実験結果は、代替品と比較してパイプラインの有意な有効性を示し、自由かつかなりの推論時間のパフォーマンス向上を達成するためのトレーニングフェーズのノベルティのメリットを強調しています。
関連論文リスト
- Task-Oriented Real-time Visual Inference for IoVT Systems: A Co-design Framework of Neural Networks and Edge Deployment [61.20689382879937]
タスク指向エッジコンピューティングは、データ分析をエッジにシフトすることで、この問題に対処する。
既存の手法は、高いモデル性能と低いリソース消費のバランスをとるのに苦労している。
ニューラルネットワークアーキテクチャを最適化する新しい協調設計フレームワークを提案する。
論文 参考訳(メタデータ) (2024-10-29T19:02:54Z) - Small Contributions, Small Networks: Efficient Neural Network Pruning Based on Relative Importance [25.579863542008646]
本稿では,アクティベーション統計に基づく直感的で解釈可能なプルーニング手法を提案する。
我々は,データセット全体にわたる重み付けの分布を構築し,そのパラメータを用いて刈り取りプロセスのガイドを行う。
提案手法は,いくつかのベースラインおよび最先端プルーニング技術より一貫して優れる。
論文 参考訳(メタデータ) (2024-10-21T16:18:31Z) - DNN Partitioning, Task Offloading, and Resource Allocation in Dynamic Vehicular Networks: A Lyapunov-Guided Diffusion-Based Reinforcement Learning Approach [49.56404236394601]
本稿では,Vehicular Edge Computingにおける共同DNNパーティショニング,タスクオフロード,リソース割り当ての問題を定式化する。
我々の目標は、時間とともにシステムの安定性を保証しながら、DNNベースのタスク完了時間を最小化することである。
拡散モデルの革新的利用を取り入れたマルチエージェント拡散に基づく深層強化学習(MAD2RL)アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-11T06:31:03Z) - PNAS-MOT: Multi-Modal Object Tracking with Pareto Neural Architecture Search [64.28335667655129]
複数の物体追跡は、自律運転において重要な課題である。
トラッキングの精度が向上するにつれて、ニューラルネットワークはますます複雑になり、レイテンシが高いため、実際の運転シナリオにおける実践的な応用に課題が生じる。
本稿では,ニューラル・アーキテクチャ・サーチ(NAS)手法を用いて追跡のための効率的なアーキテクチャを探索し,比較的高い精度を維持しつつ,低リアルタイム遅延を実現することを目的とした。
論文 参考訳(メタデータ) (2024-03-23T04:18:49Z) - Fast Quantum Convolutional Neural Networks for Low-Complexity Object
Detection in Autonomous Driving Applications [18.34157974553066]
量子畳み込みに基づく物体検出(QCOD)を提案し,高速に物体検出を行う。
QCODは、提案した高速量子畳み込みを利用して、入力チャネル情報をアップロードし、出力チャネルを再構築する。
KITTI自律走行物体検出データセットを用いた実験により,提案した高速量子畳み込みとQCODが実物体検出アプリケーションで正常に動作することを確認した。
論文 参考訳(メタデータ) (2023-12-28T00:38:10Z) - Neuromorphic Optical Flow and Real-time Implementation with Event
Cameras [47.11134388304464]
イベントベースのビジョンとスパイクニューラルネットワークの最新の開発の上に構築しています。
我々は、最先端の自己監督型光フロー精度を向上させる新しいネットワークアーキテクチャを提案する。
約2桁の複雑さで高速な光流予測を行う。
論文 参考訳(メタデータ) (2023-04-14T14:03:35Z) - A Lightweight, Efficient and Explainable-by-Design Convolutional Neural
Network for Internet Traffic Classification [9.365794791156972]
本稿では、インターネットトラフィック分類のための新しい軽量・効率的・eXplainable-by-design畳み込みニューラルネットワーク(LEXNet)を提案する。
LEXNetは(軽量で効率の良い目的のために)新しい残留ブロックと(説明可能性のために)プロトタイプ層に依存している。
商用グレードのデータセットに基づいて、LEXNetは最先端のニューラルネットワークと同じ精度を維持することに成功した。
論文 参考訳(メタデータ) (2022-02-11T10:21:34Z) - Multi-Exit Semantic Segmentation Networks [78.44441236864057]
本稿では,最先端セグメンテーションモデルをMESSネットワークに変換するフレームワークを提案する。
パラメトリド早期出口を用いた特別訓練されたCNNは、より簡単なサンプルの推測時に、その深さに沿って保存する。
接続されたセグメンテーションヘッドの数、配置、アーキテクチャとエグジットポリシーを併用して、デバイス機能とアプリケーション固有の要件に適応する。
論文 参考訳(メタデータ) (2021-06-07T11:37:03Z) - Achieving Real-Time LiDAR 3D Object Detection on a Mobile Device [53.323878851563414]
本稿では,強化学習技術を用いたネットワーク拡張とpruning検索を組み込んだコンパイラ対応統一フレームワークを提案する。
具体的には,リカレントニューラルネットワーク(RNN)を用いて,ネットワークの強化とプルーニングの両面での統一的なスキームを自動で提供する。
提案手法は,モバイルデバイス上でのリアルタイム3次元物体検出を実現する。
論文 参考訳(メタデータ) (2020-12-26T19:41:15Z) - MS-RANAS: Multi-Scale Resource-Aware Neural Architecture Search [94.80212602202518]
我々は,MS-RANAS(Multi-Scale Resource-Aware Neural Architecture Search)を提案する。
我々は,検索コストの削減を図るために,ワンショットのアーキテクチャ探索手法を採用した。
我々は精度-速度トレードオフの観点から最先端の結果を得る。
論文 参考訳(メタデータ) (2020-09-29T11:56:01Z) - Object-Adaptive LSTM Network for Real-time Visual Tracking with
Adversarial Data Augmentation [31.842910084312265]
本稿では,オブジェクト適応型LSTMネットワークを用いて,映像の逐次的依存関係を効果的に捕捉し,オブジェクトの外観変化を適応的に学習する,新しいリアルタイムビジュアルトラッキング手法を提案する。
4つのビジュアルトラッキングベンチマーク実験により,トラッキング精度と速度の両面から,提案手法の最先端性能を実証した。
論文 参考訳(メタデータ) (2020-02-07T03:06:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。