論文の概要: Energy-Efficient Parking Analytics System using Deep Reinforcement
Learning
- arxiv url: http://arxiv.org/abs/2202.08973v1
- Date: Tue, 15 Feb 2022 18:27:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-27 17:01:51.946357
- Title: Energy-Efficient Parking Analytics System using Deep Reinforcement
Learning
- Title(参考訳): 深層強化学習を用いた省エネルギーパーキング分析システム
- Authors: Yoones Rezaei, Stephen Lee, Daniel Mosse
- Abstract要約: ビデオ分析アプリケーションは、ディープラーニング技術とカメラの両方が電力を消費するので、膨大なエネルギーを消費する。
本稿では,RL-CamSleepという深層強化学習技術を用いて,システムの実用性を維持しつつ,カメラのエネルギーフットプリントを低減させる手法を提案する。
当社のアプローチでは, 平均エネルギー消費量を76.38%削減し, ビデオ解析における平均精度を98%以上達成できる適応的ポリシを学習することができる。
- 参考スコア(独自算出の注目度): 1.5985100711159579
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Advances in deep vision techniques and ubiquity of smart cameras will drive
the next generation of video analytics. However, video analytics applications
consume vast amounts of energy as both deep learning techniques and cameras are
power-hungry. In this paper, we focus on a parking video analytics platform and
propose RL-CamSleep, a deep reinforcement learning-based technique, to actuate
the cameras to reduce the energy footprint while retaining the system's
utility. Our key insight is that many video-analytics applications do not
always need to be operational, and we can design policies to activate video
analytics only when necessary. Moreover, our work is complementary to existing
work that focuses on improving hardware and software efficiency. We evaluate
our approach on a city-scale parking dataset having 76 streets spread across
the city. Our analysis demonstrates how streets have various parking patterns,
highlighting the importance of an adaptive policy. Our approach can learn such
an adaptive policy that can reduce the average energy consumption by 76.38% and
achieve an average accuracy of more than 98% in performing video analytics.
- Abstract(参考訳): ディープビジョン技術の進歩とスマートカメラのユビキタス化は、次世代のビデオアナリティクスを駆動する。
しかし、ビデオ分析アプリケーションは、ディープラーニング技術とカメラの両方が電力不足であるため、膨大なエネルギーを消費する。
本稿では,パーキング・ビデオ・アナリティクス・プラットフォームに注目し,システムの有用性を維持しつつ,省エネ化のためにカメラを動作させることを目的とした,深い強化学習に基づく技術であるrl-camsleepを提案する。
私たちの重要な洞察は、多くのビデオ分析アプリケーションが常に運用される必要はなく、必要なときにのみビデオ分析を活性化するポリシーを設計できるということです。
さらに、ハードウェアとソフトウェア効率の改善に重点を置いた既存の作業も補完しています。
提案手法は,市中を76の街路にまたがるパーキングデータセットで評価した。
本分析は,道路が様々な駐車パターンを持つことを示し,適応政策の重要性を強調した。
当社のアプローチでは, 平均エネルギー消費量を76.38%削減し, ビデオ解析における平均精度を98%以上達成できる適応的な政策を学習することができる。
関連論文リスト
- A motion-based compression algorithm for resource-constrained video camera traps [4.349838917565205]
本稿では,カメラトラップに特化して設計された動き解析に基づくビデオ圧縮アルゴリズムを提案する。
このアルゴリズムは、受粉監視に関連する動きを描写した画像領域のみを特定し、記憶する。
本実験は,昆虫行動解析における重要な情報を保存するアルゴリズムの能力を実証するものである。
論文 参考訳(メタデータ) (2024-05-23T10:39:33Z) - Arena: A Patch-of-Interest ViT Inference Acceleration System for Edge-Assisted Video Analytics [18.042752812489276]
視覚変換器(ViT)を用いたエッジ・ツー・エンドビデオ推論高速化システムを提案する。
その結果、Arenaは平均で1.58(時間)と1.82(時間)の推論速度を向上でき、それぞれ帯域幅の47%と31%しか消費していないことがわかった。
論文 参考訳(メタデータ) (2024-04-14T13:14:13Z) - Traffic-Domain Video Question Answering with Automatic Captioning [69.98381847388553]
Video Question Answering (VidQA) は、高度な機械推論機能を促進する重要な可能性を示している。
本稿では,交通領域の知識を大規模ビデオ言語モデルに注入する弱スーパービジョン手法として,交通領域ビデオ質問回答と自動キャプション(TRIVIA)を提案する。
論文 参考訳(メタデータ) (2023-07-18T20:56:41Z) - AZTR: Aerial Video Action Recognition with Auto Zoom and Temporal
Reasoning [63.628195002143734]
本稿では,空中映像の行動認識のための新しい手法を提案する。
提案手法は,UAVを用いて撮影したビデオに対して設計されており,エッジやモバイルデバイス上でも動作可能である。
我々は、カスタマイズされたオートズームを使用して、人間のターゲットを自動的に識別し、適切にスケールする学習ベースのアプローチを提案する。
論文 参考訳(メタデータ) (2023-03-02T21:24:19Z) - EgoDistill: Egocentric Head Motion Distillation for Efficient Video
Understanding [90.9111678470214]
本稿では,重度エゴセントリックビデオクリップの再構成を学習する蒸留法であるEgoDistillを提案する。
提案手法により効率が大幅に向上し,200倍のGFLOPが要求される。
Ego4D と EPICKitchens のデータセット上での有効性を示す。
論文 参考訳(メタデータ) (2023-01-05T18:39:23Z) - Policy Pre-training for End-to-end Autonomous Driving via
Self-supervised Geometric Modeling [96.31941517446859]
PPGeo (Policy Pre-training via Geometric Modeling) は,視覚運動運転における政策事前学習のための,直感的かつ直接的な完全自己教師型フレームワークである。
本研究では,大規模な未ラベル・未校正動画の3次元幾何学シーンをモデル化することにより,ポリシー表現を強力な抽象化として学習することを目的とする。
第1段階では、幾何モデリングフレームワークは、2つの連続したフレームを入力として、ポーズと深さの予測を同時に生成する。
第2段階では、視覚エンコーダは、将来のエゴモーションを予測し、現在の視覚観察のみに基づいて測光誤差を最適化することにより、運転方針表現を学習する。
論文 参考訳(メタデータ) (2023-01-03T08:52:49Z) - APT: Adaptive Perceptual quality based camera Tuning using reinforcement
learning [2.0741583844039915]
画質の悪いビデオのキャプチャは、分析の精度に悪影響を及ぼす。
本稿では,高品質なビデオキャプチャを実現するために,カメラパラメータを調整した新しい強化学習システムを提案する。
その結果、環境条件やシーン内容が変化したときの洞察の精度を復元する。
論文 参考訳(メタデータ) (2022-11-15T21:02:48Z) - E^2VTS: Energy-Efficient Video Text Spotting from Unmanned Aerial
Vehicles [78.50123964690094]
無人航空機(UAV)ベースのビデオテキストスポッティングは、民間や軍事領域で広く使われている。
提案手法は,エネルギ効率と性能の競合的なトレードオフを達成し,従来の方法よりも優れていた。
論文 参考訳(メタデータ) (2022-06-05T22:43:17Z) - Large-Scale Video Analytics through Object-Level Consolidation [1.299941371793082]
ビデオ分析は、スマートシティや自動運転といった新しいユースケースを可能にする。
ビデオ分析は、スマートシティや自動運転といった新しいユースケースを可能にする。
論文 参考訳(メタデータ) (2021-11-30T14:48:54Z) - Video Salient Object Detection via Contrastive Features and Attention
Modules [106.33219760012048]
本稿では,注目モジュールを持つネットワークを用いて,映像の有意な物体検出のためのコントラスト特徴を学習する。
コアテンションの定式化は、低レベル特徴と高レベル特徴を組み合わせるために用いられる。
提案手法は計算量が少なく,最先端の手法に対して良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-03T17:40:32Z) - A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task
Video Analytics Pipeline [16.72264118199915]
ビデオ分析パイプラインは、高いデータレートと複雑な推論アルゴリズムに依存するため、エネルギー集約的である。
マルチタスクビデオ解析パイプラインのエネルギー使用を最小限に抑える適応解像度最適化フレームワークを提案する。
私たちのフレームワークは、YouTube-VISデータセットで同様の精度の全てのベースラインメソッドを大幅に上回りました。
論文 参考訳(メタデータ) (2021-04-09T15:44:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。