論文の概要: A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task
Video Analytics Pipeline
- arxiv url: http://arxiv.org/abs/2104.04443v1
- Date: Fri, 9 Apr 2021 15:44:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-12 14:02:24.354152
- Title: A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task
Video Analytics Pipeline
- Title(参考訳): マルチタスクビデオ分析パイプラインのための強化学習型エネルギー効率フレームワーク
- Authors: Yingying Zhao, Mingzhi Dong, Yujiang Wang, Da Feng, Qin Lv, Robert
Dick, Dongsheng Li, Tun Lu, Ning Gu, Li Shang
- Abstract要約: ビデオ分析パイプラインは、高いデータレートと複雑な推論アルゴリズムに依存するため、エネルギー集約的である。
マルチタスクビデオ解析パイプラインのエネルギー使用を最小限に抑える適応解像度最適化フレームワークを提案する。
私たちのフレームワークは、YouTube-VISデータセットで同様の精度の全てのベースラインメソッドを大幅に上回りました。
- 参考スコア(独自算出の注目度): 16.72264118199915
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep-learning-based video processing has yielded transformative results in
recent years. However, the video analytics pipeline is energy-intensive due to
high data rates and reliance on complex inference algorithms, which limits its
adoption in energy-constrained applications. Motivated by the observation of
high and variable spatial redundancy and temporal dynamics in video data
streams, we design and evaluate an adaptive-resolution optimization framework
to minimize the energy use of multi-task video analytics pipelines. Instead of
heuristically tuning the input data resolution of individual tasks, our
framework utilizes deep reinforcement learning to dynamically govern the input
resolution and computation of the entire video analytics pipeline. By
monitoring the impact of varying resolution on the quality of high-dimensional
video analytics features, hence the accuracy of video analytics results, the
proposed end-to-end optimization framework learns the best non-myopic policy
for dynamically controlling the resolution of input video streams to achieve
globally optimize energy efficiency. Governed by reinforcement learning,
optical flow is incorporated into the framework to minimize unnecessary
spatio-temporal redundancy that leads to re-computation, while preserving
accuracy. The proposed framework is applied to video instance segmentation
which is one of the most challenging machine vision tasks, and the energy
consumption efficiency of the proposed framework has significantly surpassed
all baseline methods of similar accuracy on the YouTube-VIS dataset.
- Abstract(参考訳): 近年,深層学習に基づくビデオ処理により,映像の変換が進んでいる。
しかし、ビデオ分析パイプラインは高いデータレートと複雑な推論アルゴリズムに依存するため、エネルギー集約的であり、エネルギー制約のあるアプリケーションでは採用が制限されている。
映像データストリームにおける空間冗長性と時間変動の観測を動機とし,マルチタスクビデオ解析パイプラインのエネルギー使用を最小限に抑える適応分解能最適化フレームワークの設計と評価を行った。
我々のフレームワークは、個々のタスクの入力データ解像度をヒューリスティックに調整する代わりに、深い強化学習を利用して、ビデオ分析パイプライン全体の入力解像度と計算を動的に制御する。
高次元映像分析機能の品質に対する様々な解像度の影響をモニタリングすることにより、映像解析結果の精度を高めることにより、提案するエンドツーエンド最適化フレームワークは、入力された映像ストリームの解像度を動的に制御する最適な非光学的ポリシーを学習し、エネルギー効率を劇的に最適化する。
強化学習によって制御される光フローは、精度を維持しつつ再計算につながる不要な時空間冗長性を最小化するためにフレームワークに組み込まれる。
提案フレームワークは,最も困難なマシンビジョンタスクの一つであるビデオインスタンスセグメンテーションに適用され,提案フレームワークのエネルギー消費効率は,youtube-visデータセットにおける類似精度の基準手法をはるかに上回っている。
関連論文リスト
- Edge Computing Enabled Real-Time Video Analysis via Adaptive
Spatial-Temporal Semantic Filtering [18.55091203660391]
本稿では,インテリジェント・ビジュアル・デバイスのためのエッジ・コンピューティングによるリアルタイム映像解析システムを提案する。
提案システムは,追跡支援対象検出モジュール(TAODM)と興味あるモジュールの領域(ROIM)から構成される。
TAODMは、トラッキングアルゴリズムで各ビデオフレームを局所的に処理するか、オブジェクト検出モデルにより推論されたエッジサーバにオフロードするか、オフロード決定を適応的に決定する。
論文 参考訳(メタデータ) (2024-02-29T07:42:03Z) - Video Dynamics Prior: An Internal Learning Approach for Robust Video
Enhancements [83.5820690348833]
外部トレーニングデータコーパスを必要としない低レベルの視覚タスクのためのフレームワークを提案する。
提案手法は,コヒーレンス・時間的テストの重み付けと統計内部統計を利用して,破損したシーケンスを最適化することでニューラルモジュールを学習する。
論文 参考訳(メタデータ) (2023-12-13T01:57:11Z) - Differentiable Resolution Compression and Alignment for Efficient Video
Classification and Retrieval [16.497758750494537]
本稿では,高解像度圧縮・アライメント機構を備えた効率的な映像表現ネットワークを提案する。
我々は、相性および非相性フレーム特徴を符号化するために、微分可能なコンテキスト対応圧縮モジュールを利用する。
我々は,異なる解像度のフレーム特徴間のグローバル時間相関を捉えるために,新しい解像度変換器層を導入する。
論文 参考訳(メタデータ) (2023-09-15T05:31:53Z) - Task-Oriented Communication for Edge Video Analytics [11.03999024164301]
本稿では,エッジビデオ分析のためのタスク指向通信フレームワークを提案する。
複数のデバイスが視覚センサデータを収集し、その情報機能をエッジサーバに送信して処理する。
提案手法は,映像データのタスク関連情報を効果的に符号化し,既存の手法よりも高いレート性能のトレードオフを実現する。
論文 参考訳(メタデータ) (2022-11-25T12:09:12Z) - Dynamic Network Quantization for Efficient Video Inference [60.109250720206425]
本稿では,入力に条件付けされたフレーム毎に最適な精度を選択し,効率的な映像認識を実現する動的ネットワーク量子化フレームワークを提案する。
我々は、競争性能と資源効率の両方を達成するために、標準的なバックプロパゲーションと損失を使って、両方のネットワークを効果的に訓練する。
論文 参考訳(メタデータ) (2021-08-23T20:23:57Z) - A Survey of Performance Optimization in Neural Network-Based Video
Analytics Systems [0.9558392439655014]
ビデオ分析システムは、ビデオ内で自動イベント、動き、行動認識を実行する。
本稿では,ニューラルネットワークに基づくビデオ分析システムの性能最適化に重点を置く技術について概説する。
論文 参考訳(メタデータ) (2021-05-10T17:06:44Z) - An Efficient Recurrent Adversarial Framework for Unsupervised Real-Time
Video Enhancement [132.60976158877608]
対比ビデオの例から直接学習する効率的な対比ビデオ強化フレームワークを提案する。
特に,空間的情報と時間的情報の暗黙的統合のための局所的モジュールとグローバルモジュールからなる新しい再帰的セルを導入する。
提案する設計では,フレーム間の情報伝達を効率的に行うことができ,複雑なネットワークの必要性を低減できる。
論文 参考訳(メタデータ) (2020-12-24T00:03:29Z) - Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。
本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文 参考訳(メタデータ) (2020-10-25T10:48:28Z) - Scene-Adaptive Video Frame Interpolation via Meta-Learning [54.87696619177496]
テスト時に容易に利用できる追加情報を利用することで、各ビデオにモデルを適用することを提案する。
追加パラメータを使わずに1つの勾配更新しか行わず、大幅な性能向上が得られます。
論文 参考訳(メタデータ) (2020-04-02T02:46:44Z) - Accelerating Deep Reinforcement Learning With the Aid of Partial Model:
Energy-Efficient Predictive Video Streaming [97.75330397207742]
深層強化学習を用いて,モバイルネットワーク上でのエネルギー効率の高いビデオストリーミングのための予測電力割り当てを考案した。
連続状態と行動空間を扱うために、我々はDeep Deterministic Policy gradient (DDPG)アルゴリズムを利用する。
シミュレーションの結果,提案手法は完全大規模チャネル予測に基づいて導出される最適方針に収束することが示された。
論文 参考訳(メタデータ) (2020-03-21T17:36:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。