論文の概要: CoVA: Exploiting Compressed-Domain Analysis to Accelerate Video
Analytics
- arxiv url: http://arxiv.org/abs/2207.00588v1
- Date: Sat, 2 Jul 2022 05:55:29 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-05 14:40:01.561108
- Title: CoVA: Exploiting Compressed-Domain Analysis to Accelerate Video
Analytics
- Title(参考訳): cova: 圧縮ドメイン分析を利用してビデオ分析を高速化
- Authors: Jinwoo Hwang, Minsu Kim, Daeun Kim, Seungho Nam, Yoonsung Kim, Dohee
Kim, Hardik Sharma, Jongse Park
- Abstract要約: 本稿では,デコードボトルネックに対処するため,圧縮領域と画素領域の間を緩和する新しいカスケードアーキテクチャCoVAを提案する。
CoVAは現代のカスケードシステムよりも4.8倍のスループット向上を実現し、精度の低下を抑える。
- 参考スコア(独自算出の注目度): 6.171815026032586
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern retrospective analytics systems leverage cascade architecture to
mitigate bottleneck for computing deep neural networks (DNNs). However, the
existing cascades suffer two limitations: (1) decoding bottleneck is either
neglected or circumvented, paying significant compute and storage cost for
pre-processing; and (2) the systems are specialized for temporal queries and
lack spatial query support. This paper presents CoVA, a novel cascade
architecture that splits the cascade computation between compressed domain and
pixel domain to address the decoding bottleneck, supporting both temporal and
spatial queries. CoVA cascades analysis into three major stages where the first
two stages are performed in compressed domain while the last one in pixel
domain. First, CoVA detects occurrences of moving objects (called blobs) over a
set of compressed frames (called tracks). Then, using the track results, CoVA
prudently selects a minimal set of frames to obtain the label information and
only decode them to compute the full DNNs, alleviating the decoding bottleneck.
Lastly, CoVA associates tracks with labels to produce the final analysis
results on which users can process both temporal and spatial queries. Our
experiments demonstrate that CoVA offers 4.8x throughput improvement over
modern cascade systems, while imposing modest accuracy loss.
- Abstract(参考訳): 現代の振り返り分析システムは、ディープニューラルネットワーク(DNN)のボトルネックを軽減するためにカスケードアーキテクチャを活用している。
しかし,既存のカスケードは,1)デコードボトルネックを無視あるいは回避し,前処理に多大な計算・記憶コストを支払うこと,2)時間的クエリに特化して空間的クエリサポートが欠如していること,の2つの制限がある。
本稿では,デコードボトルネックに対処するため,圧縮領域と画素領域のカスケード計算を分割した新しいカスケードアーキテクチャCoVAを提案する。
CoVAカスケードは、最初の2段階を圧縮領域で実行し、最後の1段階をピクセル領域で実行する3つの主要なステージに解析する。
まず、covaは一連の圧縮フレーム(トラックと呼ばれる)上の移動物体(ブロブと呼ばれる)の発生を検出する。
そして、トラック結果を用いて、CoVAはラベル情報を取得するために最小限のフレーム群を選択し、それをデコードして完全なDNNを計算し、デコードボトルネックを緩和する。
最後に、CoVAはトラックとラベルを関連付け、ユーザが時間的および空間的なクエリを処理できる最終的な分析結果を生成する。
実験の結果,CoVAは最新のカスケードシステムよりも4.8倍のスループット向上を実現し,精度の低下を抑えることができた。
関連論文リスト
- SparseTem: Boosting the Efficiency of CNN-Based Video Encoders by Exploiting Temporal Continuity [15.872209884833977]
本稿では,メモリオーバーヘッドを削減するためのメモリ効率スケジューリング手法と,精度の劣化を最小限に抑えるためのオンライン調整機構を提案する。
SparseTemは効率の良いDetでは1.79x、CRNNでは4.72xの高速化を実現している。
論文 参考訳(メタデータ) (2024-10-28T07:13:25Z) - TCCT-Net: Two-Stream Network Architecture for Fast and Efficient Engagement Estimation via Behavioral Feature Signals [58.865901821451295]
本稿では,新しい2ストリーム機能融合 "Tensor-Convolution and Convolution-Transformer Network" (TCCT-Net) アーキテクチャを提案する。
時間空間領域における意味のあるパターンをよりよく学習するために、ハイブリッド畳み込み変換器を統合する「CT」ストリームを設計する。
並行して、時間周波数領域からリッチなパターンを効率的に抽出するために、連続ウェーブレット変換(CWT)を用いて情報を2次元テンソル形式で表現する「TC」ストリームを導入する。
論文 参考訳(メタデータ) (2024-04-15T06:01:48Z) - SpVOS: Efficient Video Object Segmentation with Triple Sparse
Convolution [18.332130780309797]
本研究は,ビデオオブジェクト分割フレームワーク全体の計算コストを削減するために,新しい3重スパース畳み込みを開発した。
DAVISとYoutube-VOSを含む2つの主流VOSデータセットで実験が行われる。
その結果,提案するSpVOSは,他の最先端スパース手法よりも優れた性能を示し,同等の性能を維持していることがわかった。
論文 参考訳(メタデータ) (2023-10-23T17:21:33Z) - PointHR: Exploring High-Resolution Architectures for 3D Point Cloud
Segmentation [77.44144260601182]
3Dポイントクラウドセグメンテーションのための高分解能アーキテクチャについて検討する。
我々は、特徴抽出のためのknnベースのシーケンス演算子と差分再サンプリング演算子を含む、PointHRという名前の統一パイプラインを提案する。
S3DISとScanNetV2データセットを用いて,これらのアーキテクチャを高密度点雲解析のために評価する。
論文 参考訳(メタデータ) (2023-10-11T09:29:17Z) - Complexity Matters: Rethinking the Latent Space for Generative Modeling [65.64763873078114]
生成的モデリングにおいて、多くの成功したアプローチは、例えば安定拡散のような低次元の潜在空間を利用する。
本研究では, モデル複雑性の観点から潜在空間を再考することにより, 未探索の話題に光を当てることを目的としている。
論文 参考訳(メタデータ) (2023-07-17T07:12:29Z) - Deep Learning Method for Cell-Wise Object Tracking, Velocity Estimation
and Projection of Sensor Data over Time [0.7340017786387767]
我々は、ConvNetがこのタスクのアーキテクチャ上の制約にどのように悩まされているかを示す。
最後のステップでは、抽出した速度推定に基づいて、リカレントニューラルネットワークのメモリ状態を投影する。
論文 参考訳(メタデータ) (2023-06-08T07:33:05Z) - Information Entropy Initialized Concrete Autoencoder for Optimal Sensor
Placement and Reconstruction of Geophysical Fields [58.720142291102135]
そこで本稿では,スパーク計測による地場再構成のためのセンサ配置の最適化について提案する。
本研究では, (a) 温度と (b) バレンツ海周辺の塩分濃度場とスバルバルド諸島群を例に示す。
得られた最適センサ位置は, 物理的解釈が明確であり, 海流の境界に対応することが判明した。
論文 参考訳(メタデータ) (2022-06-28T12:43:38Z) - Point-to-Voxel Knowledge Distillation for LiDAR Semantic Segmentation [74.67594286008317]
本稿では,大きな教師モデルから,LiDARセマンティックセグメンテーションのためのスリムな学生ネットワークへの知識の抽出の問題に対処する。
本稿では,点レベルとボクセルレベルの両方から隠れた知識を伝達するPVDを提案する。
論文 参考訳(メタデータ) (2022-06-05T05:28:32Z) - Degradation-Aware Unfolding Half-Shuffle Transformer for Spectral
Compressive Imaging [142.11622043078867]
圧縮画像と物理マスクからパラメータを推定し,これらのパラメータを用いて各イテレーションを制御する,DAUF(Degradation-Aware Unfolding Framework)を提案する。
HST を DAUF に接続することにより,HSI 再構成のための変換器の深部展開法であるデグレーション・アウェア・アンフォールディング・ハーフシャッフル変換器 (DAUHST) を確立した。
論文 参考訳(メタデータ) (2022-05-20T11:37:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。