Fugu-MT 論文翻訳(概要): A Survey of Performance Optimization in Neural Network-Based Video Analytics Systems

論文の概要: A Survey of Performance Optimization in Neural Network-Based Video Analytics Systems

arxiv url: http://arxiv.org/abs/2105.14195v1
Date: Mon, 10 May 2021 17:06:44 GMT
ステータス: 翻訳完了
システム内更新日: 2021-06-06 08:49:29.107128
Title: A Survey of Performance Optimization in Neural Network-Based Video Analytics Systems
Title（参考訳）: ニューラルネットワークによるビデオ分析システムの性能最適化に関する調査
Authors: Nada Ibrahim, Preeti Maurya, Omid Jafari, Parth Nagarkar
Abstract要約: ビデオ分析システムは、ビデオ内で自動イベント、動き、行動認識を実行する。本稿では,ニューラルネットワークに基づくビデオ分析システムの性能最適化に重点を置く技術について概説する。
参考スコア（独自算出の注目度）: 0.9558392439655014
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Video analytics systems perform automatic events, movements, and actions recognition in a video and make it possible to execute queries on the video. As a result of a large number of video data that need to be processed, optimizing the performance of video analytics systems has become an important research topic. Neural networks are the state-of-the-art for performing video analytics tasks such as video annotation and object detection. Prior survey papers consider application-specific video analytics techniques that improve accuracy of the results; however, in this survey paper, we provide a review of the techniques that focus on optimizing the performance of Neural Network-Based Video Analytics Systems.
Abstract（参考訳）: ビデオ分析システムは、ビデオ内で自動イベント、動き、アクション認識を実行し、ビデオ上でクエリを実行可能にする。大量のビデオデータを処理する必要があるため、ビデオ分析システムの性能を最適化することが重要な研究課題となっている。ニューラルネットワークは、ビデオアノテーションやオブジェクト検出などのビデオ分析タスクを実行するための最先端技術である。先行調査では,結果の精度を向上させるためのアプリケーション固有のビデオ分析技術を検討するが,本研究ではニューラルネットワークに基づくビデオ分析システムの性能最適化に重点を置く技術について概説する。

関連論文リスト

Large Language Models for Video Surveillance Applications [11.297664744056735]
本稿では,ジェネレーティブ・人工知能(GenAI)を用いた視覚言語モデルによる概念実証について述べる。本ツールでは,ユーザ定義クエリに基づいて,カスタマイズしたテキスト要約を生成する。
論文参考訳（メタデータ） (2025-01-06T08:57:44Z)
Scaling Up Video Summarization Pretraining with Large Language Models [73.74662411006426]
本稿では,大規模ビデオ要約データセットを生成するための,自動化されたスケーラブルなパイプラインを提案する。我々は既存のアプローチの限界を分析し、それらに効果的に対処する新しいビデオ要約モデルを提案する。我々の研究は、プロが注釈付けした高品質の要約を持つ1200本の長編ビデオを含む新しいベンチマークデータセットも提示した。
論文参考訳（メタデータ） (2024-04-04T11:59:06Z)
Deep Learning Techniques for Video Instance Segmentation: A Survey [19.32547752428875]
ビデオインスタンスセグメンテーションは、2019年に導入された新しいコンピュータビジョン研究分野である。ディープラーニング技術は、様々なコンピュータビジョン領域において支配的な役割を担っている。このサーベイは、ビデオインスタンスセグメンテーションのためのディープラーニングスキームの多面的なビューを提供する。
論文参考訳（メタデータ） (2023-10-19T00:27:30Z)
Spatialyze: A Geospatial Video Analytics System with Spatial-Aware Optimizations [6.169771522155704]
Spatialyzeは、地理空間ビデオのエンドツーエンドクエリのための新しいフレームワークである。その結果、Spatialyzeは、最適化されていない実行と比較して最大97.1%の精度を維持しながら、実行時間を最大5.3倍に短縮できることがわかった。
論文参考訳（メタデータ） (2023-08-07T03:35:47Z)
Task-Oriented Communication for Edge Video Analytics [11.03999024164301]
本稿では,エッジビデオ分析のためのタスク指向通信フレームワークを提案する。複数のデバイスが視覚センサデータを収集し、その情報機能をエッジサーバに送信して処理する。提案手法は,映像データのタスク関連情報を効果的に符号化し,既存の手法よりも高いレート性能のトレードオフを実現する。
論文参考訳（メタデータ） (2022-11-25T12:09:12Z)
VRAG: Region Attention Graphs for Content-Based Video Retrieval [85.54923500208041]
Region Attention Graph Networks (VRAG) は最先端のビデオレベルの手法を改善している。 VRAGは、地域レベルの特徴を通して、より細かい粒度のビデオを表現し、地域レベルの関係を通して、ビデオ時間ダイナミクスをエンコードする。本研究では,映像のセグメント化や映像検索にショット埋め込みを用いることで,映像レベルとフレームレベルの性能差を低減できることを示す。
論文参考訳（メタデータ） (2022-05-18T16:50:45Z)
A Survey on Deep Learning Technique for Video Segmentation [147.0767454918527]
ビデオセグメンテーションは幅広い応用において重要な役割を果たしている。ディープラーニングベースのアプローチは、ビデオセグメンテーションに特化しており、魅力的なパフォーマンスを提供している。
論文参考訳（メタデータ） (2021-07-02T15:51:07Z)
A Reinforcement-Learning-Based Energy-Efficient Framework for Multi-Task Video Analytics Pipeline [16.72264118199915]
ビデオ分析パイプラインは、高いデータレートと複雑な推論アルゴリズムに依存するため、エネルギー集約的である。マルチタスクビデオ解析パイプラインのエネルギー使用を最小限に抑える適応解像度最適化フレームワークを提案する。私たちのフレームワークは、YouTube-VISデータセットで同様の精度の全てのベースラインメソッドを大幅に上回りました。
論文参考訳（メタデータ） (2021-04-09T15:44:06Z)
Video Summarization Using Deep Neural Networks: A Survey [72.98424352264904]
ビデオ要約技術は、ビデオコンテンツの最も有益な部分を選択して、簡潔で完全なシノプシスを作成することを目指しています。本研究は,この領域における最近の進歩に着目し,既存の深層学習に基づく総括的映像要約手法の包括的調査を行う。
論文参考訳（メタデータ） (2021-01-15T11:41:29Z)
Coherent Loss: A Generic Framework for Stable Video Segmentation [103.78087255807482]
ビデオセグメンテーションの結果の視覚的品質を,ジッタリングアーティファクトがいかに劣化させるかを検討する。本稿では,ニューラルネットワークの性能向上を目的とした汎用フレームワークを備えたコヒーレントロスを提案する。
論文参考訳（メタデータ） (2020-10-25T10:48:28Z)
Detecting Forged Facial Videos using convolutional neural network [0.0]
我々は,より小さな(少ないパラメータで学習する)畳み込みニューラルネットワーク(CNN)を用いて,偽ビデオ検出のためのデータ駆動型アプローチを提案する。提案手法の有効性を検証するため,FaceForensicsの公開データセットを用いて,フレームベースとビデオベースの両方の結果を詳細に検討した。
論文参考訳（メタデータ） (2020-05-17T19:04:59Z)
Convolutional Hierarchical Attention Network for Query-Focused Video Summarization [74.48782934264094]
本稿では、ユーザのクエリと長いビデオを入力として取り込む、クエリ中心のビデオ要約の課題に対処する。本稿では,特徴符号化ネットワークとクエリ関連計算モジュールの2つの部分からなる畳み込み階層型注意ネットワーク(CHAN)を提案する。符号化ネットワークでは,局所的な自己認識機構と問合せ対応のグローバルアテンション機構を備えた畳み込みネットワークを用いて,各ショットの視覚情報を学習する。
論文参考訳（メタデータ） (2020-01-31T04:30:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。