論文の概要: A Video Analysis Method on Wanfang Dataset via Deep Neural Network
- arxiv url: http://arxiv.org/abs/2002.12535v1
- Date: Fri, 28 Feb 2020 04:09:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-28 02:21:36.542224
- Title: A Video Analysis Method on Wanfang Dataset via Deep Neural Network
- Title(参考訳): ディープニューラルネットワークを用いたwanfangデータセットの映像解析法
- Authors: Jinlong Kang, Jiaxiang Zheng, Heng Bai, Xiaoting Xue, Yang Zhou, Jun
Guo
- Abstract要約: 本稿では,スポーツ競技におけるリアルタイム多目的検出機能と,ディープラーニングに基づく公共交通機関における歩行者フロー検出機能について述べる。
提案アルゴリズムに基づいて,主要なテストデータセットとしてwanfangスポーツコンペティションデータセットを採用する。
私たちの作業は、歩行者のフロー検出や歩行者のアラームタスクにも利用できます。
- 参考スコア(独自算出の注目度): 8.485930905198982
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The topic of object detection has been largely improved recently, especially
with the development of convolutional neural network. However, there still
exist a lot of challenging cases, such as small object, compact and dense or
highly overlapping object. Existing methods can detect multiple objects
wonderfully, but because of the slight changes between frames, the detection
effect of the model will become unstable, the detection results may result in
dropping or increasing the object. In the pedestrian flow detection task, such
phenomenon can not accurately calculate the flow. To solve this problem, in
this paper, we describe the new function for real-time multi-object detection
in sports competition and pedestrians flow detection in public based on deep
learning. Our work is to extract a video clip and solve this frame of clips
efficiently. More specfically, our algorithm includes two stages: judge method
and optimization method. The judge can set a maximum threshold for better
results under the model, the threshold value corresponds to the upper limit of
the algorithm with better detection results. The optimization method to solve
detection jitter problem. Because of the occurrence of frame hopping in the
video, and it will result in the generation of video fragments discontinuity.
We use optimization algorithm to get the key value, and then the detection
result value of index is replaced by key value to stabilize the change of
detection result sequence. Based on the proposed algorithm, we adopt wanfang
sports competition dataset as the main test dataset and our own test dataset
for YOLOv3-Abnormal Number Version(YOLOv3-ANV), which is 5.4% average
improvement compared with existing methods. Also, video above the threshold
value can be obtained for further analysis. Spontaneously, our work also can
used for pedestrians flow detection and pedestrian alarm tasks.
- Abstract(参考訳): オブジェクト検出のトピックは、特に畳み込みニューラルネットワークの開発によって、最近大きく改善されている。
しかし、小さなオブジェクト、コンパクトで密度の高いオブジェクト、あるいは非常に重なり合うオブジェクトなど、多くの挑戦的なケースが存在する。
既存の手法では、複数のオブジェクトをうまく検出できるが、フレーム間のわずかな変化のため、モデルの検出効果が不安定になり、検出結果がオブジェクトの落下または増加に繋がる可能性がある。
歩行者の流れ検出タスクでは、そのような現象が正確に流れを計算できない。
そこで本稿では,スポーツ競技におけるリアルタイム多目的検出機能と,ディープラーニングに基づく公共交通機関における歩行者フロー検出機能について述べる。
私たちの仕事は、ビデオクリップを抽出し、このクリップのフレームを効率的に解決することです。
より具体的には、我々のアルゴリズムは判定法と最適化法という2つの段階を含む。
判定は、より良い結果を得るために最大しきい値を設定することができ、閾値はアルゴリズムの上限に対応し、より良い検出結果が得られる。
検出ジッタ問題を解決するための最適化手法
ビデオ中にフレームホッピングが発生するため、ビデオの断片が不連続に生成される。
最適化アルゴリズムを用いてキー値を取得し、次にインデックスの検出結果値をキー値に置き換え、検出結果列の変化を安定化する。
提案アルゴリズムに基づき,従来の手法と比較して平均5.4%改善したYOLOv3-Abnormal Number Version(YOLOv3-ANV)のメインテストデータセットと独自のテストデータセットとしてwanfangスポーツコンペティションデータセットを採用する。
また、さらなる分析のために閾値を超える映像を得ることができる。
同時に、歩行者のフロー検出や歩行者のアラームタスクにも利用できます。
関連論文リスト
- Graspness Discovery in Clutters for Fast and Accurate Grasp Detection [57.81325062171676]
グレープネス(graspness)とは、散らばった場面で把握可能な領域を区別する幾何学的手がかりに基づく品質である。
本研究では,探索過程を近似するカスケード把握モデルを構築した。
大規模なベンチマークであるGraspNet-1Billionの実験では,提案手法が従来の手法よりも大きなマージンで優れていたことが示されている。
論文 参考訳(メタデータ) (2024-06-17T02:06:47Z) - Reducing False Alarms in Video Surveillance by Deep Feature Statistical
Modeling [16.311150636417256]
我々は, 深部特徴の高次元統計的モデリングに基づいて, 弱教師付きa-コントラリオ検証法を開発した。
実験結果から,提案したa-contrarioバリデーションにより,画素レベルとオブジェクトレベルの偽アラームの回数を大幅に削減できることがわかった。
論文 参考訳(メタデータ) (2023-07-09T12:37:17Z) - Fast and Accurate Object Detection on Asymmetrical Receptive Field [0.0]
本稿では,物体検出精度を受容場の変化の観点から改善する手法を提案する。
YOLOv5の頭部の構造は、非対称なプール層を付加することによって改変される。
本稿では, 従来の YOLOv5 モデルと比較し, いくつかのパラメータから解析する。
論文 参考訳(メタデータ) (2023-03-15T23:59:18Z) - rSVDdpd: A Robust Scalable Video Surveillance Background Modelling
Algorithm [13.535770763481905]
本稿では,新しいロバストな特異値分解手法rSVDdpdに基づくビデオ監視背景モデリングアルゴリズムを提案する。
また,提案アルゴリズムは,カメラの改ざんの有無で,ベンチマークデータセットとリアルタイムビデオ監視データセットに優越することを示した。
論文 参考訳(メタデータ) (2021-09-22T12:20:44Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z) - An Efficient Approach for Anomaly Detection in Traffic Videos [30.83924581439373]
本稿では,エッジデバイスで動作可能な映像異常検出システムのための効率的な手法を提案する。
提案手法は,シーンの変化を検出し,破損したフレームを除去するプリプロセッシングモジュールを含む。
また,新しいシーンに迅速に適応し,類似度統計量の変化を検出するシーケンシャルな変化検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-04-20T04:43:18Z) - AmphibianDetector: adaptive computation for moving objects detection [0.913755431537592]
本稿では,偽陽性検出の回数を減らすためのオブジェクト検出手法を提案する。
提案手法は、すでにオブジェクト検出タスクのために訓練されているCNNの修正である。
提案手法の有効性をオープンデータセット"CDNet2014 pedestrian"で実証した。
論文 参考訳(メタデータ) (2020-11-15T12:37:44Z) - Robust Unsupervised Video Anomaly Detection by Multi-Path Frame
Prediction [61.17654438176999]
本稿では,フレーム予測と適切な設計による新規で頑健な非教師付きビデオ異常検出手法を提案する。
提案手法は,CUHK Avenueデータセット上で88.3%のフレームレベルAUROCスコアを得る。
論文 参考訳(メタデータ) (2020-11-05T11:34:12Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - Learning a Unified Sample Weighting Network for Object Detection [113.98404690619982]
地域サンプリングや重み付けは、現代の地域ベースの物体検出器の成功に極めて重要である。
サンプル重み付けはデータ依存でタスク依存であるべきだと我々は主張する。
サンプルのタスク重みを予測するための統一的なサンプル重み付けネットワークを提案する。
論文 参考訳(メタデータ) (2020-06-11T16:19:16Z) - Fast Template Matching and Update for Video Object Tracking and
Segmentation [56.465510428878]
私たちが取り組もうとしている主な課題は、フレームの列にまたがるマルチインスタンスの半教師付きビデオオブジェクトセグメンテーションである。
課題は、結果を予測するためのマッチングメソッドの選択と、ターゲットテンプレートを更新するかどうかを決定することである。
本稿では,これら2つの決定を同時に行うために,強化学習を利用する新しい手法を提案する。
論文 参考訳(メタデータ) (2020-04-16T08:58:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。