論文の概要: Towards in-store multi-person tracking using head detection and track
heatmaps
- arxiv url: http://arxiv.org/abs/2005.08009v2
- Date: Thu, 2 Jul 2020 03:22:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 13:33:06.772429
- Title: Towards in-store multi-person tracking using head detection and track
heatmaps
- Title(参考訳): 頭部検出と追跡熱マップを用いた店内多人数追跡に向けて
- Authors: Aibek Musaev, Jiangping Wang, Liang Zhu, Cheng Li, Yi Chen, Jialin
Liu, Wanqi Zhang, Juan Mei, De Wang
- Abstract要約: 本稿では,スーパーマーケットの顧客行動の様相を再現するオフィス環境において,カメラから収集したデータセットを紹介する。
本稿では,顧客とスタッフの行動パターンに基づいた認識モデルを提案する。
このモデルは、スーパーマーケットで24時間にわたって収集された実世界のデータセットを用いて評価され、トレーニング中の98%の精度と評価中の93%の精度を達成する。
- 参考スコア(独自算出の注目度): 11.318061963422807
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Computer vision algorithms are being implemented across a breadth of
industries to enable technological innovations. In this paper, we study the
problem of computer vision based customer tracking in retail industry. To this
end, we introduce a dataset collected from a camera in an office environment
where participants mimic various behaviors of customers in a supermarket. In
addition, we describe an illustrative example of the use of this dataset for
tracking participants based on a head tracking model in an effort to minimize
errors due to occlusion. Furthermore, we propose a model for recognizing
customers and staff based on their movement patterns. The model is evaluated
using a real-world dataset collected in a supermarket over a 24-hour period
that achieves 98% accuracy during training and 93% accuracy during evaluation.
- Abstract(参考訳): コンピュータビジョンアルゴリズムは、技術革新を可能にするために、さまざまな産業で実装されている。
本稿では,小売業におけるコンピュータビジョンに基づく顧客追跡の問題について検討する。
この目的のために,スーパーマーケットにおける顧客行動の模倣を行うオフィス環境において,カメラから収集したデータセットを導入する。
さらに,このデータセットを用いた頭部追跡モデルに基づく参加者追跡の例を示し,閉塞による誤りの最小化を図った。
さらに,顧客とスタッフの行動パターンに基づいた認識モデルを提案する。
モデルは24時間にわたってスーパーマーケットで収集された実世界のデータセットを用いて評価され、トレーニング中の98%の精度と評価時の93%の精度を達成している。
関連論文リスト
- Data Augmentation in Human-Centric Vision [54.97327269866757]
本研究では,人間中心型視覚タスクにおけるデータ拡張手法の包括的分析を行う。
それは、人物のReID、人間のパーシング、人間のポーズ推定、歩行者検出など、幅広い研究領域に展開している。
我々の研究は、データ拡張手法をデータ生成とデータ摂動の2つの主なタイプに分類する。
論文 参考訳(メタデータ) (2024-03-13T16:05:18Z) - JRDB-Traj: A Dataset and Benchmark for Trajectory Forecasting in Crowds [79.00975648564483]
ロボット工学、自動運転車、ナビゲーションなどの分野で使用される軌道予測モデルは、現実のシナリオにおいて課題に直面している。
このデータセットは、ロボットの観点から、すべてのエージェント、シーンイメージ、ポイントクラウドの位置を含む包括的なデータを提供する。
本研究の目的は,ロボットに対するエージェントの将来の位置を,生の感覚入力データを用いて予測することである。
論文 参考訳(メタデータ) (2023-11-05T18:59:31Z) - Concept-based Anomaly Detection in Retail Stores for Automatic
Correction using Mobile Robots [3.989104441591223]
Co-ADは視覚変換器(ViT)を用いた概念に基づく異常検出手法である
計画図のような事前の知識ベースを使わずに、誤って配置されたオブジェクトにフラグを付けることができる。
小売品の異常検出画像セットで89.90%の最高成功率を持つ。
論文 参考訳(メタデータ) (2023-10-21T16:49:23Z) - Retail store customer behavior analysis system: Design and
Implementation [2.215731214298625]
本稿では,顧客行動の数学的モデリング,効率的なディープラーニングに基づく行動分析,個人と集団の行動可視化という3つの主要な要素を含むフレームワークを提案する。
各モジュールとシステム全体が、小売店の実際の状況からのデータを使用して検証された。
論文 参考訳(メタデータ) (2023-09-05T06:26:57Z) - StandardSim: A Synthetic Dataset For Retail Environments [0.07874708385247352]
本稿では,意味的セグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを特徴とする大規模合成データセットを提案する。
私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。
我々は、データセットのセグメンテーションと深さ推定に広く使用されているモデルをベンチマークし、我々のテストセットが現在の小規模データセットと比較して難しいベンチマークを構成することを示す。
論文 参考訳(メタデータ) (2022-02-04T22:28:35Z) - ADG-Pose: Automated Dataset Generation for Real-World Human Pose
Estimation [2.4956060473718407]
ADG-Poseは、現実世界の人間のポーズ推定のためのデータセットを自動的に生成する手法である。
本稿では,実世界の人間のポーズ推定のためのデータセットを自動生成するADG-Poseについて述べる。
論文 参考訳(メタデータ) (2022-02-01T20:51:58Z) - Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。
高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。
このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文 参考訳(メタデータ) (2021-05-27T23:34:06Z) - Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。
我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。
AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文 参考訳(メタデータ) (2021-04-23T17:59:28Z) - Visual Distant Supervision for Scene Graph Generation [66.10579690929623]
シーングラフモデルは通常、大量のラベル付きデータを人間のアノテーションで教師付き学習する必要がある。
本研究では,人間ラベルデータを用いずにシーングラフモデルを訓練できる視覚関係学習の新しいパラダイムである視覚遠方監視を提案する。
包括的な実験結果から、我々の遠隔監視モデルは、弱い監督と半監督のベースラインよりも優れています。
論文 参考訳(メタデータ) (2021-03-29T06:35:24Z) - Real-time Embedded Person Detection and Tracking for Shopping Behaviour
Analysis [1.0514231683620514]
店舗のような環境下での人々のカウントと追跡によるショッピング行動分析は、店舗運営者にとって貴重な情報を提供する。
我々は、Jetson TX2ハードウェアプラットフォーム上で、リアルタイムに最適化されたYOLOv3ベースの歩行者検出器を実装した。
検知器とスパース光フロートラッカーを組み合わせることで、各顧客にユニークなIDを割り当て、部分的に隠された顧客を略奪する問題に取り組む。
検出器トラッカーをベースとしたソリューションは,処理速度10FPSで平均81.59%の精度を達成する。
論文 参考訳(メタデータ) (2020-07-09T17:14:15Z) - GraspNet: A Large-Scale Clustered and Densely Annotated Dataset for
Object Grasping [49.777649953381676]
我々は,統合評価システムを用いた大規模グリップポーズ検出データセットに貢献する。
データセットには87,040枚のRGBD画像と3億7000万枚以上のグリップポーズが含まれている。
論文 参考訳(メタデータ) (2019-12-31T18:15:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。