Fugu-MT 論文翻訳(概要): Towards in-store multi-person tracking using head detection and track heatmaps

論文の概要: Towards in-store multi-person tracking using head detection and track heatmaps

arxiv url: http://arxiv.org/abs/2005.08009v2
Date: Thu, 2 Jul 2020 03:22:46 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-02 13:33:06.772429
Title: Towards in-store multi-person tracking using head detection and track heatmaps
Title（参考訳）: 頭部検出と追跡熱マップを用いた店内多人数追跡に向けて
Authors: Aibek Musaev, Jiangping Wang, Liang Zhu, Cheng Li, Yi Chen, Jialin Liu, Wanqi Zhang, Juan Mei, De Wang
Abstract要約: 本稿では,スーパーマーケットの顧客行動の様相を再現するオフィス環境において,カメラから収集したデータセットを紹介する。本稿では,顧客とスタッフの行動パターンに基づいた認識モデルを提案する。このモデルは、スーパーマーケットで24時間にわたって収集された実世界のデータセットを用いて評価され、トレーニング中の98%の精度と評価中の93%の精度を達成する。
参考スコア（独自算出の注目度）: 11.318061963422807
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Computer vision algorithms are being implemented across a breadth of industries to enable technological innovations. In this paper, we study the problem of computer vision based customer tracking in retail industry. To this end, we introduce a dataset collected from a camera in an office environment where participants mimic various behaviors of customers in a supermarket. In addition, we describe an illustrative example of the use of this dataset for tracking participants based on a head tracking model in an effort to minimize errors due to occlusion. Furthermore, we propose a model for recognizing customers and staff based on their movement patterns. The model is evaluated using a real-world dataset collected in a supermarket over a 24-hour period that achieves 98% accuracy during training and 93% accuracy during evaluation.
Abstract（参考訳）: コンピュータビジョンアルゴリズムは、技術革新を可能にするために、さまざまな産業で実装されている。本稿では,小売業におけるコンピュータビジョンに基づく顧客追跡の問題について検討する。この目的のために,スーパーマーケットにおける顧客行動の模倣を行うオフィス環境において,カメラから収集したデータセットを導入する。さらに,このデータセットを用いた頭部追跡モデルに基づく参加者追跡の例を示し,閉塞による誤りの最小化を図った。さらに,顧客とスタッフの行動パターンに基づいた認識モデルを提案する。モデルは24時間にわたってスーパーマーケットで収集された実世界のデータセットを用いて評価され、トレーニング中の98%の精度と評価時の93%の精度を達成している。

関連論文リスト

A Data-Centric Revisit of Pre-Trained Vision Models for Robot Learning [67.72413262980272]
事前訓練された視覚モデル(PVM)は現代のロボティクスの基本であるが、その最適構成は定かではない。セマンティック・ボトルネックを導入してオブジェクト中心の表現を誘導する手法であるSlotMIMを開発した。提案手法は,画像認識,シーン理解,ロボット学習評価において,従来の作業よりも大幅に改善されている。
論文参考訳（メタデータ） (2025-03-10T06:18:31Z)
TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文参考訳（メタデータ） (2024-09-17T05:35:00Z)
Zero-Shot Object-Centric Representation Learning [72.43369950684057]
ゼロショット一般化のレンズによる現在の対象中心法について検討する。 8つの異なる合成および実世界のデータセットからなるベンチマークを導入する。多様な実世界の画像のトレーニングにより、見えないシナリオへの転送性が向上することがわかった。
論文参考訳（メタデータ） (2024-08-17T10:37:07Z)
Personalized Product Assortment with Real-time 3D Perception and Bayesian Payoff Estimation [3.373994463906893]
リアルタイムレコメンデーションシステムを導入し、EdgeRec3Dと呼ぶ。本システムは,3次元コンピュータビジョンの最近の進歩を,認識と自動的,きめ細かな販売推定に活用する。ドリンク製品を用いた2～8週間のA/Bテストで実店舗でテストを行い,それぞれ35%,27%の売り上げ増を示した。
論文参考訳（メタデータ） (2024-06-11T23:23:54Z)
Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文参考訳（メタデータ） (2024-03-23T22:32:06Z)
Revolutionizing Retail Analytics: Advancing Inventory and Customer Insight with AI [0.0]
本稿では,最先端機械学習技術を活用した革新的なアプローチを提案する。我々は、これらの技術を活用して小売効率と顧客エンゲージメントを向上させる、高度なスマート小売分析システム(SRAS)の構築を目指している。
論文参考訳（メタデータ） (2024-02-24T11:03:01Z)
Concept-based Anomaly Detection in Retail Stores for Automatic Correction using Mobile Robots [3.989104441591223]
Co-ADは視覚変換器(ViT)を用いた概念に基づく異常検出手法である計画図のような事前の知識ベースを使わずに、誤って配置されたオブジェクトにフラグを付けることができる。小売品の異常検出画像セットで89.90%の最高成功率を持つ。
論文参考訳（メタデータ） (2023-10-21T16:49:23Z)
Retail store customer behavior analysis system: Design and Implementation [2.215731214298625]
本稿では,顧客行動の数学的モデリング,効率的なディープラーニングに基づく行動分析,個人と集団の行動可視化という3つの主要な要素を含むフレームワークを提案する。各モジュールとシステム全体が、小売店の実際の状況からのデータを使用して検証された。
論文参考訳（メタデータ） (2023-09-05T06:26:57Z)
StandardSim: A Synthetic Dataset For Retail Environments [0.07874708385247352]
本稿では,意味的セグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを特徴とする大規模合成データセットを提案する。私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。我々は、データセットのセグメンテーションと深さ推定に広く使用されているモデルをベンチマークし、我々のテストセットが現在の小規模データセットと比較して難しいベンチマークを構成することを示す。
論文参考訳（メタデータ） (2022-02-04T22:28:35Z)
Unsupervised Domain Adaption of Object Detectors: A Survey [87.08473838767235]
近年のディープラーニングの進歩は、様々なコンピュータビジョンアプリケーションのための正確で効率的なモデルの開発につながっている。高度に正確なモデルを学ぶには、大量の注釈付きイメージを持つデータセットの可用性に依存する。このため、ラベルスカースデータセットに視覚的に異なる画像がある場合、モデルの性能は大幅に低下する。
論文参考訳（メタデータ） (2021-05-27T23:34:06Z)
Learnable Online Graph Representations for 3D Multi-Object Tracking [156.58876381318402]
3D MOT問題に対する統一型学習型アプローチを提案します。我々は、完全にトレーニング可能なデータアソシエーションにNeural Message Passing Networkを使用します。 AMOTAの65.6%の最先端性能と58%のIDスウィッチを達成して、公開可能なnuScenesデータセットに対する提案手法のメリットを示す。
論文参考訳（メタデータ） (2021-04-23T17:59:28Z)
Visual Distant Supervision for Scene Graph Generation [66.10579690929623]
シーングラフモデルは通常、大量のラベル付きデータを人間のアノテーションで教師付き学習する必要がある。本研究では,人間ラベルデータを用いずにシーングラフモデルを訓練できる視覚関係学習の新しいパラダイムである視覚遠方監視を提案する。包括的な実験結果から、我々の遠隔監視モデルは、弱い監督と半監督のベースラインよりも優れています。
論文参考訳（メタデータ） (2021-03-29T06:35:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。