論文の概要: Shopformer: Transformer-Based Framework for Detecting Shoplifting via Human Pose
- arxiv url: http://arxiv.org/abs/2504.19970v1
- Date: Mon, 28 Apr 2025 16:43:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:54.515599
- Title: Shopformer: Transformer-Based Framework for Detecting Shoplifting via Human Pose
- Title(参考訳): Shopformer: トランスフォーマーをベースとしたヒューマンメッセージによる万引き検出フレームワーク
- Authors: Narges Rashvand, Ghazal Alinezhad Noghre, Armin Danesh Pazho, Babak Rahimi Ardabili, Hamed Tabkhi,
- Abstract要約: 万引きは小売業界にとって依然としてコストのかかる問題であり、万引きの約2%しか逮捕されていない。
既存のAIベースのアプローチは、プライバシの懸念を引き起こすピクセルレベルのビデオ分析に依存している。
本稿では、ポーズシーケンスを分析して万引きを検出するトランスフォーマーモデルであるShopformerを紹介する。
- 参考スコア(独自算出の注目度): 1.8802008255570537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Shoplifting remains a costly issue for the retail sector, but traditional surveillance systems, which are mostly based on human monitoring, are still largely ineffective, with only about 2% of shoplifters being arrested. Existing AI-based approaches rely on pixel-level video analysis which raises privacy concerns, is sensitive to environmental variations, and demands significant computational resources. To address these limitations, we introduce Shopformer, a novel transformer-based model that detects shoplifting by analyzing pose sequences rather than raw video. We propose a custom tokenization strategy that converts pose sequences into compact embeddings for efficient transformer processing. To the best of our knowledge, this is the first pose-sequence-based transformer model for shoplifting detection. Evaluated on real-world pose data, our method outperforms state-of-the-art anomaly detection models, offering a privacy-preserving, and scalable solution for real-time retail surveillance. The code base for this work is available at https://github.com/TeCSAR-UNCC/Shopformer.
- Abstract(参考訳): 万引きは小売業界にとって依然としてコストがかかる問題だが、従来の監視システムは人間による監視をベースとしているが、それでもほとんど効果がない。
既存のAIベースのアプローチは、プライバシの懸念を高め、環境の変化に敏感で、重要な計算リソースを必要とするピクセルレベルのビデオ分析に依存している。
これらの制約に対処するために、生のビデオではなくポーズシーケンスを解析して万引きを検出する新しいトランスフォーマーベースのモデルであるShopformerを紹介した。
本稿では,ポーズ列をコンパクトな埋め込みに変換し,効率的なトランスフォーマ処理を実現するためのトークン化手法を提案する。
我々の知る限りでは、これは万引き検出のための最初のポーズシーケンスベースのトランスフォーマーモデルである。
実世界のポーズデータに基づいて評価し、我々の手法は最先端の異常検出モデルより優れており、リアルタイム小売監視のためのプライバシー保護とスケーラブルなソリューションを提供する。
この作業のコードベースはhttps://github.com/TeCSAR-UNCC/Shopformer.comで公開されている。
関連論文リスト
- PersGuard: Preventing Malicious Personalization via Backdoor Attacks on Pre-trained Text-to-Image Diffusion Models [51.458089902581456]
特定の画像の悪質なパーソナライズを防ぐ新しいバックドアベースのアプローチであるPersGuardを紹介する。
我々の手法は既存の技術よりも優れており、プライバシーと著作権保護に対するより堅牢なソリューションを提供する。
論文 参考訳(メタデータ) (2025-02-22T09:47:55Z) - Exploring Pose-Based Anomaly Detection for Retail Security: A Real-World Shoplifting Dataset and Benchmark [1.8802008255570537]
万引きは小売業者にとって大きな課題であり、結果として年間損失は数十億ドルに達する。
本稿では,典型的なショッピングパターンから逸脱を識別することに着目し,万引き検出を異常検出問題として捉えた。
万引き検出に特化したプライバシ保護データセットであるPoseLiftを紹介した。
論文 参考訳(メタデータ) (2025-01-11T17:19:53Z) - A Lean Transformer Model for Dynamic Malware Analysis and Detection [0.0]
マルウェアは現代のコンピューティングの世界にとって急速に成長する脅威であり、既存の防衛線はこの問題に対処するのに十分な効率性を持っていない。
これまでの研究では、実行レポートから抽出したニューラルネットワークとAPI呼び出しシーケンスを活用することに成功した。
本稿では,悪意のあるファイルを検出するために,Transformersアーキテクチャに基づくエミュレーションオンリーモデルを設計する。
論文 参考訳(メタデータ) (2024-08-05T08:46:46Z) - Concept-based Anomaly Detection in Retail Stores for Automatic
Correction using Mobile Robots [3.989104441591223]
Co-ADは視覚変換器(ViT)を用いた概念に基づく異常検出手法である
計画図のような事前の知識ベースを使わずに、誤って配置されたオブジェクトにフラグを付けることができる。
小売品の異常検出画像セットで89.90%の最高成功率を持つ。
論文 参考訳(メタデータ) (2023-10-21T16:49:23Z) - Exploring Decision-based Black-box Attacks on Face Forgery Detection [53.181920529225906]
顔の偽造生成技術は鮮明な顔を生み出し、セキュリティとプライバシーに対する世間の懸念を高めている。
顔偽造検出は偽の顔の識別に成功しているが、最近の研究では顔偽造検出は敵の例に対して非常に脆弱であることが示されている。
論文 参考訳(メタデータ) (2023-10-18T14:49:54Z) - Self-Supervised Masked Convolutional Transformer Block for Anomaly
Detection [122.4894940892536]
本稿では, 自己監督型マスク型畳み込み変圧器ブロック (SSMCTB) について述べる。
本研究では,従来の自己教師型予測畳み込み抑止ブロック(SSPCAB)を3次元マスク付き畳み込み層,チャンネルワイドアテンション用トランスフォーマー,およびハマーロスに基づく新たな自己教師型目標を用いて拡張する。
論文 参考訳(メタデータ) (2022-09-25T04:56:10Z) - Initiative Defense against Facial Manipulation [82.96864888025797]
本稿では,悪意あるユーザによって制御される顔操作モデルの性能を低下させるための,イニシアティブ・ディフェンスの新しい枠組みを提案する。
まず、サロゲートモデルを用いてターゲット操作モデルを模倣し、次に毒の摂動発生器を考案し、所望の毒を得る。
論文 参考訳(メタデータ) (2021-12-19T09:42:28Z) - TransForensics: Image Forgery Localization with Dense Self-Attention [37.2172540238706]
TransForensicsはトランスフォーマーにインスパイアされた新しい画像フォージェリローカライゼーション手法である。
フレームワークの主要な2つのコンポーネントは、密集自己アテンションエンコーダと密集補正モジュールである。
主要なベンチマーク実験により、TransForensicsは最先端の手法よりも大きなマージンで優れていることを示す。
論文 参考訳(メタデータ) (2021-08-09T08:43:26Z) - End-to-End Trainable Multi-Instance Pose Estimation with Transformers [68.93512627479197]
畳み込みニューラルネットワークとトランスを組み合わせることで,マルチインスタンスポーズ推定のための新たなエンドツーエンドトレーニング可能なアプローチを提案する。
変換器を用いたエンドツーエンドのトレーニング可能なオブジェクト検出に関する最近の研究に触発されて、変換器エンコーダデコーダアーキテクチャとバイパーティイトマッチングスキームを併用して、与えられた画像中のすべての個人のポーズを直接回帰する。
提案モデルであるポーズ推定トランスフォーマ(poet)は,キーポイント損失,キーポイント可視性損失,センター損失,クラス損失からなる,新たなセットベースグローバル損失を用いてトレーニングを行う。
論文 参考訳(メタデータ) (2021-03-22T18:19:22Z) - VideoForensicsHQ: Detecting High-quality Manipulated Face Videos [77.60295082172098]
偽造検知器の性能は、人間の目で見られる人工物の存在にどのように依存するかを示す。
前例のない品質の顔ビデオ偽造検出のための新しいベンチマークデータセットを導入する。
論文 参考訳(メタデータ) (2020-05-20T21:17:43Z) - Suspicious Behavior Detection on Shoplifting Cases for Crime Prevention
by Using 3D Convolutional Neural Networks [0.0]
ビデオ特徴抽出器として3DCNNモデルを実装し,その性能を日常行動と万引きのサンプルからなるデータセット上で検証した。
犯罪が発生した場合の75%を正しく識別するので、結果は励まされる。
論文 参考訳(メタデータ) (2020-04-30T22:06:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。