論文の概要: OOS-DSD: Improving Out-of-stock Detection in Retail Images using Auxiliary Tasks
- arxiv url: http://arxiv.org/abs/2510.16508v1
- Date: Sat, 18 Oct 2025 13:48:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 00:56:39.018685
- Title: OOS-DSD: Improving Out-of-stock Detection in Retail Images using Auxiliary Tasks
- Title(参考訳): OOS-DSD:補助的タスクを用いた小売画像のストックアウトオブストック検出の改善
- Authors: Franko Šikić, Sven Lončarić,
- Abstract要約: OOS-DSDは,OOS検出を補助学習により高速化する新しい深層学習手法である。
我々は、OOS、セグメント製品、シーン深度を同時に検出するために、追加の畳み込みブランチを備えた、確立されたYOLOv8オブジェクト検出アーキテクチャを拡張した。
実験の結果,提案手法は平均平均精度(mAP)の1.8%をSOTA OOS検出法より上回った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Out-of-stock (OOS) detection is a very important retail verification process that aims to infer the unavailability of products in their designated areas on the shelf. In this paper, we introduce OOS-DSD, a novel deep learning-based method that advances OOS detection through auxiliary learning. In particular, we extend a well-established YOLOv8 object detection architecture with additional convolutional branches to simultaneously detect OOS, segment products, and estimate scene depth. While OOS detection and product segmentation branches are trained using ground truth data, the depth estimation branch is trained using pseudo-labeled annotations produced by the state-of-the-art (SOTA) depth estimation model Depth Anything V2. Furthermore, since the aforementioned pseudo-labeled depth estimates display relative depth, we propose an appropriate depth normalization procedure that stabilizes the training process. The experimental results show that the proposed method surpassed the performance of the SOTA OOS detection methods by 1.8% of the mean average precision (mAP). In addition, ablation studies confirm the effectiveness of auxiliary learning and the proposed depth normalization procedure, with the former increasing mAP by 3.7% and the latter by 4.2%.
- Abstract(参考訳): アウト・オブ・ストック(OOS)検出は,商品の棚上における不有効性を推定することを目的とした,非常に重要な小売検証プロセスである。
本稿では,OOS検出を補助学習により高速化する新しい深層学習手法であるOOS-DSDを紹介する。
特に、OOS、セグメント製品、シーン深度を同時に検出するために、新しい畳み込みブランチを追加して、よく確立されたYOLOv8オブジェクト検出アーキテクチャを拡張します。
OOS検出および製品セグメンテーションブランチは、地上の真実データを用いて訓練されるが、深度推定ブランチは、最先端(SOTA)深度推定モデルDepth Anything V2によって生成された擬似ラベル付きアノテーションを用いて訓練される。
さらに、上記の擬似ラベル付き深度推定は相対深度を表示するので、トレーニングプロセスを安定化させる適切な深度正規化手順を提案する。
実験の結果,提案手法は平均平均精度(mAP)の1.8%をSOTA OOS検出法より上回った。
さらに、アブレーション研究により、補助学習の有効性と、提案された深度正規化手順が確認され、前者のmAPは3.7%増加し、後者は4.2%上昇した。
関連論文リスト
- DepthSplat: Connecting Gaussian Splatting and Depth [90.06180236292866]
ガウススプラッティングと深さ推定を結合するDepthSplatを提案する。
ガウススプラッティングは、強力な深度モデルを学ぶための教師なし事前学習の目的として機能することを示す。
我々のDepthSplatは、ScanNet、RealEstate10K、DL3DVデータセットの最先端のパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-10-17T17:59:58Z) - Toward Accurate Camera-based 3D Object Detection via Cascade Depth
Estimation and Calibration [20.82054596017465]
最近の3次元物体検出は、画像から3次元特徴空間への変換の精度によって制限されている。
本稿では,カメラを用いた3次元物体検出の基本的な課題である,正確な特徴持ち上げと物体位置決めのための深度情報を効果的に学習する方法を提案する。
論文 参考訳(メタデータ) (2024-02-07T14:21:26Z) - CrossDF: Improving Cross-Domain Deepfake Detection with Deep Information Decomposition [53.860796916196634]
クロスデータセットディープフェイク検出(CrossDF)の性能を高めるためのディープ情報分解(DID)フレームワークを提案する。
既存のディープフェイク検出方法とは異なり、我々のフレームワークは特定の視覚的アーティファクトよりも高いレベルのセマンティック特徴を優先する。
顔の特徴をディープフェイク関連情報と無関係情報に適応的に分解し、本質的なディープフェイク関連情報のみを用いてリアルタイム・フェイク識別を行う。
論文 参考訳(メタデータ) (2023-09-30T12:30:25Z) - DEUX: Active Exploration for Learning Unsupervised Depth Perception [8.044217507775999]
我々は,学習深度完了のための能動的,タスクインフォームドな深度不確実性に基づく運動計画手法を開発した。
提案手法は,ロボット学習に基づく深度推定の統合に関する新たな洞察を提供するとともに,ゼロショットの一般化をさらに改善することを示す。
論文 参考訳(メタデータ) (2023-09-16T23:33:15Z) - Boosting Weakly Supervised Object Detection using Fusion and Priors from
Hallucinated Depth [33.66537809438079]
弱教師付き物体検出(WSOD)の性能向上のための増幅器手法を提案する。
言語コンテキストと深さの関係を解析することにより、関心の対象を含む可能性のある境界ボックスの提案を識別するために、深さを計算します。
提案手法は,最新の2つのWSOD法上に実装することで,6つのデータセットに対して評価を行う。
論文 参考訳(メタデータ) (2023-03-20T08:26:29Z) - Geometry Uncertainty Projection Network for Monocular 3D Object
Detection [138.24798140338095]
本稿では,予測および学習段階の誤り増幅問題に対処するために,幾何不確実性予測ネットワーク(GUP Net)を提案する。
具体的には, GUPモジュールを提案し, 推定深さの幾何誘導不確かさを求める。
トレーニング段階では,エラー増幅による不安定性を低減するための階層型タスク学習戦略を提案する。
論文 参考訳(メタデータ) (2021-07-29T06:59:07Z) - Unsupervised Scale-consistent Depth Learning from Video [131.3074342883371]
本研究では,単眼深度推定器SC-Depthを提案する。
スケール一貫性予測の能力により,我々の単分子学習深層ネットワークは簡単にORB-SLAM2システムに統合可能であることを示す。
提案したハイブリッドPseudo-RGBD SLAMは、KITTIにおいて魅力的な結果を示し、追加のトレーニングなしでKAISTデータセットにうまく一般化する。
論文 参考訳(メタデータ) (2021-05-25T02:17:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。