論文の概要: Training with Product Digital Twins for AutoRetail Checkout
- arxiv url: http://arxiv.org/abs/2308.09708v1
- Date: Fri, 18 Aug 2023 17:58:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 12:06:59.985328
- Title: Training with Product Digital Twins for AutoRetail Checkout
- Title(参考訳): 自動リテールチェックアウトのための製品デジタル双子によるトレーニング
- Authors: Yue Yao, Xinyu Tian, Zheng Tang, Sujit Biswas, Huan Lei, Tom Gedeon,
Liang Zheng
- Abstract要約: デジタル双生児(DtTrain)を用いたトレーニングデータ最適化フレームワークを提案する。
これらのデジタルツインは製品ラベルを継承し、拡張されるとデジタルツイントレーニングセット(DTセット)を形成する。
本実験では,既存のデータセット合成手法で作成したトレーニングセットを,精度の点で性能的に優れることを示す。
- 参考スコア(独自算出の注目度): 28.823850493539293
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automating the checkout process is important in smart retail, where users
effortlessly pass products by hand through a camera, triggering automatic
product detection, tracking, and counting. In this emerging area, due to the
lack of annotated training data, we introduce a dataset comprised of product 3D
models, which allows for fast, flexible, and large-scale training data
generation through graphic engine rendering. Within this context, we discern an
intriguing facet, because of the user "hands-on" approach, bias in user
behavior leads to distinct patterns in the real checkout process. The existence
of such patterns would compromise training effectiveness if training data fail
to reflect the same. To address this user bias problem, we propose a training
data optimization framework, i.e., training with digital twins (DtTrain).
Specifically, we leverage the product 3D models and optimize their rendering
viewpoint and illumination to generate "digital twins" that visually resemble
representative user images. These digital twins, inherit product labels and,
when augmented, form the Digital Twin training set (DT set). Because the
digital twins individually mimic user bias, the resulting DT training set
better reflects the characteristics of the target scenario and allows us to
train more effective product detection and tracking models. In our experiment,
we show that DT set outperforms training sets created by existing dataset
synthesis methods in terms of counting accuracy. Moreover, by combining DT set
with pseudo-labeled real checkout data, further improvement is observed. The
code is available at https://github.com/yorkeyao/Automated-Retail-Checkout.
- Abstract(参考訳): チェックアウトの自動化は、ユーザーがカメラに手作業で商品を渡して、自動製品検出、追跡、計数を行うスマート小売において重要である。
この新興領域では,アノテーション付きトレーニングデータの欠如により,製品3dモデルからなるデータセットを導入し,グラフィックエンジンレンダリングによる高速,フレキシブル,大規模のトレーニングデータ生成を可能にする。
このコンテキストでは、ユーザの"ハンドオン"アプローチによって、ユーザの振る舞いのバイアスが実際のチェックアウトプロセスで異なるパターンに結びつくため、興味深いファセットを識別します。
このようなパターンの存在は、トレーニングデータが同じ反映にならなかった場合、トレーニング効果を損なうことになる。
ユーザのバイアス問題に対処するために,デジタルツインを用いたトレーニング(dttrain)という,トレーニングデータ最適化フレームワークを提案する。
具体的には、製品3dモデルを利用してレンダリングの視点と照明を最適化し、視覚的に代表的ユーザイメージに類似した「デジタルツイン」を生成する。
これらのデジタルツインは製品ラベルを継承し、拡張されるとデジタルツイントレーニングセット(DTセット)を形成する。
ディジタルツインはユーザバイアスを個別に模倣するため、結果として得られるDTトレーニングセットは、ターゲットシナリオの特徴をよりよく反映し、より効果的な製品検出と追跡モデルをトレーニングすることができます。
本実験では,既存のデータセット合成手法で作成したトレーニングセットを,精度の点で性能的に優れることを示す。
さらに、DTセットと擬似ラベル付き実チェックアウトデータを組み合わせることにより、さらなる改善が観察される。
コードはhttps://github.com/yorkeyao/automated-retail-checkoutで入手できる。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Shelf-Supervised Cross-Modal Pre-Training for 3D Object Detection [52.66283064389691]
最先端の3Dオブジェクト検出器は、しばしば大量のラベル付きデータセットで訓練される。
近年の研究では、ラベル付きデータによる自己教師付き事前学習が、ラベル付きラベルによる検出精度を向上させることが示されている。
組合わせRGBとLiDARデータからゼロショット3Dバウンディングボックスを生成するためのシェルフ制御手法を提案する。
論文 参考訳(メタデータ) (2024-06-14T15:21:57Z) - Enhancing 2D Representation Learning with a 3D Prior [21.523007105586217]
視覚データの堅牢で効果的な表現を学習することは、コンピュータビジョンの基本的な課題である。
従来、これはラベル付きデータによるトレーニングモデルによって達成される。
本稿では,3次元構造を明示的に強制することで,既存の自己管理手法を強化するための新しい手法を提案する。
論文 参考訳(メタデータ) (2024-06-04T17:55:22Z) - An Empirical Study of Pseudo-Labeling for Image-based 3D Object
Detection [72.30883544352918]
異なる条件下で,擬似ラベルがベースラインモデルに対して効果的に監視できるかどうかを検討する。
ベルとホイッスルを使わずにKITTI-3Dテストセットの適度なレベルを20.23 APで達成し、ベースラインモデルを6.03 APで改善した。
この研究が、半教師付き環境下で画像に基づく3D検出コミュニティに洞察を与えてくれることを願っている。
論文 参考訳(メタデータ) (2022-08-15T12:17:46Z) - TDT: Teaching Detectors to Track without Fully Annotated Videos [2.8292841621378844]
検知と外観の埋め込みの両方を予測するワンステージトラッカーは、多くの注目を集めた。
提案した1段階のソリューションは,2段階のソリューションと品質が一致するが,3倍高速である。
論文 参考訳(メタデータ) (2022-05-11T15:56:17Z) - Supervised Contrastive Learning for Product Matching [2.28438857884398]
このポスターは、eコマースにおける製品マッチングのタスクに対照的な学習を適用する最初の作品です。
教師付きコントラスト学習技術を用いてトランスフォーマーエンコーダを事前学習し、その後、マッチング問題に対して微調整する。
本稿では,トレーニングデータに製品識別器を含まないユースケースに対して,コントラスト学習を適用可能なソース対応サンプリング戦略を提案する。
論文 参考訳(メタデータ) (2022-02-04T12:16:38Z) - Multi-Task Self-Training for Learning General Representations [97.01728635294879]
マルチタスク・セルフトレーニング(MuST)は、独立した専門教師モデルにおける知識を活用して、一人の一般学生モデルを訓練する。
MuSTはラベルなしまたは部分的にラベル付けされたデータセットでスケーラブルで、大規模データセットのトレーニングにおいて、特別な教師付きモデルとセルフ教師付きモデルの両方を上回っている。
論文 参考訳(メタデータ) (2021-08-25T17:20:50Z) - Self-Supervised Pretraining of 3D Features on any Point-Cloud [40.26575888582241]
3D登録なしで任意の3Dデータを扱うことができる簡単な自己監督関連方法を紹介します。
オブジェクト検出、セマンティックセグメンテーション、オブジェクト分類の9つのベンチマークでモデルを評価し、最新の結果を達成し、教師付きプリトレーニングを上回ります。
論文 参考訳(メタデータ) (2021-01-07T18:55:21Z) - Self-Supervised Person Detection in 2D Range Data using a Calibrated
Camera [83.31666463259849]
2次元LiDARに基づく人検出器のトレーニングラベル(擬似ラベル)を自動生成する手法を提案する。
擬似ラベルで訓練または微調整された自己監視検出器が,手動アノテーションを用いて訓練された検出器を上回っていることを示した。
私達の方法は付加的な分類の努力なしで配置の間に人の探知器を改善する有効な方法です。
論文 参考訳(メタデータ) (2020-12-16T12:10:04Z) - Omni-supervised Facial Expression Recognition via Distilled Data [120.11782405714234]
ネットワークトレーニングにおいて,信頼度の高いサンプルを多量のラベルのないデータで活用するためのオムニ教師付き学習を提案する。
我々は,新しいデータセットが学習したFERモデルの能力を大幅に向上させることができることを実験的に検証した。
そこで本研究では,生成したデータセットを複数のクラスワイド画像に圧縮するために,データセット蒸留戦略を適用することを提案する。
論文 参考訳(メタデータ) (2020-05-18T09:36:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。