論文の概要: Improving Domain Generalization by Learning without Forgetting:
Application in Retail Checkout
- arxiv url: http://arxiv.org/abs/2207.05422v1
- Date: Tue, 12 Jul 2022 09:35:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-13 14:35:17.141768
- Title: Improving Domain Generalization by Learning without Forgetting:
Application in Retail Checkout
- Title(参考訳): 忘れずに学習することでドメインの一般化を改善する:小売チェックアウトへの応用
- Authors: Thuy C. Nguyen, Nam LH. Phan, Son T. Nguyen
- Abstract要約: 本稿では,2段階パイプラインを用いた手法を提案することにより,この問題に対処する。
第1段階はクラスに依存しない項目を検出し、第2段階は製品カテゴリの分類専用である。
この方法は2022年のAIシティチャレンジで評価されます -- トラック4で、テストAセットでF1のスコアを40%以上取得します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Designing an automatic checkout system for retail stores at the human level
accuracy is challenging due to similar appearance products and their various
poses. This paper addresses the problem by proposing a method with a two-stage
pipeline. The first stage detects class-agnostic items, and the second one is
dedicated to classify product categories. We also track the objects across
video frames to avoid duplicated counting. One major challenge is the domain
gap because the models are trained on synthetic data but tested on the real
images. To reduce the error gap, we adopt domain generalization methods for the
first-stage detector. In addition, model ensemble is used to enhance the
robustness of the 2nd-stage classifier. The method is evaluated on the AI City
challenge 2022 -- Track 4 and gets the F1 score $40\%$ on the test A set. Code
is released at the link https://github.com/cybercore-co-ltd/aicity22-track4.
- Abstract(参考訳): 店舗の自動チェックアウトシステムを人間レベルの精度で設計することは、類似の外観製品やさまざまなポーズのために困難である。
本稿では,2段階のパイプラインで提案する手法を提案する。
第1段階はクラスに依存しない項目を検出し、第2段階は製品カテゴリの分類専用である。
また、重複カウントを避けるために、ビデオフレーム全体でオブジェクトを追跡する。
モデルが合成データでトレーニングされるが、実際のイメージでテストされるため、大きな課題はドメインギャップである。
誤差ギャップを低減するため,第1段検出器の領域一般化手法を採用した。
さらに、モデルアンサンブルは第2段分類器の堅牢性を高めるために用いられる。
この方法は2022年のAIシティチャレンジで評価されます -- トラック4で、テストAセットでF1のスコアが40\%です。
コードはリンクhttps://github.com/cybercore-co-ltd/aicity22-track4でリリースされる。
関連論文リスト
- T4P: Test-Time Training of Trajectory Prediction via Masked Autoencoder and Actor-specific Token Memory [39.021321011792786]
軌道予測は、複数のアクター間の相互作用を考慮することを必要とする難しい問題である。
データ駆動型アプローチは、この複雑な問題に対処するために使われてきたが、テスト期間中に分散シフトの下では信頼性の低い予測に悩まされている。
本研究では,観測データから回帰損失を用いたオンライン学習手法を提案する。
提案手法は,予測精度と計算効率の両方の観点から,既存の最先端オンライン学習手法の性能を超越した手法である。
論文 参考訳(メタデータ) (2024-03-15T06:47:14Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Self-Distilled Masked Auto-Encoders are Efficient Video Anomaly
Detectors [117.61449210940955]
ビデオフレームレベルで適用された軽量マスク付きオートエンコーダ(AE)に基づく効率的な異常事象検出モデルを提案する。
動き勾配に基づく重みトークンへのアプローチを導入し、静的背景シーンから前景オブジェクトへ焦点を移す。
トレーニングビデオの強化のために合成異常事象を生成し,マスク付きAEモデルを用いてオリジナルのフレームを共同で再構築する。
論文 参考訳(メタデータ) (2023-06-21T06:18:05Z) - AnoRand: A Semi Supervised Deep Learning Anomaly Detection Method by
Random Labeling [0.0]
異常検出(英: Anomaly detection)またはより一般的には異常検出(英: outliers detection)は、理論的および応用機械学習において最も人気があり、課題の1つである。
我々は、ディープラーニングアーキテクチャとランダムな合成ラベル生成を組み合わせることで、textbfAnoRandと呼ばれる新しい半教師付き異常検出手法を提案する。
論文 参考訳(メタデータ) (2023-05-28T10:53:34Z) - Label, Verify, Correct: A Simple Few Shot Object Detection Method [93.84801062680786]
トレーニングセットから高品質な擬似アノテーションを抽出するための簡単な擬似ラベリング手法を提案する。
擬似ラベリングプロセスの精度を向上させるための2つの新しい手法を提案する。
提案手法は,既存手法と比較して,最先端ないし第2の性能を実現する。
論文 参考訳(メタデータ) (2021-12-10T18:59:06Z) - A Good Representation Detects Noisy Labels [9.4092903583089]
ラベルノイズは、誤った相関パターンを符号化し、ディープニューラルネットワーク(DNN)の一般化を損なう現実世界のデータセットに広まる
本稿では,ノイズラベルを検出するために,普遍的に適用可能なトレーニング不要なソリューションを提案する。
合成および実世界のラベルノイズによる実験は、トレーニングなしのソリューションがトレーニングベースのデータセットの大部分よりも大幅に改善されていることを示している。
論文 参考訳(メタデータ) (2021-10-12T19:10:30Z) - An Empirical Study of Vehicle Re-Identification on the AI City Challenge [19.13038665501964]
Track2は、現実世界のデータと合成データの両方を扱う車両再識別(ReID)タスクである。
主に、この課題におけるトレーニングデータ、教師なしドメイン適応(UDA)トレーニング、後処理、モデルアンサンブルの4点に注目します。
以上の手法により, 最終的に0.7445mAPのスコアが得られた。
論文 参考訳(メタデータ) (2021-05-20T12:20:52Z) - Instance-aware, Context-focused, and Memory-efficient Weakly Supervised
Object Detection [184.563345153682]
我々は、弱教師付き学習のためのインスタンス認識とコンテキスト重視の統合フレームワークを開発する。
メモリ効率の高いシーケンシャルバッチバックプロパゲーションを考案しながら、インスタンス対応の自己学習アルゴリズムと学習可能なコンクリートドロップブロックを採用している。
提案手法はCOCO(12.1% AP$、24.8% AP_50$)、VOC 2007(54.9% AP$)、VOC 2012(52.1% AP$)の最先端結果である。
論文 参考訳(メタデータ) (2020-04-09T17:57:09Z) - 1st Place Solutions for OpenImage2019 -- Object Detection and Instance
Segmentation [116.25081559037872]
この記事では,2つのチャンピオンチーム,検出トラックのMMfruit'とセグメンテーショントラックのMMfruitSeg'のソリューションについて,OpenImage Challenge 2019で紹介する。
一般に、対象検出器の場合、バックボーンの端の共有特徴は分類と回帰の両方に適さないことが知られている。
自己学習型最適特徴抽出によりオブジェクトの分類と回帰を分離するデカップリングヘッド(DH)を提案する。
論文 参考訳(メタデータ) (2020-03-17T06:45:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。