論文の概要: Rethinking Object Detection in Retail Stores
- arxiv url: http://arxiv.org/abs/2003.08230v3
- Date: Sat, 5 Dec 2020 05:14:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-22 12:41:14.699802
- Title: Rethinking Object Detection in Retail Stores
- Title(参考訳): 小売店舗におけるオブジェクト検出の再考
- Authors: Yuanqiang Cai, Longyin Wen, Libo Zhang, Dawei Du, Weiqiang Wang
- Abstract要約: そこで我々はLocountと略される新しいタスク、同時にオブジェクトのローカライゼーションとカウントを提案する。
Locountは、関心のあるオブジェクトのグループをインスタンス数でローカライズするアルゴリズムを必要とする。
大規模オブジェクトのローカライズと数えるデータセットを小売店で収集する。
- 参考スコア(独自算出の注目度): 55.359582952686175
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The convention standard for object detection uses a bounding box to represent
each individual object instance. However, it is not practical in the
industry-relevant applications in the context of warehouses due to severe
occlusions among groups of instances of the same categories. In this paper, we
propose a new task, ie, simultaneously object localization and counting,
abbreviated as Locount, which requires algorithms to localize groups of objects
of interest with the number of instances. However, there does not exist a
dataset or benchmark designed for such a task. To this end, we collect a
large-scale object localization and counting dataset with rich annotations in
retail stores, which consists of 50,394 images with more than 1.9 million
object instances in 140 categories. Together with this dataset, we provide a
new evaluation protocol and divide the training and testing subsets to fairly
evaluate the performance of algorithms for Locount, developing a new benchmark
for the Locount task. Moreover, we present a cascaded localization and counting
network as a strong baseline, which gradually classifies and regresses the
bounding boxes of objects with the predicted numbers of instances enclosed in
the bounding boxes, trained in an end-to-end manner. Extensive experiments are
conducted on the proposed dataset to demonstrate its significance and the
analysis discussions on failure cases are provided to indicate future
directions. Dataset is available at
https://isrc.iscas.ac.cn/gitlab/research/locount-dataset.
- Abstract(参考訳): オブジェクト検出の規約では、各オブジェクトインスタンスを表現するためにバウンディングボックスを使用する。
しかし,同カテゴリーの事例群間での厳密な排除が原因で,倉庫の文脈における産業関連応用においては実用的ではない。
本稿では,オブジェクトのローカライズとカウントを同時に行うタスクであるieをlocountと略して提案する。
しかし、このようなタスク用に設計されたデータセットやベンチマークは存在しない。
この目的のために,140のカテゴリで190万以上のオブジェクトインスタンスを持つ50,394枚の画像からなる,リッチアノテーションによる大規模オブジェクトローカライゼーションとカウントデータセットを収集した。
このデータセットと共に、新しい評価プロトコルを提供し、トレーニングとテストのサブセットを分割して、locountのアルゴリズムのパフォーマンスを公平に評価し、locountタスクの新しいベンチマークを開発する。
さらに,対象のバウンディングボックスを,予測されたバウンディングボックス内のインスタンス数で徐々に分類し,回帰し,エンドツーエンドでトレーニングする,強力なベースラインとして,カスケード型ローカライズおよびカウントネットワークを提案する。
提案したデータセットで大規模な実験を行い,その意義を実証し,今後の方向性を示すために,障害事例の分析検討を行った。
Datasetはhttps://isrc.iscas.ac.cn/gitlab/research/locount-datasetで利用可能である。
関連論文リスト
- SQLNet: Scale-Modulated Query and Localization Network for Few-Shot
Class-Agnostic Counting [71.38754976584009]
CAC(class-agnostic counting)タスクは、最近、任意のクラスの全てのオブジェクトを、入力画像にいくつかの例を付与してカウントする問題を解くために提案されている。
我々は、スケール変調クエリーおよびローカライズネットワーク(Net)と呼ばれる、新しいローカライズベースのCACアプローチを提案する。
クエリとローカライゼーションの段階において、模範者のスケールを完全に探求し、各オブジェクトを正確に位置付けし、その近似サイズを予測することで、効果的なカウントを実現している。
論文 参考訳(メタデータ) (2023-11-16T16:50:56Z) - Zero-Shot Object Counting with Language-Vision Models [50.1159882903028]
クラスに依存しないオブジェクトカウントは、テスト時に任意のクラスのオブジェクトインスタンスをカウントすることを目的としている。
現在の手法では、新しいカテゴリではしばしば利用できない入力として、人間に注釈をつけた模範を必要とする。
テスト期間中にクラス名のみを利用できる新しい設定であるゼロショットオブジェクトカウント(ZSC)を提案する。
論文 参考訳(メタデータ) (2023-09-22T14:48:42Z) - Learning from Pseudo-labeled Segmentation for Multi-Class Object
Counting [35.652092907690694]
CAC(Class-Agnostic counting)は、様々な領域にまたがる多くの潜在的な応用がある。
目標は、いくつかの注釈付き例に基づいて、テスト中に任意のカテゴリのオブジェクトを数えることである。
擬似ラベルマスクを用いて学習したセグメンテーションモデルは、任意のマルチクラス画像に対して効果的に対象をローカライズできることを示す。
論文 参考訳(メタデータ) (2023-07-15T01:33:19Z) - Beyond SOT: Tracking Multiple Generic Objects at Once [141.36900362724975]
ジェネリックオブジェクト追跡(ジェネリックオブジェクト追跡、英: Generic Object Tracking、GOT)は、ビデオの最初のフレームでボックスをバウンディングすることによって指定されたターゲットオブジェクトを追跡する問題である。
大規模GOTベンチマークであるLaGOTを導入し,複数のアノテート対象オブジェクトをシーケンス毎に含む。
提案手法は単一オブジェクトのGOTデータセットに対して高い競合性を実現し,TrackingNet上での新たな技術状態が84.4%の成功率で設定されている。
論文 参考訳(メタデータ) (2022-12-22T17:59:19Z) - Few-shot Object Counting and Detection [25.61294147822642]
我々は、ターゲットオブジェクトクラスのいくつかの例のバウンディングボックスを考慮に入れ、ターゲットクラスのすべてのオブジェクトをカウントし、検出する新しいタスクに取り組む。
このタスクは、数ショットのオブジェクトカウントと同じ監督を共有しますが、オブジェクトのバウンディングボックスと総オブジェクトカウントを出力します。
本稿では,新しい2段階トレーニング戦略と,新しい不確実性に留意した小ショットオブジェクト検出器であるCounting-DETRを紹介する。
論文 参考訳(メタデータ) (2022-07-22T10:09:18Z) - Tiny Object Tracking: A Large-scale Dataset and A Baseline [40.93697515531104]
大規模なビデオデータセットを作成し、合計217Kフレームの434のシーケンスを含む。
データ作成において、幅広い視点とシーンの複雑さをカバーするため、12の課題属性を考慮に入れます。
統合されたフレームワークで3段階の知識蒸留を行うMKDNet(Multilevel Knowledge Distillation Network)を提案する。
論文 参考訳(メタデータ) (2022-02-11T15:00:32Z) - Single Image Object Counting and Localizing using Active-Learning [4.56877715768796]
単一画像シナリオにおける反復オブジェクトのカウントとローカライズのための新しい手法を提案する。
本手法は,少数のアクティブ・ラーニング・イテレーションにおいて,入力画像から注意深く収集したラベルの小さなセットに対してCNNを訓練する。
既存のユーザ支援カウント法と比較すると,ユーザマウスのクリック数,ランニングタイムの計測と位置決めの精度の観点から,能動的学習が最先端のパフォーマンスを達成している。
論文 参考訳(メタデータ) (2021-11-16T11:29:21Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Dilated-Scale-Aware Attention ConvNet For Multi-Class Object Counting [18.733301622920102]
多クラスオブジェクトカウントは、オブジェクトカウントタスクの適用範囲を広げる。
マルチターゲット検出タスクは、いくつかのシナリオでマルチクラスオブジェクトカウントを実現することができる。
ポイントレベルのアノテーションに基づく簡便かつ効率的なカウントネットワークを提案する。
論文 参考訳(メタデータ) (2020-12-15T08:38:28Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。