論文の概要: SCD: A Stacked Carton Dataset for Detection and Segmentation
- arxiv url: http://arxiv.org/abs/2102.12808v1
- Date: Thu, 25 Feb 2021 12:22:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 13:50:38.195466
- Title: SCD: A Stacked Carton Dataset for Detection and Segmentation
- Title(参考訳): SCD: 検出とセグメンテーションのための積み重ねカートンデータセット
- Authors: Jinrong Yang, Shengkai Wu, Lijun Gou, Hangcheng Yu, Chenxi Lin,
Jiazhuo Wang, Minxuan Li, Xiaoping Li
- Abstract要約: 研究コミュニティがこれまでカートン検出モデルをトレーニングして評価するための公開大規模なカートンデータセットはありません。
カートン検出における最先端の進歩を目標とする,大規模カートンデータセットであるStacked Cartonを提案する。
- 参考スコア(独自算出の注目度): 1.2701155431942108
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Carton detection is an important technique in the automatic logistics system
and can be applied to many applications such as the stacking and unstacking of
cartons, the unloading of cartons in the containers. However, there is no
public large-scale carton dataset for the research community to train and
evaluate the carton detection models up to now, which hinders the development
of carton detection. In this paper, we present a large-scale carton dataset
named Stacked Carton Dataset(SCD) with the goal of advancing the
state-of-the-art in carton detection. Images are collected from the internet
and several warehourses, and objects are labeled using per-instance
segmentation for precise localization. There are totally 250,000 instance masks
from 16,136 images. In addition, we design a carton detector based on RetinaNet
by embedding Offset Prediction between Classification and Localization
module(OPCL) and Boundary Guided Supervision module(BGS). OPCL alleviates the
imbalance problem between classification and localization quality which boosts
AP by 3.1% - 4.7% on SCD while BGS guides the detector to pay more attention to
boundary information of cartons and decouple repeated carton textures. To
demonstrate the generalization of OPCL to other datasets, we conduct extensive
experiments on MS COCO and PASCAL VOC. The improvement of AP on MS COCO and
PASCAL VOC is 1.8% - 2.2% and 3.4% - 4.3% respectively.
- Abstract(参考訳): カートンの検出は自動ロジスティクス システムの重要な技術であり、カートンの積み重ねそしてunstacking、容器のカートンの荷を下すことのような多くの適用に適用することができます。
しかし、研究コミュニティがカートン検出モデルのトレーニングと評価を行うための公開大規模カートンデータセットは存在しないため、カートン検出の開発を妨げている。
本稿では,カートン検出の最先端化を目標として,stacked carton dataset(scd)という大規模カートンデータセットを提案する。
画像はインターネットといくつかのウェアタイムから収集され、オブジェクトはインスタンスごとのセグメンテーションを使用して正確な位置決めを行う。
16,136枚の画像から250,000個のインスタンスマスクがあります。
さらに,分類・局所化モジュール(OPCL)と境界誘導スーパービジョンモジュール(BGS)のオフセット予測を組み込んで,RetinaNetに基づくカートン検出器を設計する。
OPCLは、APを3.1%から4.7%のSCDで増加させる分類と局所化品質の不均衡の問題を軽減する一方、BGSはカルトンの境界情報に注意を払って繰り返しカートンテクスチャを分離するように検出器を誘導する。
OPCLの他のデータセットへの一般化を実証するため,MS COCOとPASCAL VOCについて広範な実験を行った。
MS COCOとPASCAL VOCのAPの改善はそれぞれ1.8% - 2.2%と3.4% - 4.3%である。
関連論文リスト
- Semi-supervised 3D Object Detection with PatchTeacher and PillarMix [71.4908268136439]
現在の半教師付き3Dオブジェクト検出法では、教師が学生に擬似ラベルを生成するのが一般的である。
学生に高品質な擬似ラベルを提供するために,部分的なシーン3Dオブジェクト検出に焦点を当てたPatchTeacherを提案する。
本稿では,PatchTeacherの性能向上のために,Patch Normalizer,Quadrant Align,Fovea Selectionの3つの重要なテクニックを紹介する。
論文 参考訳(メタデータ) (2024-07-13T06:58:49Z) - Distribution-Aware Calibration for Object Detection with Noisy Bounding Boxes [58.2797274877934]
そこで我々はDISCO(Distribution-aware CalibratiOn)を提案する。
分類, 局所化, 解釈可能性を改善するために, 3つの分布認識技術を開発した。
論文 参考訳(メタデータ) (2023-08-23T09:20:05Z) - ADS_UNet: A Nested UNet for Histopathology Image Segmentation [1.213915839836187]
我々は,浅層層に資源効率の高い深層監視を組み込んだ段階的付加的学習アルゴリズムであるADS UNetを提案する。
ADS_UNetは、CRAGおよびBCSSデータセット上で、最先端のTransformerベースのモデルを1.08および0.6ポイント上回る性能を示す。
論文 参考訳(メタデータ) (2023-04-10T13:08:48Z) - Box-Level Active Detection [47.41635810670186]
ボックスベース1サイクル当たりの予算を制御する,ボックスレベルのアクティブ検出フレームワークを導入する。
我々は,人間のアノテーションとモデルインテリジェンスの両方を活用するために,補完的擬似アクティブストラテジー(ComPAS)を提案する。
ComPASは、統一された設定で4つの設定で10の競争相手を上回っている。
論文 参考訳(メタデータ) (2023-03-23T08:06:10Z) - Augment and Criticize: Exploring Informative Samples for Semi-Supervised
Monocular 3D Object Detection [64.65563422852568]
我々は、一般的な半教師付きフレームワークを用いて、難解な単分子3次元物体検出問題を改善する。
我々は、ラベルのないデータから豊富な情報的サンプルを探索する、新しい、シンプルで効果的なAugment and Criticize'フレームワークを紹介します。
3DSeMo_DLEと3DSeMo_FLEXと呼ばれる2つの新しい検出器は、KITTIのAP_3D/BEV(Easy)を3.5%以上改善した。
論文 参考訳(メタデータ) (2023-03-20T16:28:15Z) - 3D Cascade RCNN: High Quality Object Detection in Point Clouds [122.42455210196262]
本稿では3次元カスケードRCNNを提案する。これはカスケードパラダイムにおいて、酸化点雲に基づいて複数の検出器を割り当てる。
提案する3次元カスケードRCNNは,最先端の3次元物体検出技術と比較した場合の優位性を検証した。
論文 参考訳(メタデータ) (2022-11-15T15:58:36Z) - S4OD: Semi-Supervised learning for Single-Stage Object Detection [17.44592826610368]
単段検出器は、極端に前景の階級不均衡に苦しむが、2段検出器は動かない。
半教師対象検出では、高品質な擬似ラベルのみを選択することで、2段階検出器が優れた性能を発揮する。
論文 参考訳(メタデータ) (2022-04-09T15:19:37Z) - A Continual Learning Framework for Adaptive Defect Classification and
Inspection [7.552600549241253]
機械ビジョンに基づく欠陥分類技術は製造工程における自動品質検査に広く採用されている。
本稿では,不正サンプルの効率的な検査を行い,高ボリュームデータバッチから欠陥を分類する一般的なフレームワークについて述べる。
論文 参考訳(メタデータ) (2022-03-16T17:57:41Z) - Towards Real-World Prohibited Item Detection: A Large-Scale X-ray
Benchmark [53.9819155669618]
本稿では,PIDrayと命名された大規模データセットについて述べる。
大量の努力を払って、私たちのデータセットには、高品質な注釈付きセグメンテーションマスクとバウンディングボックスを備えた47,677ドルのX線画像に、禁止アイテムの12ドルカテゴリが含まれています。
提案手法は最先端の手法に対して,特に故意に隠された項目を検出するために好適に機能する。
論文 参考訳(メタデータ) (2021-08-16T11:14:16Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。