論文の概要: StandardSim: A Synthetic Dataset For Retail Environments
- arxiv url: http://arxiv.org/abs/2202.02418v1
- Date: Fri, 4 Feb 2022 22:28:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-08 16:43:04.996185
- Title: StandardSim: A Synthetic Dataset For Retail Environments
- Title(参考訳): StandardSim:小売環境のための合成データセット
- Authors: Cristina Mata, Nick Locascio, Mohammed Azeem Sheikh, Kenny Kihara and
Dan Fischetti
- Abstract要約: 本稿では,意味的セグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを特徴とする大規模合成データセットを提案する。
私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。
我々は、データセットのセグメンテーションと深さ推定に広く使用されているモデルをベンチマークし、我々のテストセットが現在の小規模データセットと比較して難しいベンチマークを構成することを示す。
- 参考スコア(独自算出の注目度): 0.07874708385247352
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Autonomous checkout systems rely on visual and sensory inputs to carry out
fine-grained scene understanding in retail environments. Retail environments
present unique challenges compared to typical indoor scenes owing to the vast
number of densely packed, unique yet similar objects. The problem becomes even
more difficult when only RGB input is available, especially for data-hungry
tasks such as instance segmentation. To address the lack of datasets for
retail, we present StandardSim, a large-scale photorealistic synthetic dataset
featuring annotations for semantic segmentation, instance segmentation, depth
estimation, and object detection. Our dataset provides multiple views per
scene, enabling multi-view representation learning. Further, we introduce a
novel task central to autonomous checkout called change detection, requiring
pixel-level classification of takes, puts and shifts in objects over time. We
benchmark widely-used models for segmentation and depth estimation on our
dataset, show that our test set constitutes a difficult benchmark compared to
current smaller-scale datasets and that our training set provides models with
crucial information for autonomous checkout tasks.
- Abstract(参考訳): 自動チェックアウトシステムは、小売環境できめ細かいシーン理解を行うために、視覚と感覚の入力に依存している。
小売環境は、密集した、ユニークで類似した物体が多数存在するため、典型的な屋内シーンと比較して、独特の課題を呈する。
rgb入力のみを利用できる場合、特にインスタンスセグメンテーションのようなデータ格納タスクの場合、問題はさらに困難になる。
小売用データセットの欠如に対処するために,セマンティックセグメンテーション,インスタンスセグメンテーション,深さ推定,オブジェクト検出のためのアノテーションを備えた大規模フォトリアリスティック合成データセットであるStandardSimを提案する。
私たちのデータセットはシーン毎に複数のビューを提供し、マルチビュー表現学習を可能にします。
さらに,自動チェックアウトを中心とする新たなタスクであるチェンジ検出を導入し,時間の経過とともにオブジェクトのテイク,テイク,シフトのピクセルレベルでの分類を行う。
データセット上でセグメンテーションと深さ推定のために広く使われているモデルをベンチマークし、テストセットが現在の小規模データセットと比較して難しいベンチマークであり、トレーニングセットが自律チェックアウトタスクに重要な情報を提供することを示す。
関連論文リスト
- Generalized Few-Shot Semantic Segmentation in Remote Sensing: Challenge and Benchmark [18.636210870172675]
ほとんどショットのセマンティックセグメンテーションは、訓練中に見られない新しいクラスのラベル付き例から学ぶことをディープラーニングモデルに促す。
一般化された数ショットセグメンテーション設定では、モデルが新しいクラスに適応するだけでなく、トレーニングベースクラスで強力なパフォーマンスを維持することを奨励する追加の課題がある。
一般化された数ショット評価設定のためにラベル付けされた追加クラスを備えたOpenEarthMapの拡張データセットをリリースする。
論文 参考訳(メタデータ) (2024-09-17T14:20:47Z) - BEHAVIOR Vision Suite: Customizable Dataset Generation via Simulation [57.40024206484446]
我々は、コンピュータビジョンモデルの体系的評価のために、完全にカスタマイズされた合成データを生成するためのツールと資産のセットであるBEHAVIOR Vision Suite(BVS)を紹介する。
BVSはシーンレベルで多数の調整可能なパラメータをサポートする。
アプリケーションシナリオを3つ紹介する。
論文 参考訳(メタデータ) (2024-05-15T17:57:56Z) - Appearance-Based Refinement for Object-Centric Motion Segmentation [85.2426540999329]
本稿では,ビデオストリームの時間的一貫性を利用して,不正確なフローベース提案を補正する外観に基づく改善手法を提案する。
提案手法では,高精度なフロー予測マスクを模範として,シーケンスレベルの選択機構を用いる。
パフォーマンスは、DAVIS、YouTube、SegTrackv2、FBMS-59など、複数のビデオセグメンテーションベンチマークで評価されている。
論文 参考訳(メタデータ) (2023-12-18T18:59:51Z) - Labeling Indoor Scenes with Fusion of Out-of-the-Box Perception Models [4.157013247909771]
ボトムアップセグメンテーション(SAM)、オブジェクト検出(Detic)、セマンティックセグメンテーション(MaskFormer)の最先端モデルを活用することを提案する。
室内環境におけるセマンティックセグメンテーションとオブジェクトインスタンス検出のための擬似ラベルを得るための,コスト効率の高いラベリング手法を開発することを目的とする。
提案手法の有効性を,Active VisionデータセットとADE20Kデータセットに示す。
論文 参考訳(メタデータ) (2023-11-17T21:58:26Z) - A Threefold Review on Deep Semantic Segmentation: Efficiency-oriented,
Temporal and Depth-aware design [77.34726150561087]
我々は、自動運転車のビジョンの文脈において、Deep Semanticの最も関連性があり最近の進歩について調査を行う。
私たちの主な目的は、それぞれの視点で直面している主要な方法、利点、制限、結果、課題に関する包括的な議論を提供することです。
論文 参考訳(メタデータ) (2023-03-08T01:29:55Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。
この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。
我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文 参考訳(メタデータ) (2021-05-07T03:49:26Z) - The Devil is in Classification: A Simple Framework for Long-tail Object
Detection and Instance Segmentation [93.17367076148348]
本稿では,最新のロングテールLVISデータセットを用いて,最先端の2段階のインスタンスセグメンテーションモデルMask R-CNNの性能低下について検討する。
主な原因は、オブジェクト提案の不正確な分類である。
そこで本研究では,2段階のクラスバランスサンプリング手法により,分類ヘッドバイアスをより効果的に緩和する,簡単な校正フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-23T12:49:07Z) - SVIRO: Synthetic Vehicle Interior Rear Seat Occupancy Dataset and
Benchmark [11.101588888002045]
SVIROは10台の異なる車両の旅客室におけるシーンの合成データセットである。
限られたバリエーションに基づいて学習した際の一般化能力と信頼性について、機械学習に基づくアプローチを解析する。
論文 参考訳(メタデータ) (2020-01-10T14:44:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。