論文の概要: Compact retail shelf segmentation for mobile deployment
- arxiv url: http://arxiv.org/abs/2004.13094v1
- Date: Mon, 27 Apr 2020 18:54:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 05:39:03.523839
- Title: Compact retail shelf segmentation for mobile deployment
- Title(参考訳): モバイル展開のための小型小売棚セグメンテーション
- Authors: Pratyush Kumar, Muktabh Mayank Srivastava
- Abstract要約: 私たちは、小売業界でよくある問題であるシェルフセグメンテーションに取り組んでいます。
目的は、シェルフエッジをセグメント化するだけでなく、モデルをモバイルデバイスにデプロイすることにある。
メモリ制限のあるデバイス上で高速に動作し、ラベル付きデータの少ない100イメージでトレーニングできる小型のコンパクトモデルを提案する。
- 参考スコア(独自算出の注目度): 6.127963013089406
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The recent surge of automation in the retail industries has rapidly increased
demand for applying deep learning models on mobile devices. To make the deep
learning models real-time on-device, a compact efficient network becomes
inevitable. In this paper, we work on one such common problem in the retail
industries - Shelf segmentation. Shelf segmentation can be interpreted as a
pixel-wise classification problem, i.e., each pixel is classified as to whether
they belong to visible shelf edges or not. The aim is not just to segment shelf
edges, but also to deploy the model on mobile devices. As there is no standard
solution for such dense classification problem on mobile devices, we look at
semantic segmentation architectures which can be deployed on edge. We modify
low-footprint semantic segmentation architectures to perform shelf
segmentation. In addressing this issue, we modified the famous U-net
architecture in certain aspects to make it fit for on-devices without impacting
significant drop in accuracy and also with 15X fewer parameters. In this paper,
we proposed Light Weight Segmentation Network (LWSNet), a small compact model
able to run fast on devices with limited memory and can train with less amount
(~ 100 images) of labeled data.
- Abstract(参考訳): 近年の小売業の自動化の進展により、モバイルデバイスにディープラーニングモデルを適用する需要が急増している。
ディープラーニングモデルをデバイス上でリアルタイムにするために、コンパクトな効率的なネットワークは避けられない。
本稿では,小売業において共通する問題である棚セグメンテーションについて検討する。
棚のセグメンテーションは、ピクセル単位での分類問題、すなわち、各画素が目に見える棚のエッジに属するかどうかで分類される。
目的は、シェルフエッジをセグメント化するだけでなく、モデルをモバイルデバイスにデプロイすることにある。
モバイルデバイスにそのような密接な分類問題に対する標準的な解決策がないため、エッジにデプロイ可能なセマンティックセグメンテーションアーキテクチャを検討する。
低フットプリントのセマンティクスセグメンテーションアーキテクチャを改良して棚セグメンテーションを行う。
この問題に対処するため、我々は有名なu-netアーキテクチャをいくつかの面で修正し、デバイス上でのアーキテクチャに適合するようにしました。
本稿では,メモリに制限のあるデバイス上で高速に動作でき,ラベル付きデータの少ない量(約100画像)でトレーニングできる小型モデルであるlight weight segmentation network (lwsnet)を提案する。
関連論文リスト
- PaveSAM Segment Anything for Pavement Distress [4.671701998390791]
コンピュータビジョンを用いた舗装モニタリングは、手動の方法よりも効率的に正確に舗装条件を分析することができる。
しかし、ディープラーニングベースのセグメンテーションモデルは、しばしば教師付きであり、ピクセルレベルのアノテーションを必要とする。
本研究では,ゼロショット分割モデルPaveSAMを提案する。
論文 参考訳(メタデータ) (2024-09-11T14:24:29Z) - TinySeg: Model Optimizing Framework for Image Segmentation on Tiny Embedded Systems [1.3654846342364308]
TinySegは、小さな組み込みシステムでメモリ効率の高いイメージセグメンテーションを可能にする、新しいモデル最適化フレームワークである。
この研究は、既存の小さな機械学習フレームワーク上にTinySegを実装し、TinySegがイメージセグメンテーションモデルのピークメモリ使用量を39.3%削減できることを示した。
論文 参考訳(メタデータ) (2024-05-03T05:18:35Z) - SeaFormer++: Squeeze-enhanced Axial Transformer for Mobile Visual Recognition [29.522565659389183]
本研究では,モバイル視覚認識のための圧縮強化軸変換器 (SeaFormer) を提案する。
モバイルフレンドリーなライバルとTransformerベースのライバルに勝って、パフォーマンスが良く、レイテンシも低い。
論文 参考訳(メタデータ) (2023-01-30T18:34:16Z) - Location-Aware Self-Supervised Transformers [74.76585889813207]
画像部品の相対的な位置を予測し,セマンティックセグメンテーションのためのネットワークを事前訓練する。
参照パッチのサブセットを問合せのサブセットにマスキングすることで,タスクの難しさを制御します。
実験により,この位置認識事前学習が,いくつかの難解なセマンティックセグメンテーションベンチマークに競合する表現をもたらすことが示された。
論文 参考訳(メタデータ) (2022-12-05T16:24:29Z) - SUNet: Scale-aware Unified Network for Panoptic Segmentation [25.626882426111198]
様々なスケールのオブジェクト分割の問題を軽減するために,2つの軽量モジュールを提案する。
マルチスケールオブジェクトに適応可能な、エンドツーエンドのスケール対応統一ネットワーク(SUNet)を提案する。
論文 参考訳(メタデータ) (2022-09-07T01:40:41Z) - Memory-based Semantic Segmentation for Off-road Unstructured Natural
Environments [29.498304237783763]
本稿では,セマンティックセグメンテーションのためのメモリモジュールを提案する。
メモリモジュールはトレーニングイメージのかなりの表現をメモリアイテムとして格納する。
我々は,ロボット非構造地上走行データセットとRELLISデータセットについて実験を行った。
論文 参考訳(メタデータ) (2021-08-12T10:04:47Z) - Segmenter: Transformer for Semantic Segmentation [79.9887988699159]
セマンティックセグメンテーションのためのトランスフォーマーモデルであるSegmenterを紹介します。
最近のViT(Vision Transformer)上に構築し,セマンティックセグメンテーションに拡張する。
これは、挑戦的なADE20Kデータセット上でのアートの状態を上回り、Pascal ContextとCityscapesでオンパーを実行する。
論文 参考訳(メタデータ) (2021-05-12T13:01:44Z) - Boundary-Aware Segmentation Network for Mobile and Web Applications [60.815545591314915]
境界認識ネットワーク(basnet)は、精度の高い画像分割のための予測再定義アーキテクチャとハイブリッド損失と統合されている。
basnetは単一のgpu上で70fps以上動作し、多くの潜在的なアプリケーションが利用できる。
BASNetをベースに、BASNetが「COPY」と「PASTING」現実世界のオブジェクトのための拡張現実であるAR COPY & PASTEと、オブジェクト背景の自動削除のためのWebベースのツールであるOBJECT CUTの2つの(近い)商用アプリケーションをさらに開発しました。
論文 参考訳(メタデータ) (2021-01-12T19:20:26Z) - Image segmentation via Cellular Automata [58.86475603234583]
我々は高解像度画像のセグメンテーションを成功させるセルオートマトンを設計し、訓練する。
私たちの最小のオートマトンは、複雑なセグメンテーションタスクを解決するために1万以下のパラメータを使用します。
論文 参考訳(メタデータ) (2020-08-11T19:04:09Z) - CRNet: Cross-Reference Networks for Few-Shot Segmentation [59.85183776573642]
少ないショットセグメンテーションは、少数のトレーニングイメージを持つ新しいクラスに一般化できるセグメンテーションモデルを学ぶことを目的としている。
相互参照機構により、我々のネットワークは2つの画像に共起する物体をよりよく見つけることができる。
PASCAL VOC 2012データセットの実験は、我々のネットワークが最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2020-03-24T04:55:43Z) - Learning Fast and Robust Target Models for Video Object Segmentation [83.3382606349118]
ビデオオブジェクトセグメンテーション(VOS)は、ターゲットオブジェクトを定義する初期マスクがテスト時にのみ与えられるため、非常に難しい問題である。
それまでのほとんどの場合、第1フレーム上のファイン・チューン・セグメンテーション・ネットワークにアプローチし、非現実的なフレームレートとオーバーフィッティングのリスクをもたらす。
本稿では,2つのネットワークコンポーネントからなる新しいVOSアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T21:58:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。