論文の概要: Using Keypoint Matching and Interactive Self Attention Network to verify
Retail POSMs
- arxiv url: http://arxiv.org/abs/2110.03646v1
- Date: Thu, 7 Oct 2021 17:37:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-08 16:00:09.208447
- Title: Using Keypoint Matching and Interactive Self Attention Network to verify
Retail POSMs
- Title(参考訳): キーポイントマッチングと対話型自己注意ネットワークを用いた小売posmの検証
- Authors: Harshita Seth, Sonaal Kant, Muktabh Mayank Srivastava
- Abstract要約: 本稿では,スーパーマーケットにおけるPOSMの検証作業にコンピュータビジョン技術を適用する。
我々は、畳み込みニューラルネットワークに基づく教師なしキーポイントマッチングをベースラインとして使用し、POSMコンポーネントを検証するとともに、ベースラインの精度を大きなマージンで向上させる教師付きニューラルネットワークに基づく手法を提案する。
- 参考スコア(独自算出の注目度): 1.933681537640272
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Point of Sale Materials(POSM) are the merchandising and decoration items that
are used by companies to communicate product information and offers in retail
stores. POSMs are part of companies' retail marketing strategy and are often
applied as stylized window displays around retail shelves. In this work, we
apply computer vision techniques to the task of verification of POSMs in
supermarkets by telling if all desired components of window display are present
in a shelf image. We use Convolutional Neural Network based unsupervised
keypoint matching as a baseline to verify POSM components and propose a
supervised Neural Network based method to enhance the accuracy of baseline by a
large margin. We also show that the supervised pipeline is not restricted to
the POSM material it is trained on and can generalize. We train and evaluate
our model on a private dataset composed of retail shelf images.
- Abstract(参考訳): ポイント・オブ・セール(posm)は、企業が商品情報や商品を小売店舗で伝達するために使用する商品である。
POSMは企業の小売マーケティング戦略の一部であり、しばしば小売店周辺のスタイリングされたウィンドウディスプレイとして使われる。
本研究では,スーパーマーケットにおけるPOSMの検証作業にコンピュータビジョン技術を適用する。
本研究では,畳み込みニューラルネットワークを用いた非教師付きキーポイントマッチングをベースラインとして,posmコンポーネントの検証を行い,ベースラインの精度を大きなマージンで向上させる教師付きニューラルネットワークベースの手法を提案する。
また,教師付きパイプラインは訓練対象のposm素材に限定されず,一般化できることを示した。
我々は,小売棚画像からなるプライベートデータセット上でモデルをトレーニングし,評価する。
関連論文リスト
- Introducing Context Information in Lifelong Sequential Modeling using Temporal Convolutional Networks [4.561273938467592]
本稿では,TCN(Temporal Convolutional Network)を用いて,各項目のコンテキスト認識表現を生涯にわたって生成する新しいネットワークを提案する。
また、ユーザの基本プロファイル機能に基づいた畳み込みフィルタを作成するために、軽量なサブネットワークも組み込んだ。
その結果,提案するネットワークは,予測精度とオンラインパフォーマンス指標の観点から,既存の手法を超越していることがわかった。
論文 参考訳(メタデータ) (2025-02-18T08:24:53Z) - Cooperative Multi-Agent Reinforcement Learning for Inventory Management [0.5276232626689566]
在庫管理のための強化学習(RL)は、初期の研究分野である。
本稿では,1つの倉庫と複数の店舗からなる,GPU並列化された独自のシステムを提案する。
標準在庫管理ポリシーより優れたシステムを実現する。
論文 参考訳(メタデータ) (2023-04-18T06:55:59Z) - NeRF-SOS: Any-View Self-supervised Object Segmentation from Complex
Real-World Scenes [80.59831861186227]
本論文では,複雑な現実世界のシーンに対して,NeRFを用いたオブジェクトセグメンテーションのための自己教師型学習の探索を行う。
我々のフレームワークは、NeRF(NeRF with Self-supervised Object NeRF-SOS)と呼ばれ、NeRFモデルがコンパクトな幾何認識セグメンテーションクラスタを蒸留することを奨励している。
他の2Dベースの自己教師付きベースラインを一貫して上回り、既存の教師付きマスクよりも細かなセマンティクスマスクを予測する。
論文 参考訳(メタデータ) (2022-09-19T06:03:17Z) - Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product
Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。
まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。
我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文 参考訳(メタデータ) (2022-06-17T15:40:45Z) - Main Product Detection with Graph Networks for Fashion [44.09686303429833]
主要製品検出は、ビジョンベースのファッション製品フィード解析パイプラインの重要なステップである。
グラフ畳み込みネットワーク(GCN)を組み込んだモデルを提案する。
論文 参考訳(メタデータ) (2022-01-25T16:26:04Z) - Exploring Pixel-level Self-supervision for Weakly Supervised Semantic
Segmentation [22.607254782074325]
画像レベルの監督から画素レベルの自己監督を導出する新しい枠組みを提案する。
提案するRegional Contrastive Module(RCM)とMulti-scale Attentive Module(MAM)の助けを借りて,MainNetはSupportNetの自己監督によって訓練される。
提案手法は,PASCAL 2012データセット上での列車および検証セットにおける最先端性能を示す。
論文 参考訳(メタデータ) (2021-12-10T06:13:45Z) - Scalable Perception-Action-Communication Loops with Convolutional and
Graph Neural Networks [208.15591625749272]
視覚に基づくグラフアグリゲーション・アンド・推論(VGAI)を用いた知覚-行動-コミュニケーションループの設計を提案する。
我々のフレームワークは、畳み込みとグラフニューラルネットワーク(CNN/GNN)のカスケードによって実装され、エージェントレベルの視覚知覚と特徴学習に対処する。
我々は、VGAIが他の分散コントローラに匹敵する性能を得ることを示した。
論文 参考訳(メタデータ) (2021-06-24T23:57:21Z) - ARC: A Vision-based Automatic Retail Checkout System [0.0]
ARCは、小売店でのチェックアウトのプロセスを、より速く、自律的で、より便利にすることを目指している。
このアプローチでは、webカメラの下に置かれているオブジェクトをスキャンして識別する畳み込みニューラルネットワークを備えたコンピュータビジョンベースのシステムを使用する。
論文 参考訳(メタデータ) (2021-04-07T00:07:53Z) - Personal Fixations-Based Object Segmentation with Object Localization
and Boundary Preservation [60.41628937597989]
我々はPFOS(Personal Fixations-based Object)に着目し,過去の研究の課題に対処する。
視線オブジェクトをセグメント化するオブジェクトローカリゼーションと境界保存(OLBP)に基づく新しいネットワークを提案する。
OLBPは複数のタイプの深い監督の混合されたボトムアップおよびトップダウンの方法で整理されます。
論文 参考訳(メタデータ) (2021-01-22T09:20:47Z) - Fully-Automated Packaging Structure Recognition in Logistics
Environments [60.56493342808093]
包装構造認識の完全自動化手法を提案する。
我々のアルゴリズムは深層学習モデルに基づいており、より正確に畳み込みニューラルネットワークを用いて画像のセグメント化を行う。
テストケースの約85%でパッケージ構造を正しく認識することができ、さらに一般的なパッケージタイプに注目する場合(91%)にさらに多くのパッケージ構造を認識できることを示す。
論文 参考訳(メタデータ) (2020-08-11T10:57:23Z) - Self-Supervised Viewpoint Learning From Image Collections [116.56304441362994]
本稿では,解析・合成パラダイムを取り入れた新たな学習フレームワークを提案する。
提案手法は,人間の顔,車,バス,電車など,複数の対象カテゴリに対して,完全に教師されたアプローチに対して競争力を発揮することを示す。
論文 参考訳(メタデータ) (2020-04-03T22:01:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。