論文の概要: Improving Pallet Detection Using Synthetic Data
- arxiv url: http://arxiv.org/abs/2402.07098v1
- Date: Sun, 11 Feb 2024 03:54:44 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 17:29:45.629059
- Title: Improving Pallet Detection Using Synthetic Data
- Title(参考訳): 合成データを用いたパレット検出の改善
- Authors: Henry Gann, Josiah Bull, Trevor Gee, Mahla Nejati
- Abstract要約: 機械学習における合成データの利用は、効果的なオブジェクト検出器を実装する際にかなりの時間を節約する。
本研究では、合成されたドメインランダム化データと、Unityで生成されたデータを用いてこれを実現することを提案する。
ドメインランダム化データの使用は、Unity生成データと比較すると、無視できるパフォーマンス改善であった。
- 参考スコア(独自算出の注目度): 0.36868085124383626
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The use of synthetic data in machine learning saves a significant amount of
time when implementing an effective object detector. However, there is limited
research in this domain. This study aims to improve upon previously applied
implementations in the task of instance segmentation of pallets in a warehouse
environment. This study proposes using synthetically generated
domain-randomised data as well as data generated through Unity to achieve this.
This study achieved performance improvements on the stacked and racked pallet
categories by 69% and 50% mAP50, respectively when being evaluated on real
data. Additionally, it was found that there was a considerable impact on the
performance of a model when it was evaluated against images in a darker
environment, dropping as low as 3% mAP50 when being evaluated on images with an
80% brightness reduction. This study also created a two-stage detector that
used YOLOv8 and SAM, but this proved to have unstable performance. The use of
domain-randomised data proved to have negligible performance improvements when
compared to the Unity-generated data.
- Abstract(参考訳): 機械学習における合成データの使用は、効果的なオブジェクト検出器を実装する際にかなりの時間を節約する。
しかし、この分野の研究は限られている。
本研究は,倉庫環境におけるパレットのインスタンスセグメンテーションのタスクにおいて,これまで適用されてきた実装を改善することを目的とする。
本研究では、合成生成したドメインランダム化データと、unityによって生成されたデータを用いてこれを実現する。
本研究は, 実データを用いた評価において, 積層パレットとラックパレットのカテゴリを69%, 50%mAP50で性能改善した。
また,暗い環境での画像に対して評価した場合のモデルの性能にかなりの影響があり,80%の輝度低減で画像上で評価した場合,3%のmap50まで低下することが判明した。
この研究では、YOLOv8とSAMを用いた2段検出器も作成したが、不安定な性能を示した。
ドメインランダム化データの使用は、Unity生成データと比較すると、無視できるパフォーマンス改善であった。
関連論文リスト
- Handling Geometric Domain Shifts in Semantic Segmentation of Surgical RGB and Hyperspectral Images [67.66644395272075]
本稿では,幾何学的アウト・オブ・ディストリビューションデータに直面する場合の,最先端のセマンティックセマンティックセマンティクスモデルの最初の解析を行う。
本稿では, 汎用性を高めるために, 有機移植(Organ Transplantation)と呼ばれる拡張技術を提案する。
我々の拡張技術は、RGBデータに対して最大67%、HSIデータに対して90%のSOAモデル性能を改善し、実際のOODテストデータに対して、分配内パフォーマンスのレベルでのパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-08-27T19:13:15Z) - Accelerating Domain-Aware Electron Microscopy Analysis Using Deep Learning Models with Synthetic Data and Image-Wide Confidence Scoring [0.0]
我々は物理に基づく合成画像とデータ生成装置を作成し、その結果、同等の精度(0.86)、リコール(0.63)、F1スコア(0.71)、エンジニアリング特性予測(R2=0.82)を実現する機械学習モデルを得た。
本研究は,合成データがMLの人間依存を排除し,画像毎に多くの特徴を検出する必要がある場合に,ドメイン認識の手段を提供することを示す。
論文 参考訳(メタデータ) (2024-08-02T20:15:15Z) - Comparing Importance Sampling Based Methods for Mitigating the Effect of
Class Imbalance [0.0]
我々は,損失再加重,アンダーサンプリング,オーバーサンプリングという,重要なサンプリングから導かれる3つのテクニックを比較した。
アンダーサンプリングにおける損失の重み付けは、アンダー表現されたクラスの性能に悪影響を及ぼすことがわかった。
我々の発見は、プラネタリーデータセットに何らかの冗長性が存在することも示唆している。
論文 参考訳(メタデータ) (2024-02-28T22:52:27Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Feedback-guided Data Synthesis for Imbalanced Classification [10.836265321046561]
有用な合成サンプルを用いて静的データセットを拡張するためのフレームワークを提案する。
サンプルはタスクの実際のデータのサポートに近づき、十分に多様であることに気付きました。
ImageNet-LTでは、表現不足のクラスでは4%以上改善され、最先端の結果が得られます。
論文 参考訳(メタデータ) (2023-09-29T21:47:57Z) - Memory-Efficient Graph Convolutional Networks for Object Classification
and Detection with Event Cameras [2.3311605203774395]
グラフ畳み込みネットワーク(GCN)は、イベントデータを解析するための有望なアプローチである。
本稿では,満足度の高い結果と比較的低いモデル複雑性を達成するために,両要因を共に検討する。
その結果,特徴抽出モジュールのパラメータ数を450倍に減らし,データ表現のサイズを4.5倍に減らした。
論文 参考訳(メタデータ) (2023-07-26T11:44:44Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - Boosting Facial Expression Recognition by A Semi-Supervised Progressive
Teacher [54.50747989860957]
本稿では,信頼度の高いFERデータセットと大規模未ラベル表現画像を有効訓練に用いるための半教師付き学習アルゴリズム,Progressive Teacher (PT)を提案する。
RAF-DB と FERPlus を用いた実験により,RAF-DB で89.57% の精度で最先端の性能を実現する手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-05-28T07:47:53Z) - DAPPER: Label-Free Performance Estimation after Personalization for
Heterogeneous Mobile Sensing [95.18236298557721]
DAPPER(Domain AdaPtation Performance EstimatoR)を提案する。
実世界の6つのベースラインと比較した4つのセンシングデータセットによる評価の結果,DAPPERの精度は39.8%向上した。
論文 参考訳(メタデータ) (2021-11-22T08:49:33Z) - Negative Data Augmentation [127.28042046152954]
負のデータ拡張サンプルは、データ分散のサポートに関する情報を提供することを示す。
我々は、NDAを識別器の合成データの追加源として利用する新しいGAN訓練目標を提案する。
実験により,本手法で訓練したモデルでは,異常検出能力の向上とともに条件付き・条件付き画像生成の改善を実現している。
論文 参考訳(メタデータ) (2021-02-09T20:28:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。