論文の概要: Pallet Detection And Localisation From Synthetic Data
- arxiv url: http://arxiv.org/abs/2503.22965v1
- Date: Sat, 29 Mar 2025 04:06:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-01 14:36:11.033513
- Title: Pallet Detection And Localisation From Synthetic Data
- Title(参考訳): 合成データによるパレット検出と位置推定
- Authors: Henri Mueller, Yechan Kim, Trevor Gee, Mahla Nejati,
- Abstract要約: 本稿では, 純粋合成データと, 側面から得られる幾何学的特徴を用いて, パレットの検出と位置推定を強化する新しい手法を提案する。
提案手法は,現実世界のデータセット上で単一パレットに対して0.995 mAP50のパレット検出性能を示す。
- 参考スコア(独自算出の注目度): 2.7811470090754544
- License:
- Abstract: The global warehousing industry is experiencing rapid growth, with the market size projected to grow at an annual rate of 8.1% from 2024 to 2030 [Grand View Research, 2021]. This expansion has led to a surge in demand for efficient pallet detection and localisation systems. While automation can significantly streamline warehouse operations, the development of such systems often requires extensive manual data annotation, with an average of 35 seconds per image, for a typical computer vision project. This paper presents a novel approach to enhance pallet detection and localisation using purely synthetic data and geometric features derived from their side faces. By implementing a domain randomisation engine in Unity, the need for time-consuming manual annotation is eliminated while achieving high-performance results. The proposed method demonstrates a pallet detection performance of 0.995 mAP50 for single pallets on a real-world dataset. Additionally, an average position accuracy of less than 4.2 cm and an average rotation accuracy of 8.2{\deg} were achieved for pallets within a 5-meter range, with the pallet positioned head-on.
- Abstract(参考訳): 世界の倉庫業界は急速に成長しており、市場規模は2024年から2030年にかけて毎年8.1%の成長が見込まれている(グランドビューリサーチ、2021年)。
この拡張により、効率的なパレット検出とローカライゼーションシステムへの需要が急増した。
自動化は倉庫の業務を大幅に効率化するが、典型的なコンピュータビジョンプロジェクトでは、こうしたシステムの開発には、画像あたり平均35秒の広範な手動データアノテーションが必要であることが多い。
本稿では, 純粋合成データと, 側面から得られる幾何学的特徴を用いて, パレットの検出と位置推定を強化する新しい手法を提案する。
ドメインランダム化エンジンをUnityに実装することにより、高性能な結果を実現しつつ、時間を要する手動アノテーションの必要性を解消する。
提案手法は,現実世界のデータセット上で単一パレットに対して0.995 mAP50のパレット検出性能を示す。
さらに, 平均位置精度が4.2cm未満で, 平均回転精度が8.2{\deg} で, パレット位置が5mの範囲内であった。
関連論文リスト
- Graph Transformers for Large Graphs [57.19338459218758]
この研究は、モデルの特徴と重要な設計制約を識別することに焦点を当てた、単一の大規模グラフでの表現学習を前進させる。
この研究の重要な革新は、局所的な注意機構と組み合わされた高速な近傍サンプリング技術の作成である。
ogbn-products と snap-patents の3倍の高速化と16.8%の性能向上を報告し、ogbn-100M で LargeGT を5.9% の性能改善で拡張した。
論文 参考訳(メタデータ) (2023-12-18T11:19:23Z) - View Consistent Purification for Accurate Cross-View Localization [59.48131378244399]
本稿では,屋外ロボットのための微細な自己局在化手法を提案する。
提案手法は,既存のクロスビューローカライゼーション手法の限界に対処する。
これは、動的環境における知覚を増強する初めての疎視のみの手法である。
論文 参考訳(メタデータ) (2023-08-16T02:51:52Z) - Pallet Detection from Synthetic Data Using Game Engines [0.0]
本研究は, ゲームエンジンを用いて, パレットセグメンテーションの文脈において, 機械学習のための合成トレーニングデータを生成することの実現可能性を評価することを目的とする。
我々は,3次元モデルから大量の注釈付きトレーニングデータを画素完全精度で自動生成できるツールを開発した。
論文 参考訳(メタデータ) (2023-04-07T11:54:40Z) - LaMAR: Benchmarking Localization and Mapping for Augmented Reality [80.23361950062302]
異種ARデバイスでキャプチャされたリアルな軌跡とセンサストリームを共登録する,包括的キャプチャとGTパイプラインを備えた新しいベンチマークであるLaMARを紹介する。
私たちは、ヘッドマウントとハンドヘルドARデバイスで記録された多様な大規模シーンのベンチマークデータセットを公開します。
論文 参考訳(メタデータ) (2022-10-19T17:58:17Z) - Real Time On Sensor Gait Phase Detection with 0.5KB Deep Learning Model [2.79329087573672]
畳み込みニューラルネットワークによる歩行位相検出は正確な分類を提供するが、高い計算コストを必要とする。
本稿では、0.5KBのモデルサイズと毎秒67Kの操作しか必要とせず、95.9%の精度で、幅と深さを縮小したU-Netのようなモデルでセグメント化に基づく歩行位相検出を行う。
論文 参考訳(メタデータ) (2022-05-02T09:59:56Z) - Deep Learning for Real Time Satellite Pose Estimation on Low Power Edge
TPU [58.720142291102135]
本稿では,ニューラルネットワークアーキテクチャを利用したポーズ推定ソフトウェアを提案する。
我々は、低消費電力の機械学習アクセラレーターが宇宙での人工知能の活用を可能にしていることを示す。
論文 参考訳(メタデータ) (2022-04-07T08:53:18Z) - 6D Pose Estimation with Combined Deep Learning and 3D Vision Techniques
for a Fast and Accurate Object Grasping [0.19686770963118383]
リアルタイムロボットの把握は高度な自律システムにとって最優先の目標である。
本稿では,ディープニューラルネットワークを用いた高速な2次元物体認識を組み合わせた2段階手法を提案する。
提案手法は、効率と精度の両方を必要とせず、リアルタイムアプリケーションで堅牢に動作する可能性がある。
論文 参考訳(メタデータ) (2021-11-11T15:36:55Z) - Small Object Detection Based on Modified FSSD and Model Compression [7.387639662781843]
本稿では,FSSDに基づく小型物体検出アルゴリズムを提案する。
計算コストと記憶空間を削減するため, モデル圧縮を実現するためにプルーニングを行う。
アルゴリズムの平均精度(mAP)は、PASCAL VOCで80.4%、GTX1080tiで59.5 FPSに達する。
論文 参考訳(メタデータ) (2021-08-24T03:20:32Z) - Estimating Crop Primary Productivity with Sentinel-2 and Landsat 8 using
Machine Learning Methods Trained with Radiative Transfer Simulations [58.17039841385472]
我々は,機械モデリングと衛星データ利用の並列化を活用し,作物生産性の高度モニタリングを行う。
本モデルでは, 地域情報を使用しなくても, 各種C3作物の種類, 環境条件の総合的生産性を推定することに成功した。
これは、現在の地球観測クラウドコンピューティングプラットフォームの助けを借りて、新しい衛星センサーから作物の生産性をグローバルにマップする可能性を強調しています。
論文 参考訳(メタデータ) (2020-12-07T16:23:13Z) - DeepMark++: Real-time Clothing Detection at the Edge [55.41644538483948]
本稿では,迅速な衣服検出とキーポイント推定を実現するための単一ステージアプローチを提案する。
提案手法は,マルチターゲットネットワークであるCenterNetをベースとして,性能向上のためのポストプロセッシング技術をいくつか導入する。
私たちの最も正確なモデルは、DeepFashion2データセットの最先端ソリューションに匹敵する結果を達成します。
論文 参考訳(メタデータ) (2020-06-01T04:36:57Z) - Localising Faster: Efficient and precise lidar-based robot localisation
in large-scale environments [27.53080210457653]
本稿では,大規模環境における移動ロボットのグローバルなローカライズのための新しいアプローチを提案する。
本手法は,学習に基づくローカライゼーションとフィルタリングに基づくローカライゼーションを活用し,ロボットのローカライズを効率的かつ正確に行う。
提案手法は,約0.5km2の大規模環境下で,平均1.94秒(0.8秒)で精度0.75mの精度でロボットをローカライズできることを示す。
論文 参考訳(メタデータ) (2020-03-04T03:39:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。