論文の概要: Dataset and Benchmarking of Real-Time Embedded Object Detection for
RoboCup SSL
- arxiv url: http://arxiv.org/abs/2106.14597v1
- Date: Mon, 28 Jun 2021 12:09:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 17:49:43.408806
- Title: Dataset and Benchmarking of Real-Time Embedded Object Detection for
RoboCup SSL
- Title(参考訳): RoboCup SSLにおけるリアルタイム埋め込みオブジェクト検出のデータセットとベンチマーク
- Authors: Roberto Fernandes, Walber M. Rodrigues, Edna Barros
- Abstract要約: 本稿では,SSL(Small Size League)におけるリアルタイムオブジェクト検出のベンチマークとして使用するオープンソースデータセットを提案する。
このデータセットでは、MobileNet SSD v1 は SSL ロボット上で実行中に 94 Frames Per Second (FPS) で 44.88% AP50 (68.81% AP50) を達成する。
- 参考スコア(独自算出の注目度): 0.14337588659482517
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: When producing a model to object detection in a specific context, the first
obstacle is to have a dataset labeling the desired classes. In RoboCup, some
leagues already have more than one dataset to train and evaluate a model.
However, in the Small Size League (SSL), there is not such dataset available
yet. This paper presents an open-source dataset to be used as a benchmark for
real-time object detection in SSL. This work also presented a pipeline to
train, deploy, and evaluate Convolutional Neural Networks (CNNs) models in a
low-power embedded system. This pipeline was used to evaluate the proposed
dataset with state-of-art optimized models. In this dataset, the MobileNet SSD
v1 achieves 44.88% AP (68.81% AP50) at 94 Frames Per Second (FPS) while running
on an SSL robot.
- Abstract(参考訳): 特定のコンテキストでオブジェクト検出にモデルを生成する場合、第一の障害は、望ましいクラスをラベル付けしたデータセットを持つことである。
RoboCupでは、モデルのトレーニングと評価のために複数のデータセットをすでに持っているリーグもある。
しかし、Small Size League(SSL)では、そのようなデータセットはまだ利用できない。
本稿では,SSLにおけるリアルタイムオブジェクト検出のベンチマークとして使用するオープンソースデータセットを提案する。
この研究は、低消費電力組み込みシステムで畳み込みニューラルネットワーク(CNN)モデルをトレーニング、デプロイ、評価するためのパイプラインも提示した。
このパイプラインは、提案されたデータセットを最先端の最適化モデルで評価するために使用された。
このデータセットでは、MobileNet SSD v1 は SSL ロボット上で実行中に 94 Frames Per Second (FPS) で 44.88% AP50 (68.81% AP50) を達成する。
関連論文リスト
- Transfer Learning with Point Transformers [3.678615604632945]
Point Transformerは、Point Cloudデータの分類、セグメンテーション、検出のための最先端モデルである。
モデルNet10データセットに基づくこれらの注目ネットワークの分類性能について検討し、3次元MNISTデータセットを微調整後に分類するためにトレーニングされたモデルを用いた。
論文 参考訳(メタデータ) (2024-04-01T01:23:58Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - LoRCoN-LO: Long-term Recurrent Convolutional Network-based LiDAR
Odometry [4.867395633094515]
そこで我々はLoRCoN-LOと呼ばれる深層学習に基づくLiDAR計測手法を提案する。
LRCN層は、CNN層とLSTM層の両方を用いて、空間情報と時間情報を同時に処理できる構造である。
論文 参考訳(メタデータ) (2023-03-21T13:52:00Z) - Supervised Virtual-to-Real Domain Adaptation for Object Detection Task
using YOLO [0.0]
十分に注釈付けされたデータセットは、ディープニューラルネットワークの精度に影響を与える。
コンピュータ生成データや仮想データセットは、これを克服するために使用される。
5000と10000の仮想データと220の実データを用いて,VW-PPEデータセットを使用する。
論文 参考訳(メタデータ) (2023-02-27T15:36:14Z) - Data Selection for Language Models via Importance Resampling [90.9263039747723]
我々は、望まれるターゲット分布に合わせるために、大規模な未ラベルデータセットのサブセットを選択するという問題を形式化する。
我々は、LMデータ選択のために低次元で使用される古典的な重要度再サンプリング手法を拡張した。
DSIRフレームワークをhash n-gram機能でインスタンス化し、4.5時間で1億のドキュメントを選択できる。
論文 参考訳(メタデータ) (2023-02-06T23:57:56Z) - DATA: Domain-Aware and Task-Aware Pre-training [94.62676913928831]
我々は、自己教師付き学習(SSL)に特化した、シンプルで効果的なNASアプローチであるDataを提示する。
提案手法は,画像分類,オブジェクト検出,セマンティックセグメンテーションなど,下流タスクにおける計算コストの広い範囲にわたる有望な結果を実現する。
論文 参考訳(メタデータ) (2022-03-17T02:38:49Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - A data-set of piercing needle through deformable objects for Deep
Learning from Demonstrations [0.21096737598952847]
本稿では,ダ・ヴィンチ・リサーチ・キットの2本の腕で針を挿入/ピアスするデータセットについて述べる。
我々は、単純なフィードフォワードCNNと異なるリカレント畳み込みネットワーク(RCN)を含む、いくつかの深いRLfDアーキテクチャを実装している。
本研究は、ベースラインフィードフォワードCNNが、ロボットの視覚情報と次のステップ制御動作の関係をうまく学習しているにもかかわらず、RCNがモデルの予測精度を向上させることを示唆している。
論文 参考訳(メタデータ) (2020-12-04T08:27:06Z) - Neural Data Server: A Large-Scale Search Engine for Transfer Learning
Data [78.74367441804183]
我々は,ターゲットドメインに最も有用な転送学習データを見つけるための大規模検索エンジンであるNeural Data Server (NDS)を紹介した。
NDSは、いくつかの人気のある画像データセットをインデックスするデータサーバで構成され、クライアントにデータを推奨することを目的としている。
我々は,NDSが様々な伝達学習シナリオにおいて有効であることを示し,複数のターゲットデータセットに対して最先端の性能を示す。
論文 参考訳(メタデータ) (2020-01-09T01:21:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。