論文の概要: Automatic Generation of Machine Learning Synthetic Data Using ROS
- arxiv url: http://arxiv.org/abs/2106.04547v1
- Date: Tue, 8 Jun 2021 17:30:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-09 18:15:52.221060
- Title: Automatic Generation of Machine Learning Synthetic Data Using ROS
- Title(参考訳): ROSを用いた機械学習合成データの自動生成
- Authors: Kyle M. Hart (1), Ari B. Goodman (1), Ryan P. O'Shea (1) ((1) Naval
Air Warfare Center - Aircraft Division - Lakehurst)
- Abstract要約: 本稿では,任意のネットワークフォーマットで合成データを生成する自動ツールを提案する。
ロボット・オペレーティング・システム(ROS)とガゼボ(Gazebo)はロボティクス・コミュニティで一般的なツールである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Data labeling is a time intensive process. As such, many data scientists use
various tools to aid in the data generation and labeling process. While these
tools help automate labeling, many still require user interaction throughout
the process. Additionally, most target only a few network frameworks. Any
researchers exploring multiple frameworks must find additional tools orwrite
conversion scripts. This paper presents an automated tool for generating
synthetic data in arbitrary network formats. It uses Robot Operating System
(ROS) and Gazebo, which are common tools in the robotics community. Through ROS
paradigms, it allows extensive user customization of the simulation environment
and data generation process. Additionally, a plugin-like framework allows the
development of arbitrary data format writers without the need to change the
main body of code. Using this tool, the authors were able to generate an
arbitrarily large image dataset for three unique training formats using
approximately 15 min of user setup time and a variable amount of hands-off run
time, depending on the dataset size. The source code for this data generation
tool is available at https://github.com/Navy-RISE-Lab/nn_data_collection
- Abstract(参考訳): データラベリングは時間を要するプロセスです。
そのため、多くのデータサイエンティストはデータ生成とラベル付けのプロセスを支援する様々なツールを使っている。
これらのツールはラベルの自動化に役立つが、その多くはプロセス全体を通してユーザーインタラクションを必要とする。
さらに、ほとんどのターゲットはネットワークフレームワークのみである。
複数のフレームワークを探索する研究者は、追加のツールや変換スクリプトを見つける必要がある。
本稿では任意のネットワークフォーマットで合成データを生成する自動化ツールを提案する。
ロボット・オペレーティング・システム(ROS)とガゼボ(Gazebo)はロボットコミュニティで一般的なツールである。
rosパラダイムを通じて、シミュレーション環境とデータ生成プロセスの広範なユーザカスタマイズが可能になる。
さらに、プラグインのようなフレームワークは、コード本体を変更することなく、任意のデータフォーマットライタの開発を可能にする。
このツールを使用して、著者らは、データセットのサイズに応じて、約15分間のユーザ設定時間とさまざまなハンドオフ実行時間を使用して、3つのユニークなトレーニングフォーマット用の任意のサイズのイメージデータセットを生成することができた。
このデータ生成ツールのソースコードはhttps://github.com/navy-rise-lab/nn_data_collectionで入手できる。
関連論文リスト
- Cuvis.Ai: An Open-Source, Low-Code Software Ecosystem for Hyperspectral Processing and Classification [0.4038539043067986]
cuvis.aiは、データ取得、前処理、モデルトレーニングのためのオープンソースでローコードなソフトウェアエコシステムである。
パッケージはPythonで書かれており、一般的な機械学習ライブラリのラッパーを提供する。
論文 参考訳(メタデータ) (2024-11-18T06:33:40Z) - ARKit LabelMaker: A New Scale for Indoor 3D Scene Understanding [51.509115746992165]
我々はARKit LabelMakerを紹介した。これは、密集したセマンティックアノテーションを備えた、最初の大規模で現実世界の3Dデータセットである。
また,3次元セマンティックセグメンテーションモデルを用いて,ScanNetおよびScanNet200データセットの最先端性能を推し進める。
論文 参考訳(メタデータ) (2024-10-17T14:44:35Z) - forester: A Tree-Based AutoML Tool in R [0.0]
ForesterはオープンソースのAutoMLパッケージで、Rで実装され、高品質なツリーベースのモデルをトレーニングする。
バイナリとマルチクラスの分類、回帰、部分生存分析タスクを完全にサポートする。
データ品質に関する問題を検出し、前処理パイプラインを準備し、ツリーベースのモデルのトレーニングとチューニングを行い、結果を評価し、さらなる分析のためにレポートを作成することができる。
論文 参考訳(メタデータ) (2024-09-07T10:39:10Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - Meta-Transformer: A Unified Framework for Multimodal Learning [105.77219833997962]
マルチモーダル学習は、複数のモーダルからの情報を処理し、関連付けるモデルを構築することを目的としている。
この分野での長年の開発にもかかわらず、様々なモダリティを処理する統一ネットワークを設計することは依然として困難である。
我々は、textbffrozen$ encoderを利用してマルチモーダル認識を行うMeta-Transformerというフレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-20T12:10:29Z) - TSGM: A Flexible Framework for Generative Modeling of Synthetic Time Series [61.436361263605114]
時系列データは、研究者と産業組織間のデータの共有を妨げるため、しばしば不足または非常に敏感である。
本稿では,合成時系列の生成モデリングのためのオープンソースフレームワークである時系列生成モデリング(TSGM)を紹介する。
論文 参考訳(メタデータ) (2023-05-19T10:11:21Z) - DeepVATS: Deep Visual Analytics for Time Series [7.822594828788055]
私たちは、Deep Visual Analyticsの分野を時系列データにもたらすオープンソースのツールであるDeepVATSを紹介します。
DeepVATSは、自己監督的な方法で、時系列のパッチを再構築するマスク付き時系列自動エンコーダを訓練する。
本稿では,DeepVATSの有効性を検証する結果について報告する。
論文 参考訳(メタデータ) (2023-02-08T03:26:50Z) - Learn Fast, Segment Well: Fast Object Segmentation Learning on the iCub
Robot [20.813028212068424]
我々は、新しいオブジェクトや異なるドメインの存在下で、オブジェクトセグメンテーションモデルに適応できる様々な技術について研究する。
データをストリーム化するロボットアプリケーションのための高速なインスタンスセグメンテーション学習のためのパイプラインを提案する。
提案したパイプラインを2つのデータセットでベンチマークし、実際のロボットであるiCubヒューマノイドにデプロイする。
論文 参考訳(メタデータ) (2022-06-27T17:14:04Z) - Kubric: A scalable dataset generator [73.78485189435729]
KubricはPythonフレームワークで、PyBulletやBlenderとインターフェースして写真リアリスティックなシーンを生成する。
本研究では,3次元NeRFモデルの研究から光フロー推定まで,13種類の異なるデータセットを提示することで,Kubricの有効性を実証する。
論文 参考訳(メタデータ) (2022-03-07T18:13:59Z) - Mill.jl and JsonGrinder.jl: automated differentiable feature extraction
for learning from raw JSON data [0.0]
生のデータ入力から学ぶことは、機械学習の手法を成功させるために重要な要素の1つである。
生のデータ入力から学ぶことは、機械学習の手法を成功させるために重要な要素の1つである。
論文 参考訳(メタデータ) (2021-05-19T13:02:10Z) - Scaling Systematic Literature Reviews with Machine Learning Pipelines [57.82662094602138]
体系的なレビューは、科学的文書からデータを抽出する。
これらの側面をそれぞれ自動化するパイプラインを構築し、多くの人間時間対システム品質トレードオフを実験します。
人間の専門的アノテーションの2週間だけで、パイプラインシステム全体の驚くほどの精度と一般性が得られることが分かりました。
論文 参考訳(メタデータ) (2020-10-09T16:19:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。