論文の概要: AI Playground: Unreal Engine-based Data Ablation Tool for Deep Learning
- arxiv url: http://arxiv.org/abs/2007.06153v1
- Date: Mon, 13 Jul 2020 02:04:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-10 23:13:57.381680
- Title: AI Playground: Unreal Engine-based Data Ablation Tool for Deep Learning
- Title(参考訳): ai playground: ディープラーニングのためのunreal engineベースのデータアブレーションツール
- Authors: Mehdi Mousavi, Aashis Khanal, Rolando Estrada
- Abstract要約: 機械学習はデータを必要とするが、実際のデータの取得とラベル付けは困難であり、高価であり、時間を要する。
仮想画像データの生成とラベル付けを行うオープンソースUnreal EngineベースのツールであるAI Playground(AIP)を紹介する。
私たちはディープニューラルネットワークをトレーニングし、深さ値、表面正規値、またはオブジェクトラベルを予測し、各ネットワークのイントラおよびクロスデータセットのパフォーマンスを評価しました。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning requires data, but acquiring and labeling real-world data is
challenging, expensive, and time-consuming. More importantly, it is nearly
impossible to alter real data post-acquisition (e.g., change the illumination
of a room), making it very difficult to measure how specific properties of the
data affect performance. In this paper, we present AI Playground (AIP), an
open-source, Unreal Engine-based tool for generating and labeling virtual image
data. With AIP, it is trivial to capture the same image under different
conditions (e.g., fidelity, lighting, etc.) and with different ground truths
(e.g., depth or surface normal values). AIP is easily extendable and can be
used with or without code. To validate our proposed tool, we generated eight
datasets of otherwise identical but varying lighting and fidelity conditions.
We then trained deep neural networks to predict (1) depth values, (2) surface
normals, or (3) object labels and assessed each network's intra- and
cross-dataset performance. Among other insights, we verified that sensitivity
to different settings is problem-dependent. We confirmed the findings of other
studies that segmentation models are very sensitive to fidelity, but we also
found that they are just as sensitive to lighting. In contrast, depth and
normal estimation models seem to be less sensitive to fidelity or lighting and
more sensitive to the structure of the image. Finally, we tested our trained
depth-estimation networks on two real-world datasets and obtained results
comparable to training on real data alone, confirming that our virtual
environments are realistic enough for real-world tasks.
- Abstract(参考訳): 機械学習はデータを必要とするが、実際のデータの取得とラベル付けは難しく、高価で、時間がかかる。
さらに重要なことは、実際のデータ取得後の変更(例えば、部屋の照明の変更)はほとんど不可能であり、データの特定の特性がパフォーマンスにどのように影響するかを測定することは非常に困難である。
本稿では,仮想画像データの生成とラベル付けを行うオープンソースUnreal EngineベースのツールであるAI Playground(AIP)を提案する。
aipでは、異なる条件(例えば、忠実度、照明など)と異なる基底真理(例えば、深さまたは表面の正常値)で同じ画像をキャプチャすることは自明である。
AIPは容易に拡張可能で、コードの有無に関わらず使用することができる。
提案するツールを検証するために,異なる照明条件と忠実度条件の8つのデータセットを作成した。
次に深部ニューラルネットワークをトレーニングし,(1)深度値,(2)表面正規値,(3)オブジェクトラベルの予測を行い,各ネットワークのイントラおよびクロスデータセットのパフォーマンスを評価した。
その他の洞察として,異なる設定に対する感受性が問題依存であることを確認した。
セグメンテーションモデルが忠実性に非常に敏感であるという他の研究の結果を確認したが、照明にも感受性があることも判明した。
対照的に、深さと通常の推定モデルは、忠実さや照明に対する感度が低く、画像の構造に敏感であるように見える。
最後に、2つの実世界のデータセット上でトレーニングされた奥行き推定ネットワークをテストし、実データだけでのトレーニングに匹敵する結果を得た。
関連論文リスト
- Object Detector Differences when using Synthetic and Real Training Data [0.0]
都市環境からの実画像と合成画像に基づいてYOLOv3オブジェクト検出器を訓練する。
本研究では,CKA(Centered Kernel Alignment)を用いた類似性解析を行い,合成データに対する学習効果について検討する。
その結果、実データで訓練された検出器と合成データで訓練された検出器との最大の類似性は初期の層にあり、最も大きな違いは頭部にあることがわかった。
論文 参考訳(メタデータ) (2023-12-01T16:27:48Z) - A New Benchmark: On the Utility of Synthetic Data with Blender for Bare
Supervised Learning and Downstream Domain Adaptation [42.2398858786125]
コンピュータビジョンにおけるディープラーニングは、大規模ラベル付きトレーニングデータの価格で大きな成功を収めた。
制御不能なデータ収集プロセスは、望ましくない重複が存在する可能性のある非IIDトレーニングおよびテストデータを生成する。
これを回避するために、ドメインランダム化による3Dレンダリングによる合成データを生成する方法がある。
論文 参考訳(メタデータ) (2023-03-16T09:03:52Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Learning to Simulate Realistic LiDARs [66.7519667383175]
リアルLiDARセンサのデータ駆動シミュレーションのためのパイプラインを提案する。
本モデルでは, 透明表面上の落下点などの現実的な効果を符号化できることが示される。
我々は2つの異なるLiDARセンサのモデルを学習し、それに従ってシミュレーションされたLiDARデータを改善する。
論文 参考訳(メタデータ) (2022-09-22T13:12:54Z) - Towards Scale Consistent Monocular Visual Odometry by Learning from the
Virtual World [83.36195426897768]
仮想データから絶対スケールを取得するための新しいフレームワークであるVRVOを提案する。
まず、モノクロ実画像とステレオ仮想データの両方を用いて、スケール対応の異種ネットワークをトレーニングする。
結果として生じるスケール一貫性の相違は、直接VOシステムと統合される。
論文 参考訳(メタデータ) (2022-03-11T01:51:54Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z) - Learning to simulate complex scenes [18.51564016785853]
本稿では,意味的セグメンテーションの文脈におけるコンテンツ適応について考察する。
本稿では、属性値の最適化と、実世界のデータと類似したコンテンツのトレーニングセットを得るために、スケーラブルな離散化・緩和(SDR)アプローチを提案する。
実験により,本システムは合理的かつ有用なシーンを生成でき,そこから有望な実世界のセグメンテーション精度を得ることができた。
論文 参考訳(メタデータ) (2020-06-25T17:51:34Z) - Syn2Real Transfer Learning for Image Deraining using Gaussian Processes [92.15895515035795]
CNNに基づく画像デライニング手法は,再現誤差や視覚的品質の点で優れた性能を発揮している。
実世界の完全ラベル付き画像デライニングデータセットを取得する上での課題により、既存の手法は合成されたデータのみに基づいて訓練される。
本稿では,ガウス過程に基づく半教師付き学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-10T00:33:18Z) - Exploring the Capabilities and Limits of 3D Monocular Object Detection
-- A Study on Simulation and Real World Data [0.0]
単眼カメラデータに基づく3次元物体検出が自動運転の鍵となる。
近年のディープラーニング手法は, 単一の画像から深度情報を復元する有望な結果を示す。
本稿では,深度推定の異なるパラメータ化が可能な3次元物体検出パイプラインの性能評価を行う。
論文 参考訳(メタデータ) (2020-05-15T09:05:17Z) - Virtual to Real adaptation of Pedestrian Detectors [9.432150710329607]
ViPeDは、ビデオゲームGTA V - Grand Theft Auto Vのグラフィカルエンジンで収集された新しい合成画像セットである。
本稿では,歩行者検出作業に適した2つの異なる領域適応手法を提案する。
実験によると、ViPeDでトレーニングされたネットワークは、実世界のデータでトレーニングされた検出器よりも、目に見えない現実世界のシナリオを一般化できる。
論文 参考訳(メタデータ) (2020-01-09T14:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。