論文の概要: Domain Randomization for Object Counting
- arxiv url: http://arxiv.org/abs/2202.08670v1
- Date: Thu, 17 Feb 2022 14:07:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-18 19:27:22.042420
- Title: Domain Randomization for Object Counting
- Title(参考訳): オブジェクトカウントのためのドメインランダム化
- Authors: Enric Moreu, Kevin McGuinness, Diego Ortego, Noel E. O'Connor
- Abstract要約: 本稿では,任意の領域に対してオブジェクトカウントのための合成データセットを生成する手法を提案する。
本稿では,高速かつ安価に生成可能な合成データセットに基づくオブジェクトカウントのための領域ランダム化手法を提案する。
- 参考スコア(独自算出の注目度): 18.005245905106367
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Recently, the use of synthetic datasets based on game engines has been shown
to improve the performance of several tasks in computer vision. However, these
datasets are typically only appropriate for the specific domains depicted in
computer games, such as urban scenes involving vehicles and people. In this
paper, we present an approach to generate synthetic datasets for object
counting for any domain without the need for photo-realistic techniques
manually generated by expensive teams of 3D artists. We introduce a domain
randomization approach for object counting based on synthetic datasets that are
quick and inexpensive to generate. We deliberately avoid photorealism and
drastically increase the variability of the dataset, producing images with
random textures and 3D transformations, which improves generalization.
Experiments show that our method facilitates good performance on various real
word object counting datasets for multiple domains: people, vehicles, penguins,
and fruit. The source code is available at: https://github.com/enric1994/dr4oc
- Abstract(参考訳): 近年,ゲームエンジンに基づく合成データセットの利用により,コンピュータビジョンにおけるタスクの性能向上が図られている。
しかし、これらのデータセットは通常、車両や人々を含む都市シーンなど、コンピュータゲームで描かれた特定のドメインにのみ適している。
本稿では,高額な3Dアーティストチームによって手作業で作成される写真リアルな技法を必要とせずに,任意の領域のオブジェクトカウントのための合成データセットを生成する手法を提案する。
本稿では,高速かつ安価に生成できる合成データセットに基づくオブジェクトカウントのためのドメインランダム化手法を提案する。
我々は、故意にフォトリアリズムを避け、データセットの可変性を劇的に増加させ、ランダムなテクスチャと3d変換を持つ画像を生成し、一般化を改善する。
実験により,本手法は,人,車,ペンギン,果物など,複数のドメインを対象とした実単語オブジェクトカウントデータセットの性能向上を図っている。
ソースコードはhttps://github.com/enric1994/dr4oc
関連論文リスト
- Augmented Reality based Simulated Data (ARSim) with multi-view consistency for AV perception networks [47.07188762367792]
ARSimは3次元合成オブジェクトを用いた実写多視点画像データの拡張を目的としたフレームワークである。
実データを用いて簡易な仮想シーンを構築し,その内部に戦略的に3D合成資産を配置する。
結果として得られたマルチビュー一貫性のあるデータセットは、自動運転車のためのマルチカメラ知覚ネットワークのトレーニングに使用される。
論文 参考訳(メタデータ) (2024-03-22T17:49:11Z) - UniG3D: A Unified 3D Object Generation Dataset [75.49544172927749]
UniG3Dは、ShapeNetデータセット上に普遍的なデータ変換パイプラインを用いて構築された、統一された3Dオブジェクト生成データセットである。
このパイプラインは、各生の3Dモデルを包括的なマルチモーダルデータ表現に変換する。
データセットのデータソースの選択は、そのスケールと品質に基づいています。
論文 参考訳(メタデータ) (2023-06-19T07:03:45Z) - BundleSDF: Neural 6-DoF Tracking and 3D Reconstruction of Unknown
Objects [89.2314092102403]
モノクロRGBDビデオシーケンスから未知物体の6-DoF追跡をリアルタイムに行う手法を提案する。
視覚的テクスチャがほとんど欠如している場合でも,任意の剛体オブジェクトに対して有効である。
論文 参考訳(メタデータ) (2023-03-24T17:13:49Z) - Synthetic Data for Object Classification in Industrial Applications [53.180678723280145]
オブジェクト分類では、オブジェクトごとに、異なる条件下で、多数の画像を取得することは必ずしも不可能である。
本研究は,学習データセット内の限られたデータに対処するゲームエンジンを用いた人工画像の作成について検討する。
論文 参考訳(メタデータ) (2022-12-09T11:43:04Z) - Scrape, Cut, Paste and Learn: Automated Dataset Generation Applied to
Parcel Logistics [58.720142291102135]
4つのステップでインスタンスセグメンテーションのための合成データセットを生成するために,完全に自動化されたパイプラインを提案する。
まず、人気のある画像検索エンジンから興味ある対象の画像を抽出する。
画像選択には,オブジェクトに依存しない事前処理,手動画像選択,CNNに基づく画像選択の3つの方法を比較する。
論文 参考訳(メタデータ) (2022-10-18T12:49:04Z) - RandomRooms: Unsupervised Pre-training from Synthetic Shapes and
Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。
最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。
本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文 参考訳(メタデータ) (2021-08-17T17:56:12Z) - DatasetGAN: Efficient Labeled Data Factory with Minimal Human Effort [117.41383937100751]
現在のディープネットワークは、大規模なデータセットのトレーニングの恩恵を受ける、非常にデータハングリーです。
GAN潜入コードがどのようにデコードされ、イメージのセマンティックセグメンテーションを生成するかを示す。
これらの生成されたデータセットは、実際のデータセットと同じように、コンピュータビジョンアーキテクチャのトレーニングに使用できます。
論文 参考訳(メタデータ) (2021-04-13T20:08:29Z) - Learning from THEODORE: A Synthetic Omnidirectional Top-View Indoor
Dataset for Deep Transfer Learning [4.297070083645049]
TheODOREは,14種類の高解像度魚眼画像10万点を含む,新しい大規模屋内データセットである。
リビングルーム、異なる人間キャラクター、インテリアテクスチャの3D仮想環境を作成します。
我々のデータセットは、オブジェクト検出のための微調整CNNに適していることを示す。
論文 参考訳(メタデータ) (2020-11-11T11:46:33Z) - Detection and Segmentation of Custom Objects using High Distraction
Photorealistic Synthetic Data [0.5076419064097732]
合成データを用いてインスタンスセグメンテーションを行うための簡便で有用な手法を示す。
目標は、カスタムオブジェクトの実際のデータを手動で収集し、注釈付けすることで、高いパフォーマンスを達成することである。
このホワイトペーパーは、光実写シミュレーションデータが現実の応用に利用できるという強い証拠を提供する。
論文 参考訳(メタデータ) (2020-07-28T16:33:42Z) - Domain Adaptation with Morphologic Segmentation [8.0698976170854]
本稿では,任意の入力領域(実領域と合成領域)の画像を一様出力領域に変換するために,形態的セグメンテーションを用いた新しいドメイン適応フレームワークを提案する。
私たちのゴールは、複数のソースからのデータを共通の表現に統一する前処理のステップを確立することです。
都市景観のシミュレートと実データの4つのデータ集合上で, 定性的に定量的に評価し, 提案手法の有効性を示す。
論文 参考訳(メタデータ) (2020-06-16T17:06:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。