論文の概要: VALERIE22 -- A photorealistic, richly metadata annotated dataset of
urban environments
- arxiv url: http://arxiv.org/abs/2308.09632v1
- Date: Fri, 18 Aug 2023 15:44:45 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-21 12:38:05.531831
- Title: VALERIE22 -- A photorealistic, richly metadata annotated dataset of
urban environments
- Title(参考訳): VALERIE22 -- 都市環境のフォトリアリスティックでリッチなメタデータアノテートデータセット
- Authors: Oliver Grau and Korbinian Hagn
- Abstract要約: VALERIEツールパイプラインは、ドメイン固有の要素の理解に寄与するために開発された合成データジェネレータである。
VALERIE22データセットは、フォトリアリスティックセンサーシミュレーションを提供するVALERIEプロシージャツールパイプラインで生成された。
データセットは独自のリッチなメタデータセットを提供し、特定のシーンとセマンティックな特徴の抽出を可能にする。
- 参考スコア(独自算出の注目度): 5.439020425819001
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The VALERIE tool pipeline is a synthetic data generator developed with the
goal to contribute to the understanding of domain-specific factors that
influence perception performance of DNNs (deep neural networks). This work was
carried out under the German research project KI Absicherung in order to
develop a methodology for the validation of DNNs in the context of pedestrian
detection in urban environments for automated driving. The VALERIE22 dataset
was generated with the VALERIE procedural tools pipeline providing a
photorealistic sensor simulation rendered from automatically synthesized
scenes. The dataset provides a uniquely rich set of metadata, allowing
extraction of specific scene and semantic features (like pixel-accurate
occlusion rates, positions in the scene and distance + angle to the camera).
This enables a multitude of possible tests on the data and we hope to stimulate
research on understanding performance of DNNs. Based on performance metric a
comparison with several other publicly available datasets is provided,
demonstrating that VALERIE22 is one of best performing synthetic datasets
currently available in the open domain.
- Abstract(参考訳): VALERIEツールパイプラインは、DNN(ディープニューラルネットワーク)の知覚性能に影響を与えるドメイン固有の要因の理解に寄与する目的で開発された合成データジェネレータである。
この研究はドイツの研究プロジェクトki absicherungで行われ、自動運転のための都市環境における歩行者検出の文脈におけるdnnの検証方法を開発した。
VALERIE22データセットは、自動的に合成されたシーンからレンダリングされたフォトリアリスティックセンサーシミュレーションを提供するVALERIEプロシージャツールパイプラインで生成された。
データセットは独自のリッチなメタデータセットを提供し、特定のシーンとセマンティックな特徴(画素精度の高いオクルージョン率、シーンの位置、カメラへの距離+角度など)を抽出する。
これにより、データに対する多種多様なテストが可能となり、DNNの理解性能の研究が促進されることを期待する。
パフォーマンス指標に基づいて、他のいくつかの公開データセットとの比較が提供され、VALERIE22が現在オープンドメインで利用可能な最高の合成データセットの1つであることを示す。
関連論文リスト
- DailyDVS-200: A Comprehensive Benchmark Dataset for Event-Based Action Recognition [51.96660522869841]
DailyDVS-200は、イベントベースのアクション認識コミュニティに適したベンチマークデータセットである。
実世界のシナリオで200のアクションカテゴリをカバーし、47人の参加者によって記録され、22,000以上のイベントシーケンスで構成されている。
DailyDVS-200には14の属性がアノテートされており、記録されたアクションの詳細なキャラクタリゼーションが保証されている。
論文 参考訳(メタデータ) (2024-07-06T15:25:10Z) - Real Acoustic Fields: An Audio-Visual Room Acoustics Dataset and Benchmark [65.79402756995084]
Real Acoustic Fields (RAF)は、複数のモードから実際の音響室データをキャプチャする新しいデータセットである。
RAFは密集した室内音響データを提供する最初のデータセットである。
論文 参考訳(メタデータ) (2024-03-27T17:59:56Z) - View-Dependent Octree-based Mesh Extraction in Unbounded Scenes for
Procedural Synthetic Data [71.22495169640239]
手続き署名距離関数(SDF)は、大規模な詳細なシーンをモデル化するための強力なツールである。
OcMesherというメッシュ抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-12-13T18:56:13Z) - ParGANDA: Making Synthetic Pedestrians A Reality For Object Detection [2.7648976108201815]
本稿では,GAN(Generative Adversarial Network)を用いて,実データと合成データのギャップを埋めることを提案する。
我々のアプローチは、視覚的に可視なサンプルを生成するだけでなく、実際のドメインのラベルも必要としない。
論文 参考訳(メタデータ) (2023-07-21T05:26:32Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Neural-Sim: Learning to Generate Training Data with NeRF [31.81496344354997]
本稿では,ニューラルレージアンスフィールド(NeRF)を対象アプリケーションの損失関数を持つ閉ループに使用した,最初の完全微分可能な合成データパイプラインを提案する。
提案手法は,人的負担を伴わないオンデマンドでデータを生成し,目標タスクの精度を最大化する。
論文 参考訳(メタデータ) (2022-07-22T22:48:33Z) - Egocentric Human-Object Interaction Detection Exploiting Synthetic Data [19.220651860718892]
産業的文脈において,エゴセントリックなヒューマンオブジェクトインタラクション(EHOI)を検出することの問題点を考察する。
EHOI検出に自動的にラベル付けされたFPV画像を生成するためのパイプラインとツールを提案する。
論文 参考訳(メタデータ) (2022-04-14T15:59:15Z) - Omnidata: A Scalable Pipeline for Making Multi-Task Mid-Level Vision
Datasets from 3D Scans [103.92680099373567]
本稿では,実世界の包括的3Dスキャンからマルチタスク視覚データセットをパラメトリックサンプリングし,レンダリングするパイプラインを提案する。
サンプリングパラメータを変更することで、生成されたデータセットを“ステア”して、特定の情報を強調することが可能になる。
生成されたスタータデータセットでトレーニングされた共通アーキテクチャは、複数の共通ビジョンタスクとベンチマークで最先端のパフォーマンスに達した。
論文 参考訳(メタデータ) (2021-10-11T04:21:46Z) - SynPick: A Dataset for Dynamic Bin Picking Scene Understanding [25.706613724135046]
ビンピッキングシナリオにおける動的シーン理解のための合成データセットであるSynPickを提案する。
既存のデータセットとは対照的に、私たちのデータセットはどちらも現実的な産業アプリケーションドメイン内にあります。
データセットは人気のあるBOPデータセットフォーマットと互換性がある。
論文 参考訳(メタデータ) (2021-07-10T14:58:43Z) - Speak2Label: Using Domain Knowledge for Creating a Large Scale Driver
Gaze Zone Estimation Dataset [55.391532084304494]
ワイルド・データセットのドライバ・ゲイズには、夕方を含む1日の異なる時間に撮影された586の録音が含まれている。
ワイルド・データセットのドライバ・ゲイズには338人の被験者がおり、年齢は18-63歳である。
論文 参考訳(メタデータ) (2020-04-13T14:47:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。