Fugu-MT 論文翻訳(概要): SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark

論文の概要: SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark

arxiv url: http://arxiv.org/abs/2412.00730v2
Date: Mon, 03 Feb 2025 10:21:34 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-04 15:57:53.368229
Title: SEED4D: A Synthetic Ego--Exo Dynamic 4D Data Generator, Driving Dataset and Benchmark
Title（参考訳）: SEED4D: 合成エゴ-エクソ動的4Dデータジェネレータ、駆動データとベンチマーク
Authors: Marius Kästingschäfer, Théo Gieruc, Sebastian Bernhard, Dylan Campbell, Eldar Insafutdinov, Eyvaz Najafli, Thomas Brox,
Abstract要約: マルチビューデータ作成のためのカスタマイズ可能で時間的に使いやすいデータ生成装置を提案する。我々の静的(3D)データセットは、2kのシーンから212kの内向きと外向きの車両画像を含んでいる。我々の動的(4D)データセットは、10k軌道からの16.8M画像を含み、それぞれが100ポイントの時間でサンプリングされる。
参考スコア（独自算出の注目度）: 32.26258076241702
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Models for egocentric 3D and 4D reconstruction, including few-shot interpolation and extrapolation settings, can benefit from having images from exocentric viewpoints as supervision signals. No existing dataset provides the necessary mixture of complex, dynamic, and multi-view data. To facilitate the development of 3D and 4D reconstruction methods in the autonomous driving context, we propose a Synthetic Ego--Exo Dynamic 4D (SEED4D) data generator and dataset. We present a customizable, easy-to-use data generator for spatio-temporal multi-view data creation. Our open-source data generator allows the creation of synthetic data for camera setups commonly used in the NuScenes, KITTI360, and Waymo datasets. Additionally, SEED4D encompasses two large-scale multi-view synthetic urban scene datasets. Our static (3D) dataset encompasses 212k inward- and outward-facing vehicle images from 2k scenes, while our dynamic (4D) dataset contains 16.8M images from 10k trajectories, each sampled at 100 points in time with egocentric images, exocentric images, and LiDAR data. The datasets and the data generator can be found at https://seed4d.github.io/.
Abstract（参考訳）: エゴセントリックな3Dと4D再構成のためのモデルは、数ショットの補間や外挿の設定を含む、監督信号として、外心的な視点からのイメージを持つことの恩恵を受けることができる。複雑な、動的、マルチビューなデータの必要な混合を提供するデータセットは存在しない。自律走行環境下での3次元・4次元再構成手法の開発を容易にするために, 合成エゴエクソダイナミック4D(SEED4D)データジェネレータとデータセットを提案する。時空間多視点データ生成のためのカスタマイズ可能で使いやすいデータ生成装置を提案する。我々のオープンソースのデータジェネレータは、NuScenes、KITTI360、Waymoのデータセットでよく使われているカメラ設定のための合成データの作成を可能にします。さらに、SEED4Dは2つの大規模マルチビュー合成都市シーンデータセットを含んでいる。我々の静的(3D)データセットは2kのシーンから212kの内向きと外向きの車両画像を含み、我々の動的(4D)データセットは10kの軌跡から16.8Mの画像を含み、それぞれがエゴセントリックなイメージ、エクソセントリックなイメージ、LiDARデータとともに100ポイントでサンプリングされた。データセットとデータジェネレータはhttps://seed4d.github.io/で確認できる。

関連論文リスト

Geo4D: Leveraging Video Generators for Geometric 4D Scene Reconstruction [72.54905331756076]
動的シーンのモノクロ3次元再構成にビデオ拡散モデルを再利用するGeo4Dを提案する。このようなビデオモデルによってキャプチャされた強いダイナミックな事前情報を活用することで、Geo4Dは合成データのみを使用して訓練することができる。
論文参考訳（メタデータ） (2025-04-10T17:59:55Z)
MTGS: Multi-Traversal Gaussian Splatting [51.22657444433942]
マルチトラバースデータは、道路ブロック内のシーン再構築のための複数の視点を提供する。任意に収集したマルチトラバーサルデータから高品質な運転シーンを再構成する新しい手法であるマルチトラバーサル・ガウス・スプラッティング(MTGS)を提案する。その結果、MTGSはLPIPSを23.5%改善し、幾何学的精度は46.3%向上した。
論文参考訳（メタデータ） (2025-03-16T15:46:12Z)
4D Gaussian Splatting: Modeling Dynamic Scenes with Native 4D Primitives [115.67081491747943]
動的3Dシーン表現と新しいビュー合成はAR/VRおよびメタバースアプリケーションの実現に不可欠である。我々は,その基礎となる4次元体積を近似として,時間変化の異なる3次元シーンの再構成を再構成する。ストレージのボトルネックに対処するため、メモリフットプリントを効果的に削減するいくつかのコンパクトなバリエーションを導出する。
論文参考訳（メタデータ） (2024-12-30T05:30:26Z)
OmniHD-Scenes: A Next-Generation Multimodal Dataset for Autonomous Driving [6.426389871517664]
高品質なデータセットは、効率的なデータ駆動自律運転ソリューションの開発に不可欠である。 OmniHD-Scenesは大規模なマルチモーダルデータセットであり、全方位全方位高精細データを提供する。データセットは1501のクリップで構成され、それぞれ約30秒の長さで、合計450K以上の同期フレームと585万以上の同期センサーデータポイントで構成されている。
論文参考訳（メタデータ） (2024-12-14T08:08:40Z)
MinD-3D++: Advancing fMRI-Based 3D Reconstruction with High-Quality Textured Mesh Generation and a Comprehensive Dataset [50.534007259536715]
機能的磁気共鳴イメージング(fMRI)データから3次元視覚を再構成することは、認知神経科学とコンピュータビジョンにとって重要な関心事である。我々は15人の参加者のデータを含むfMRI-3Dデータセットを提示し、合計4,768個の3Dオブジェクトを展示する。テクスチャ化された3次元視覚情報をfMRI信号から復号する新しいフレームワークMinD-3D++を提案する。
論文参考訳（メタデータ） (2024-09-17T16:13:59Z)
Shape2.5D: A Dataset of Texture-less Surfaces for Depth and Normals Estimation [12.757150641117077]
シェープ2.5Dは、このギャップに対処するために設計された、新しい大規模データセットである。提案するデータセットは、3Dモデリングソフトウェアでレンダリングされた合成画像を含む。また、深度カメラで撮影される4,672フレームからなる現実世界のサブセットも含まれている。
論文参考訳（メタデータ） (2024-06-22T12:24:49Z)
SCaRL- A Synthetic Multi-Modal Dataset for Autonomous Driving [0.0]
本稿では、自律運転ソリューションのトレーニングと検証を可能にするために、合成生成された新しいマルチモーダルデータセットであるSCaRLを提案する。 SCaRLはCARLA Simulatorに基づく大規模なデータセットであり、多様な動的シナリオとトラフィック条件のためのデータを提供する。
論文参考訳（メタデータ） (2024-05-27T10:31:26Z)
3D Human Reconstruction in the Wild with Synthetic Data Using Generative Models [52.96248836582542]
本稿では,人間の画像とそれに対応する3Dメッシュアノテーションをシームレスに生成できるHumanWildという,最近の拡散モデルに基づく効果的なアプローチを提案する。生成モデルを排他的に活用することにより,大規模な人体画像と高品質なアノテーションを生成し,実世界のデータ収集の必要性を解消する。
論文参考訳（メタデータ） (2024-03-17T06:31:16Z)
Efficient4D: Fast Dynamic 3D Object Generation from a Single-view Video [42.10482273572879]
本稿では,効率的な4Dオブジェクト生成フレームワークであるEfficient4Dを提案する。異なるカメラビューの下で高品質な時空一貫性の画像を生成し、ラベル付きデータとして使用する。合成ビデオと実ビデオの両方の実験によると、Efficient4Dのスピードは10倍に向上している。
論文参考訳（メタデータ） (2024-01-16T18:58:36Z)
UniG3D: A Unified 3D Object Generation Dataset [75.49544172927749]
UniG3Dは、ShapeNetデータセット上に普遍的なデータ変換パイプラインを用いて構築された、統一された3Dオブジェクト生成データセットである。このパイプラインは、各生の3Dモデルを包括的なマルチモーダルデータ表現に変換する。データセットのデータソースの選択は、そのスケールと品質に基づいています。
論文参考訳（メタデータ） (2023-06-19T07:03:45Z)
Argoverse 2: Next Generation Datasets for Self-Driving Perception and Forecasting [64.7364925689825]
Argoverse 2(AV2)は、自動運転分野の研究の知覚と予測のための3つのデータセットの集合である。 Lidarデータセットには、ラベルなしのLidar点雲とマップ整列ポーズの2万のシーケンスが含まれている。 Motion Forecastingデータセットには、各ローカルシーンにおける自動運転車と他のアクター間の興味深い、挑戦的なインタラクションのために採掘された25万のシナリオが含まれている。
論文参考訳（メタデータ） (2023-01-02T00:36:22Z)
IDD-3D: Indian Driving Dataset for 3D Unstructured Road Scenes [79.18349050238413]
デプロイ可能なディープラーニングアーキテクチャの準備とトレーニングには、さまざまなトラフィックシナリオに適したモデルが必要である。インドなどいくつかの発展途上国で見られる非構造的で複雑な運転レイアウトは、これらのモデルに挑戦している。我々は、複数のカメラと12kの注釈付き駆動LiDARフレームを備えたLiDARセンサーのマルチモーダルデータからなる新しいデータセットIDD-3Dを構築した。
論文参考訳（メタデータ） (2022-10-23T23:03:17Z)
Robust 2D/3D Vehicle Parsing in CVIS [54.825777404511605]
本研究では,協調型車両インフラシステム(CVIS)の一環として,異なるカメラビューの車両を堅牢に検出・認識する新しいアプローチを提案する。提案方式は任意のカメラビュー向けに設計されており,本質的パラメータや外部的パラメータを仮定しない。実際に,本手法は2次元検出,インスタンスセグメンテーション,6-DoFのポーズ推定においてSOTA法より優れている。
論文参考訳（メタデータ） (2021-03-11T03:35:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。