Fugu-MT 論文翻訳(概要): PairedGTA: Generating Driving Datasets for Controlled Photometric Shift Analysis

論文の概要: PairedGTA: Generating Driving Datasets for Controlled Photometric Shift Analysis

arxiv url: http://arxiv.org/abs/2606.01192v1
Date: Sun, 31 May 2026 12:13:19 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-02 21:34:29.373357
Title: PairedGTA: Generating Driving Datasets for Controlled Photometric Shift Analysis
Title（参考訳）: PairedGTA:制御光度シフト解析のための駆動データセットの生成
Authors: Andrea Chianese, Giulio Rossolini, Alessandro Biondi, Marco Cococcioni, Giorgio Buttazzo,
Abstract要約: 本研究では,完全対画像抽出のための高忠実度ゲームエンジンに基づくデータ生成フレームワークを提案する。サンプリングされた各場所について、動的エンティティを手続き的にインスタンス化し、さまざまな悪条件下でピクセル整列画像をレンダリングする。シナリオ駆動における生成フレームワークの利点は,セマンティックセグメンテーションモデルの体系的解析を通じて示される。
参考スコア（独自算出の注目度）: 43.25348855116086
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Evaluating the performance of visual perception systems for autonomous driving is essential to ensure reliable operation across diverse environmental scenarios. Ideally, a balanced and fair analysis across different adverse conditions would require perfectly paired images of the same scene under different weather or illumination changes. This would allow evaluating the effect of photometric shifts independently of geometry and semantic changes. Unfortunately, real-world datasets rarely provide images of the same scene under different environmental conditions, because, normally, camera pose, traffic, and locations of dynamic objects (vehicles, pedestrians, etc.) vary over time, thus yielding only coarsely paired data. To address this challenge, this work introduces a data generation framework based on a high-fidelity game engine for extracting perfectly paired images. By leveraging software APIs that communicate with the GTA game engine, the framework modifies illumination and weather conditions while preserving scene geometry, camera pose, and the identity and placement of dynamic objects. For each sampled location, it procedurally instantiates dynamic entities and renders pixel-aligned images under diverse adverse conditions. The benefit of the proposed generation framework in driving scenarios is demonstrated through a systematic analysis of semantic segmentation models, whose output degradation can be attributed more directly to photometric shifts rather than to uncontrolled semantic or geometric factors.
Abstract（参考訳）: 自律運転のための視覚認識システムの性能評価は、多様な環境シナリオにおける信頼性の高い運転を保証するために不可欠である。理想的には、異なる悪条件に対してバランスよく公平な分析を行うには、異なる天候や照明の変化の下で同じシーンの完全なペア画像が必要である。これにより、幾何学や意味的変化とは無関係に光度シフトの効果を評価することができる。通常、カメラのポーズ、トラフィック、動的物体(車両、歩行者など)の位置は時間とともに異なり、粗いペアリングデータしか得られない。この課題に対処するために,完全対画像抽出のための高忠実度ゲームエンジンに基づくデータ生成フレームワークを提案する。 GTAゲームエンジンと通信するソフトウェアAPIを活用することで、シーン幾何学、カメラポーズ、動的オブジェクトのアイデンティティと配置を保ちながら、照明と気象条件を変更する。サンプリングされた各場所について、動的エンティティを手続き的にインスタンス化し、さまざまな悪条件下でピクセル整列画像をレンダリングする。シナリオ駆動における生成フレームワークの利点は、セマンティックセグメンテーションモデルの体系的解析を通じて示され、その出力劣化は、制御不能なセマンティックや幾何学的要因よりも、より直接的に光度シフトに起因することができる。

関連論文リスト

RealEngine: Simulating Autonomous Driving in Realistic Context [60.55873455475112]
RealEngineは3Dシーン再構成と新しいビュー合成技術を統合する新しい運転シミュレーションフレームワークである。実世界のマルチモーダルセンサーデータを活用することで、RealEngineはバックグラウンドシーンとフォアグラウンドトラフィック参加者を別々に再構築し、非常に多様な現実的なトラフィックシナリオを実現する。 RealEngineは、非反応性シミュレーション、安全性テスト、マルチエージェントインタラクションの3つの重要な駆動シミュレーションカテゴリをサポートしている。
論文参考訳（メタデータ） (2025-05-22T17:01:00Z)
Drive-1-to-3: Enriching Diffusion Priors for Novel View Synthesis of Real Vehicles [81.29018359825872]
本稿では,実世界の課題に対して,大規模な事前学習モデルを微調整するための一連の優れたプラクティスを統合する。具体的には,合成データと実運転データとの相違を考慮に入れたいくつかの戦略を開発する。我々の洞察は、先行芸術よりも新しいビュー合成のためのFIDを68.8%値下げする効果のある微調整につながる。
論文参考訳（メタデータ） (2024-12-19T03:39:13Z)
WayveScenes101: A Dataset and Benchmark for Novel View Synthesis in Autonomous Driving [4.911903454560829]
WayveScenes101は、新しいビュー合成において、コミュニティが技術の状態を前進させるのを助けるために設計されたデータセットである。データセットは、幅広い環境条件と運転シナリオにわたる101の運転シーンで構成されている。
論文参考訳（メタデータ） (2024-07-11T08:29:45Z)
ConstScene: Dataset and Model for Advancing Robust Semantic Segmentation in Construction Environments [1.4070907500169874]
本稿では,建設現場に適したセマンティックセグメンテーションデータセットを提案する。このデータセットは、オブジェクト検出モデルのトレーニングと評価を強化するように設計されている。
論文参考訳（メタデータ） (2023-12-27T10:49:19Z)
Multi-Object Manipulation via Object-Centric Neural Scattering Functions [40.45919680959231]
モデル予測制御フレームワークにおいて,オブジェクト中心型ニューラル散乱関数(OSF)をオブジェクト表現として用いることを提案する。 OSFは、オブジェクトごとの光輸送をモデルとし、オブジェクトの再配置と様々な照明条件の下で構成シーンの再レンダリングを可能にする。
論文参考訳（メタデータ） (2023-06-14T21:14:10Z)
Street-View Image Generation from a Bird's-Eye View Layout [95.36869800896335]
近年,Bird's-Eye View (BEV) の知覚が注目されている。自動運転のためのデータ駆動シミュレーションは、最近の研究の焦点となっている。本稿では,現実的かつ空間的に一貫した周辺画像を合成する条件生成モデルであるBEVGenを提案する。
論文参考訳（メタデータ） (2023-01-11T18:39:34Z)
Multi-Modal Fusion Transformer for End-to-End Autonomous Driving [59.60483620730437]
画像表現とLiDAR表現を注目で統合する,新しいマルチモードフュージョントランスフォーマであるTransFuserを提案する。本手法は, 衝突を76%低減しつつ, 最先端駆動性能を実現する。
論文参考訳（メタデータ） (2021-04-19T11:48:13Z)
GeoSim: Photorealistic Image Simulation with Geometry-Aware Composition [81.24107630746508]
GeoSimは、新しい都市の運転シーンを合成するジオメトリ認識の画像合成プロセスです。まず、センサーデータからリアルな形状と外観の両方を備えた多様な3Dオブジェクトのバンクを構築します。得られた合成画像は、フォトリアリズム、トラフィック認識、幾何学的一貫性があり、画像シミュレーションが複雑なユースケースにスケールできる。
論文参考訳（メタデータ） (2021-01-16T23:00:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。