論文の概要: WinSyn: A High Resolution Testbed for Synthetic Data
- arxiv url: http://arxiv.org/abs/2310.08471v1
- Date: Mon, 9 Oct 2023 20:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 02:50:44.150812
- Title: WinSyn: A High Resolution Testbed for Synthetic Data
- Title(参考訳): WinSyn: 合成データのための高解像度テストベッド
- Authors: Tom Kelly, John Femiani and Peter Wonka
- Abstract要約: 我々は,3次元モデルの高解像度写真とレンダリングからなるデータセットWinSynを,合成から現実的な研究のためのテストベッドとして提示する。
このデータセットは75,739枚の高解像度のビルの窓の写真で構成されており、その中には伝統的、近代的なデザインも含まれており、世界中で撮影されている。
本稿では,パラメータ分布と工学的アプローチの多種多様な実験を可能にするドメインマッチング手続きモデルを提案する。
- 参考スコア(独自算出の注目度): 46.20892980106155
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present WinSyn, a dataset consisting of high-resolution photographs and
renderings of 3D models as a testbed for synthetic-to-real research. The
dataset consists of 75,739 high-resolution photographs of building windows,
including traditional and modern designs, captured globally. These include
89,318 cropped subimages of windows, of which 9,002 are semantically labeled.
Further, we present our domain-matched photorealistic procedural model which
enables experimentation over a variety of parameter distributions and
engineering approaches. Our procedural model provides a second corresponding
dataset of 21,290 synthetic images. This jointly developed dataset is designed
to facilitate research in the field of synthetic-to-real learning and synthetic
data generation. WinSyn allows experimentation into the factors that make it
challenging for synthetic data to compete with real-world data. We perform
ablations using our synthetic model to identify the salient rendering,
materials, and geometric factors pertinent to accuracy within the labeling
task. We chose windows as a benchmark because they exhibit a large variability
of geometry and materials in their design, making them ideal to study synthetic
data generation in a constrained setting. We argue that the dataset is a
crucial step to enable future research in synthetic data generation for deep
learning.
- Abstract(参考訳): 我々は,3次元モデルの高解像度写真とレンダリングからなるデータセットWinSynを,合成から現実的な研究のためのテストベッドとして提示する。
データセットは75,739枚の高精細な建物窓の写真で構成されており、その中には伝統的なデザインや現代的なデザインも含まれている。
これには、89,318の切り抜かれたwindowsのサブイメージが含まれており、そのうち9,002は意味的にラベル付けされている。
さらに, 様々なパラメータ分布と工学的アプローチを用いた実験を可能にする, ドメイン整合フォトリアリスティックプロシーデュラルモデルを提案する。
手続きモデルは21,290枚の合成画像からなる第2の対応データセットを提供する。
この共同開発したデータセットは、合成から現実の学習と合成データ生成の分野での研究を容易にするように設計されている。
WinSynは、合成データが現実世界のデータと競合することを難しくする要因を実験することができる。
合成モデルを用いたアブレーションを行い,ラベリング作業の正確性にかかわるサルエントレンダリング,材料,幾何学的要因を同定した。
私たちはwindowsをベンチマークとして選んだのは、その設計において幾何と材料の大きな変動を示し、制約のある環境で合成データ生成を研究するのに理想的だからです。
我々は、データセットはディープラーニングのための合成データ生成における将来の研究を可能にするための重要なステップであると主張している。
関連論文リスト
- TarGEN: Targeted Data Generation with Large Language Models [54.1093098278564]
TarGENは、高品質な合成データセットを生成するための、多段階のプロンプト戦略である。
我々は,LLMが不正確なラベル付きインスタンスを修正できるようにする自己補正法により,TarGENを増強する。
合成データセットを元のデータセットと比較した包括的な分析により、データセットの複雑さと多様性の類似または高いレベルが明らかになる。
論文 参考訳(メタデータ) (2023-10-27T03:32:17Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - SyntheWorld: A Large-Scale Synthetic Dataset for Land Cover Mapping and
Building Change Detection [20.985372561774415]
我々は、品質、多様性、スケールに比類しない合成データセットであるSyntheWorldを提示する。
サブメーターレベルのピクセルを持つ4万枚の画像と8つのカテゴリの詳細なランドカバーアノテーションを含んでいる。
リモートセンシング画像処理研究を容易にするためのSyntheWorldをリリースする。
論文 参考訳(メタデータ) (2023-09-05T02:42:41Z) - ContraNeRF: Generalizable Neural Radiance Fields for Synthetic-to-real
Novel View Synthesis via Contrastive Learning [102.46382882098847]
まず,合成から現実への新規な視点合成における合成データの影響について検討した。
本稿では,幾何制約を伴う多視点一貫した特徴を学習するために,幾何対応のコントラスト学習を導入することを提案する。
提案手法は,PSNR,SSIM,LPIPSの点で,既存の一般化可能な新規ビュー合成手法よりも高い画質で精細な画像を描画することができる。
論文 参考訳(メタデータ) (2023-03-20T12:06:14Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Synthetic Data for Model Selection [2.4499092754102874]
合成データはモデル選択に有用であることを示す。
そこで本研究では,実領域に適合する合成誤差推定をキャリブレーションする新しい手法を提案する。
論文 参考訳(メタデータ) (2021-05-03T09:52:03Z) - Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。
合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文 参考訳(メタデータ) (2021-01-29T22:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。