論文の概要: WinSyn: A High Resolution Testbed for Synthetic Data
- arxiv url: http://arxiv.org/abs/2310.08471v1
- Date: Mon, 9 Oct 2023 20:18:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 02:50:44.150812
- Title: WinSyn: A High Resolution Testbed for Synthetic Data
- Title(参考訳): WinSyn: 合成データのための高解像度テストベッド
- Authors: Tom Kelly, John Femiani and Peter Wonka
- Abstract要約: 我々は,3次元モデルの高解像度写真とレンダリングからなるデータセットWinSynを,合成から現実的な研究のためのテストベッドとして提示する。
このデータセットは75,739枚の高解像度のビルの窓の写真で構成されており、その中には伝統的、近代的なデザインも含まれており、世界中で撮影されている。
本稿では,パラメータ分布と工学的アプローチの多種多様な実験を可能にするドメインマッチング手続きモデルを提案する。
- 参考スコア(独自算出の注目度): 46.20892980106155
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present WinSyn, a dataset consisting of high-resolution photographs and
renderings of 3D models as a testbed for synthetic-to-real research. The
dataset consists of 75,739 high-resolution photographs of building windows,
including traditional and modern designs, captured globally. These include
89,318 cropped subimages of windows, of which 9,002 are semantically labeled.
Further, we present our domain-matched photorealistic procedural model which
enables experimentation over a variety of parameter distributions and
engineering approaches. Our procedural model provides a second corresponding
dataset of 21,290 synthetic images. This jointly developed dataset is designed
to facilitate research in the field of synthetic-to-real learning and synthetic
data generation. WinSyn allows experimentation into the factors that make it
challenging for synthetic data to compete with real-world data. We perform
ablations using our synthetic model to identify the salient rendering,
materials, and geometric factors pertinent to accuracy within the labeling
task. We chose windows as a benchmark because they exhibit a large variability
of geometry and materials in their design, making them ideal to study synthetic
data generation in a constrained setting. We argue that the dataset is a
crucial step to enable future research in synthetic data generation for deep
learning.
- Abstract(参考訳): 我々は,3次元モデルの高解像度写真とレンダリングからなるデータセットWinSynを,合成から現実的な研究のためのテストベッドとして提示する。
データセットは75,739枚の高精細な建物窓の写真で構成されており、その中には伝統的なデザインや現代的なデザインも含まれている。
これには、89,318の切り抜かれたwindowsのサブイメージが含まれており、そのうち9,002は意味的にラベル付けされている。
さらに, 様々なパラメータ分布と工学的アプローチを用いた実験を可能にする, ドメイン整合フォトリアリスティックプロシーデュラルモデルを提案する。
手続きモデルは21,290枚の合成画像からなる第2の対応データセットを提供する。
この共同開発したデータセットは、合成から現実の学習と合成データ生成の分野での研究を容易にするように設計されている。
WinSynは、合成データが現実世界のデータと競合することを難しくする要因を実験することができる。
合成モデルを用いたアブレーションを行い,ラベリング作業の正確性にかかわるサルエントレンダリング,材料,幾何学的要因を同定した。
私たちはwindowsをベンチマークとして選んだのは、その設計において幾何と材料の大きな変動を示し、制約のある環境で合成データ生成を研究するのに理想的だからです。
我々は、データセットはディープラーニングのための合成データ生成における将来の研究を可能にするための重要なステップであると主張している。
関連論文リスト
- Visual Car Brand Classification by Implementing a Synthetic Image Dataset Creation Pipeline [3.524869467682149]
安定拡散を用いた合成画像データセットの自動生成パイプラインを提案する。
YOLOv8を用いて自動境界ボックス検出と合成画像の品質評価を行う。
論文 参考訳(メタデータ) (2024-06-03T07:44:08Z) - Is Synthetic Image Useful for Transfer Learning? An Investigation into Data Generation, Volume, and Utilization [62.157627519792946]
ブリッジドトランスファー(ブリッジドトランスファー)と呼ばれる新しいフレームワークを導入する。このフレームワークは、当初、トレーニング済みモデルの微調整に合成画像を使用し、転送性を向上させる。
合成画像と実画像のスタイルアライメントを改善するために,データセットスタイルの逆変換方式を提案する。
提案手法は10の異なるデータセットと5つの異なるモデルで評価され、一貫した改善が示されている。
論文 参考訳(メタデータ) (2024-03-28T22:25:05Z) - Deep Domain Adaptation: A Sim2Real Neural Approach for Improving Eye-Tracking Systems [80.62854148838359]
眼球画像のセグメンテーションは、最終視線推定に大きな影響を及ぼす眼球追跡の重要なステップである。
対象視線画像と合成訓練データとの重なり合いを測定するために,次元還元法を用いている。
提案手法は,シミュレーションと実世界のデータサンプルの相違に対処する際の頑健で,性能が向上する。
論文 参考訳(メタデータ) (2024-03-23T22:32:06Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Rethinking Blur Synthesis for Deep Real-World Image Deblurring [4.00114307523959]
本稿では,撮影過程をシミュレートする,新しいリアルなボケ合成パイプラインを提案する。
機能領域における非局所的依存関係と局所的コンテキストを同時にキャプチャする効果的なデブロアリングモデルを開発する。
3つの実世界のデータセットに関する総合的な実験により、提案したデブロアリングモデルは最先端の手法よりも優れた性能を示した。
論文 参考訳(メタデータ) (2022-09-28T06:50:16Z) - Style-Hallucinated Dual Consistency Learning for Domain Generalized
Semantic Segmentation [117.3856882511919]
本稿では、ドメインシフトを処理するためのStyle-HAllucinated Dual consistEncy Learning(SHADE)フレームワークを提案する。
SHADEは3つの実世界のデータセットの平均mIoUに対して5.07%と8.35%の精度で改善し、最先端の手法よりも優れています。
論文 参考訳(メタデータ) (2022-04-06T02:49:06Z) - Partially fake it till you make it: mixing real and fake thermal images
for improved object detection [29.13557322147509]
熱画像における物体検出の文脈における提案システムの性能について述べる。
我々の単一モード検出器はFLIR ADASデータセットの最先端結果を達成する。
論文 参考訳(メタデータ) (2021-06-25T12:56:09Z) - IMAGINE: Image Synthesis by Image-Guided Model Inversion [79.4691654458141]
IMGE-Guided Model INvErsion (IMAGINE) と呼ばれるインバージョンベースの手法を導入し、高品質で多様な画像を生成します。
我々は,事前学習した分類器から画像意味論の知識を活用し,妥当な世代を実現する。
IMAGINEは,1)合成中の意味的特異性制約を同時に実施し,2)ジェネレータトレーニングなしでリアルな画像を生成し,3)生成過程を直感的に制御する。
論文 参考訳(メタデータ) (2021-04-13T02:00:24Z) - Synthetic Data and Hierarchical Object Detection in Overhead Imagery [0.0]
衛星画像における低・ゼロサンプル学習を向上させるための新しい合成データ生成および拡張技術を開発した。
合成画像の有効性を検証するために,検出モデルと2段階モデルの訓練を行い,実際の衛星画像上で得られたモデルを評価する。
論文 参考訳(メタデータ) (2021-01-29T22:52:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。