論文の概要: FSID: Fully Synthetic Image Denoising via Procedural Scene Generation
- arxiv url: http://arxiv.org/abs/2212.03961v1
- Date: Wed, 7 Dec 2022 21:21:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-09 15:35:10.405221
- Title: FSID: Fully Synthetic Image Denoising via Procedural Scene Generation
- Title(参考訳): FSID: プロシージャシーン生成による完全な合成画像
- Authors: Gyeongmin Choe, Beibei Du, Seonghyeon Nam, Xiaoyu Xiang, Bo Zhu,
Rakesh Ranjan
- Abstract要約: 低レベルの視覚タスクに適した手続き型合成データ生成パイプラインとデータセットを開発する。
我々のUnrealエンジンベースの合成データパイプラインは、ランダムな3Dオブジェクト、材料、幾何学的変換の組み合わせで、大きなシーンをアルゴリズムで生成します。
そこで我々は,CNNに基づく復調モデルの訓練と検証を行い,この合成データのみを用いてトレーニングしたモデルが競争性のある復調結果が得られることを示した。
- 参考スコア(独自算出の注目度): 12.277286575812441
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: For low-level computer vision and image processing ML tasks, training on
large datasets is critical for generalization. However, the standard practice
of relying on real-world images primarily from the Internet comes with image
quality, scalability, and privacy issues, especially in commercial contexts. To
address this, we have developed a procedural synthetic data generation pipeline
and dataset tailored to low-level vision tasks. Our Unreal engine-based
synthetic data pipeline populates large scenes algorithmically with a
combination of random 3D objects, materials, and geometric transformations.
Then, we calibrate the camera noise profiles to synthesize the noisy images.
From this pipeline, we generated a fully synthetic image denoising dataset
(FSID) which consists of 175,000 noisy/clean image pairs. We then trained and
validated a CNN-based denoising model, and demonstrated that the model trained
on this synthetic data alone can achieve competitive denoising results when
evaluated on real-world noisy images captured with smartphone cameras.
- Abstract(参考訳): 低レベルのコンピュータビジョンと画像処理MLタスクでは、大規模データセットでのトレーニングが一般化に不可欠である。
しかし、主にインターネットから実世界のイメージに依存する標準的なプラクティスは、画像の品質、スケーラビリティ、そして特に商業的なコンテキストにおけるプライバシーの問題である。
そこで我々は,低レベルの視覚タスクに適した手続き型合成データ生成パイプラインとデータセットを開発した。
私たちのUnrealエンジンベースの合成データパイプラインは、ランダムな3Dオブジェクト、材料、幾何学的変換の組み合わせで、大きなシーンをアルゴリズムで生成します。
そして、カメラノイズプロファイルを校正してノイズ画像を合成する。
このパイプラインから、175,000のノイズ/クリーンな画像対からなる完全合成画像復調データセット(FSID)を作成した。
そして,スマートフォンカメラで撮影した実世界のノイズ画像から,この合成データだけで訓練したモデルが,競合するノイズ評価結果が得られることを示した。
関連論文リスト
- 3D Human Reconstruction in the Wild with Synthetic Data Using Generative Models [52.96248836582542]
本稿では,人間の画像とそれに対応する3Dメッシュアノテーションをシームレスに生成できるHumanWildという,最近の拡散モデルに基づく効果的なアプローチを提案する。
生成モデルを排他的に活用することにより,大規模な人体画像と高品質なアノテーションを生成し,実世界のデータ収集の必要性を解消する。
論文 参考訳(メタデータ) (2024-03-17T06:31:16Z) - Enhancement of 3D Camera Synthetic Training Data with Noise Models [1.6385815610837167]
本研究の目的は,3次元撮影データにおけるノイズの影響を,撮像プロセスのノイズをモデル化して評価することである。
我々は、ノイズモデルを得るために、特別に構築されたシーンのデータセットをコンパイルした。
具体的には、画像面における捕獲点の位置と軸方向の雑音に影響を及ぼす横方向雑音をモデル化し、画像面に対する軸方向の位置に影響を及ぼす。
論文 参考訳(メタデータ) (2024-02-26T11:50:42Z) - Synfeal: A Data-Driven Simulator for End-to-End Camera Localization [0.9749560288448114]
実世界の現実的な3次元再構成に基づいて,大規模な局所化データセットを合成するフレームワークを提案する。
我々のフレームワークであるSynfealは、リアルな3Dテクスチャメッシュを介して仮想カメラを移動させることで、RGB画像を合成するオープンソースのデータ駆動シミュレータである。
結果は、Synfealが生成したデータセットに対するカメラローカライゼーションアルゴリズムのトレーニングが、最先端の手法によって生成されたデータセットと比較して、より良い結果をもたらすことを検証した。
論文 参考訳(メタデータ) (2023-05-29T17:29:02Z) - Is synthetic data from generative models ready for image recognition? [69.42645602062024]
本研究では,最新のテキスト・画像生成モデルから生成した合成画像が,画像認識タスクにどのように利用できるかを検討した。
本稿では,既存の生成モデルからの合成データの強大さと欠点を示し,認識タスクに合成データを適用するための戦略を提案する。
論文 参考訳(メタデータ) (2022-10-14T06:54:24Z) - Towards Real-World Video Deblurring by Exploring Blur Formation Process [53.91239555063343]
近年、深層学習に基づくアプローチは、ビデオデブロアリングタスクにおいて有望な成功を収めている。
既存の合成データセットで訓練されたモデルは、現実世界のぼやけたシナリオよりも一般化の問題に悩まされている。
本稿では, RAW-Blur と呼ばれる, ぼかし生成の手がかりを生かして, 現実的なぼかし合成パイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-28T09:24:52Z) - Leveraging Deepfakes to Close the Domain Gap between Real and Synthetic
Images in Facial Capture Pipelines [8.366597450893456]
我々は、パーソナライズされたアプリ内ビデオデータから3次元顔モデルを構築し、追跡するためのエンドツーエンドパイプラインを提案する。
本稿では,従来のコンピュータグラフィックスパイプラインにおける衝突アルゴリズムに典型的な階層的クラスタリングフレームワークに基づく自動データキュレーションと検索手法を提案する。
我々は、前述の技術を活用して、現実の地上真実データの必要性を回避するために、モーションキャプチャ回帰器のトレーニング方法を概説する。
論文 参考訳(メタデータ) (2022-04-22T15:09:49Z) - IDR: Self-Supervised Image Denoising via Iterative Data Refinement [66.5510583957863]
本稿では,最先端のデノナイジング性能を実現するために,教師なしの実用的なデノナイジング手法を提案する。
本手法では, 1つのノイズ画像と1つのノイズモデルしか必要とせず, 実際の生画像に容易にアクセス可能である。
実世界のアプリケーションにおける生画像復調性能を評価するため,500シーンのシーンを含む高品質な生画像データセットSenseNoise-500を構築した。
論文 参考訳(メタデータ) (2021-11-29T07:22:53Z) - Deep Denoising For Scientific Discovery: A Case Study In Electron
Microscopy [22.566600256820646]
本稿では,シミュレーションに基づくDenoising(SBD)フレームワークを提案し,シミュレーション画像に基づいてCNNを訓練する。
SBDは、シミュレーションされたベンチマークデータセットと実際のデータにおいて、既存のテクニックを幅広いマージンで上回る。
TEM画像の最初の公開ベンチマークデータセットをリリースし、18,000のサンプルを含む。
論文 参考訳(メタデータ) (2020-10-24T19:59:28Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - CycleISP: Real Image Restoration via Improved Data Synthesis [166.17296369600774]
本稿では,前向きと逆方向のカメラ画像パイプラインをモデル化するフレームワークを提案する。
リアルな合成データに基づいて新しい画像認識ネットワークをトレーニングすることにより、実際のカメラベンチマークデータセット上で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2020-03-17T15:20:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。