論文の概要: VibrantLeaves: A principled parametric image generator for training deep restoration models
- arxiv url: http://arxiv.org/abs/2504.10201v1
- Date: Mon, 14 Apr 2025 13:09:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-15 16:51:28.439857
- Title: VibrantLeaves: A principled parametric image generator for training deep restoration models
- Title(参考訳): VibrantLeaves: 深部修復モデルのトレーニングのための原理的パラメトリック画像生成装置
- Authors: Raphael Achddou, Yann Gousseau, Saïd Ladjal, Sabine Süsstrunk,
- Abstract要約: 画像復元作業のための合成画像生成器を提案する。
我々は、幾何学的モデリング、テクスチャ、画像取得の簡易なモデリングに焦点を当てる。
標準的な画像復号化と超高解像度ネットワークは、そのようなデータセットでトレーニングすることができ、自然な画像データセットでのトレーニングとほぼ同等のパフォーマンスを達成できる。
- 参考スコア(独自算出の注目度): 19.405806464269126
- License:
- Abstract: Even though Deep Neural Networks are extremely powerful for image restoration tasks, they have several limitations. They are poorly understood and suffer from strong biases inherited from the training sets. One way to address these shortcomings is to have a better control over the training sets, in particular by using synthetic sets. In this paper, we propose a synthetic image generator relying on a few simple principles. In particular, we focus on geometric modeling, textures, and a simple modeling of image acquisition. These properties, integrated in a classical Dead Leaves model, enable the creation of efficient training sets. Standard image denoising and super-resolution networks can be trained on such datasets, reaching performance almost on par with training on natural image datasets. As a first step towards explainability, we provide a careful analysis of the considered principles, identifying which image properties are necessary to obtain good performances. Besides, such training also yields better robustness to various geometric and radiometric perturbations of the test sets.
- Abstract(参考訳): Deep Neural Networksは、画像復元タスクには非常に強力だが、いくつかの制限がある。
彼らはあまり理解されておらず、トレーニングセットから受け継いだ強いバイアスに悩まされている。
これらの欠点に対処する1つの方法は、特に合成セットを使用することで、トレーニングセットをよりよく制御することである。
本稿では,いくつかの簡単な原理に基づく合成画像生成手法を提案する。
特に、幾何学的モデリング、テクスチャ、画像取得の簡易なモデリングに焦点を当てる。
これらの特性は古典的な死葉モデルに統合され、効率的なトレーニングセットの作成を可能にする。
標準的な画像復号化と超高解像度ネットワークは、そのようなデータセットでトレーニングすることができ、自然な画像データセットでのトレーニングとほぼ同等のパフォーマンスを達成できる。
説明可能性への第一歩として、優れた性能を得るためにどの画像特性が必要なのかを識別し、考慮された原則を慎重に分析する。
さらに、このようなトレーニングは、テストセットの様々な幾何学的および放射的摂動に対して、より堅牢性をもたらす。
関連論文リスト
- Towards Unsupervised Blind Face Restoration using Diffusion Prior [12.69610609088771]
ブラインド顔復元法は、教師付き学習による大規模合成データセットの訓練において、顕著な性能を示した。
これらのデータセットは、手作りの画像分解パイプラインで、低品質の顔イメージをシミュレートすることによって生成されることが多い。
本稿では, 入力画像の集合のみを用いて, 劣化が不明で, 真理の目標がない場合にのみ, 復元モデルの微調整を行うことにより, この問題に対処する。
我々の最良のモデルは、合成と実世界の両方のデータセットの最先端の結果も達成します。
論文 参考訳(メタデータ) (2024-10-06T20:38:14Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - TexPose: Neural Texture Learning for Self-Supervised 6D Object Pose
Estimation [55.94900327396771]
合成データから6次元オブジェクトポーズ推定のためのニューラルネットワークによるテクスチャ学習を提案する。
実画像からオブジェクトの現実的なテクスチャを予測することを学ぶ。
画素完全合成データからポーズ推定を学習する。
論文 参考訳(メタデータ) (2022-12-25T13:36:32Z) - Residual Back Projection With Untrained Neural Networks [1.2707050104493216]
CT(Computed tomography)における反復的再構成(IR)の枠組みについて述べる。
我々のフレームワークは、この構造情報をDIP(Deep Image Prior)として組み込んでいる。
対象関数を最小限に抑え,高精度な再構成を実現するために,未学習のU-netと新たな後方投射を併用して提案する。
論文 参考訳(メタデータ) (2022-10-26T01:58:09Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - Counterfactual Generative Networks [59.080843365828756]
画像生成過程を直接監督せずに訓練する独立した因果機構に分解することを提案する。
適切な誘導バイアスを活用することによって、これらのメカニズムは物体の形状、物体の質感、背景を解き放つ。
その結果, 偽画像は, 元の分類タスクにおける性能の低下を伴い, 分散性が向上することが示された。
論文 参考訳(メタデータ) (2021-01-15T10:23:12Z) - Intrinsic Autoencoders for Joint Neural Rendering and Intrinsic Image
Decomposition [67.9464567157846]
合成3Dモデルからリアルな画像を生成するためのオートエンコーダを提案し,同時に実像を本質的な形状と外観特性に分解する。
実験により, レンダリングと分解の併用処理が有益であることが確認され, 画像から画像への翻訳の質的, 定量的なベースラインよりも優れた結果が得られた。
論文 参考訳(メタデータ) (2020-06-29T12:53:58Z) - Compressive sensing with un-trained neural networks: Gradient descent
finds the smoothest approximation [60.80172153614544]
訓練されていない畳み込みニューラルネットワークは、画像の回復と復元に非常に成功したツールとして登場した。
トレーニングされていない畳み込みニューラルネットワークは、ほぼ最小限のランダムな測定値から、十分に構造化された信号や画像を概ね再構成可能であることを示す。
論文 参考訳(メタデータ) (2020-05-07T15:57:25Z) - Self-supervised Fine-tuning for Correcting Super-Resolution
Convolutional Neural Networks [17.922507191213494]
完全自己教師型微調整アプローチにより、SR結果のトレーニングや修正を回避できることが示される。
我々は,複数の画像とビデオのSR CNNに微調整アルゴリズムを適用し,準最適SR解に対して精度良く修正可能であることを示す。
論文 参考訳(メタデータ) (2019-12-30T11:02:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。