論文の概要: Decomposer: Semi-supervised Learning of Image Restoration and Image
Decomposition
- arxiv url: http://arxiv.org/abs/2311.16829v1
- Date: Tue, 28 Nov 2023 14:48:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-29 18:21:11.457581
- Title: Decomposer: Semi-supervised Learning of Image Restoration and Image
Decomposition
- Title(参考訳): Decomposer: 画像復元と画像分解の半教師あり学習
- Authors: Boris Meinardus, Mariusz Trzeciakiewicz, Tim Herzig, Monika
Kwiatkowski, Simon Matern, Olaf Hellwich
- Abstract要約: 本稿では、歪み画像列を基本構造ブロックに分解する半教師付き再構成モデルを提案する。
我々は、多数の歪み画像列を提供するSIDARデータセットを使用する。
各歪みは、例えば加法ノイズや乗法ノイズなど、元の信号を異なる方法で変化させる。
- 参考スコア(独自算出の注目度): 2.702990676892003
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present Decomposer, a semi-supervised reconstruction model that decomposes
distorted image sequences into their fundamental building blocks - the original
image and the applied augmentations, i.e., shadow, light, and occlusions. To
solve this problem, we use the SIDAR dataset that provides a large number of
distorted image sequences: each sequence contains images with shadows,
lighting, and occlusions applied to an undistorted version. Each distortion
changes the original signal in different ways, e.g., additive or multiplicative
noise. We propose a transformer-based model to explicitly learn this
decomposition. The sequential model uses 3D Swin-Transformers for
spatio-temporal encoding and 3D U-Nets as prediction heads for individual parts
of the decomposition. We demonstrate that by separately pre-training our model
on weakly supervised pseudo labels, we can steer our model to optimize for our
ambiguous problem definition and learn to differentiate between the different
image distortions.
- Abstract(参考訳): Decomposerは、歪んだ画像列を基本構成ブロック(原画像と応用拡張、すなわち影、光、閉塞)に分解する半教師付き再構成モデルである。
この問題を解決するために、多くの歪んだ画像シーケンスを提供するSIDARデータセットを使用し、各シーケンスは、歪んだバージョンに適用された影、照明、オクルージョンを含む。
各歪みは元の信号を、例えば加算雑音や乗法雑音など、異なる方法で変化させる。
この分解を明示的に学習するトランスフォーマーモデルを提案する。
逐次モデルは時空間符号化に3D Swin-Transformerを使用し、分解の個々の部分の予測ヘッドとして3D U-Netを使用する。
我々は,弱教師付き擬似ラベル上でモデルを個別に事前学習することにより,あいまいな問題定義を最適化し,異なる画像歪みを区別することを学ぶことができることを実証する。
関連論文リスト
- Iteratively Refined Image Reconstruction with Learned Attentive Regularizers [14.93489065234423]
本稿では,ディープラーニングの力を活用した画像再構成のための正規化手法を提案する。
これは一連の凸問題の最小化に対応するためである。
解釈可能性、理論的保証、信頼性、パフォーマンスの両立を約束するバランスを提供します。
論文 参考訳(メタデータ) (2024-07-09T07:22:48Z) - Factorized Diffusion: Perceptual Illusions by Noise Decomposition [15.977340635967018]
拡散モデルサンプリングにより各成分を制御するゼロショット法を提案する。
そこで本手法は, コンポジション生成と空間制御に対する事前のアプローチを復元する。
実画像からハイブリッド画像を生成するために,我々のアプローチを拡張できることが示される。
論文 参考訳(メタデータ) (2024-04-17T17:59:59Z) - 3DMiner: Discovering Shapes from Large-Scale Unannotated Image Datasets [34.610546020800236]
3DMinerは、挑戦的なデータセットから3D形状をマイニングするためのパイプラインである。
本手法は最先端の教師なし3次元再構成技術よりもはるかに優れた結果が得られる。
LAION-5Bデータセットから得られる画像の形状を再構成することにより,3DMinerを組込みデータに適用する方法を示す。
論文 参考訳(メタデータ) (2023-10-29T23:08:19Z) - Improved Cryo-EM Pose Estimation and 3D Classification through Latent-Space Disentanglement [14.973360669658561]
本稿では,自己教師付き変分オートエンコーダアーキテクチャであるHetACUMNを提案する。
シミュレーションデータセットの結果,HetACUMNは,他のアモータイズ法や非アモータイズ法よりも正確なコンフォメーション分類が得られた。
論文 参考訳(メタデータ) (2023-08-09T13:41:30Z) - Zero-1-to-3: Zero-shot One Image to 3D Object [30.455300183998247]
単一のRGB画像のみを与えられたオブジェクトのカメラ視点を変更するためのフレームワークであるZero-1-to-3を紹介する。
条件拡散モデルは、合成データセットを用いて、相対カメラ視点の制御を学習する。
提案手法は,インターネット規模の事前学習を活用して,最先端の1次元3次元再構成と新しいビュー合成モデルよりも優れていた。
論文 参考訳(メタデータ) (2023-03-20T17:59:50Z) - Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。
2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文 参考訳(メタデータ) (2022-11-22T18:59:50Z) - Invertible Rescaling Network and Its Extensions [118.72015270085535]
本研究では,新たな視点から双方向の劣化と復元をモデル化する,新しい可逆的枠組みを提案する。
我々は、有効な劣化画像を生成し、失われたコンテンツの分布を変換する可逆モデルを開発する。
そして、ランダムに描画された潜在変数とともに、生成された劣化画像に逆変換を適用することにより、復元可能とする。
論文 参考訳(メタデータ) (2022-10-09T06:58:58Z) - NeuralReshaper: Single-image Human-body Retouching with Deep Neural
Networks [50.40798258968408]
本稿では,深部生成ネットワークを用いた単一画像における人体の意味的再構成手法であるNeuralReshaperを提案する。
われわれのアプローチは、まずパラメトリックな3次元人間モデルと元の人間の画像とを適合させるフィッティング・セイン・リフォーム・パイプラインに従う。
ペアデータが存在しないデータ不足に対処するために,ネットワークをトレーニングするための新たな自己教師型戦略を導入する。
論文 参考訳(メタデータ) (2022-03-20T09:02:13Z) - Differentiable Rendering with Perturbed Optimizers [85.66675707599782]
2Dイメージプロジェクションから3Dシーンを推論することは、コンピュータビジョンにおける中核的な問題の一つだ。
我々の研究は、よく知られた微分可能な定式化とランダムなスムーズなレンダリングの関連性を強調している。
提案手法を3次元シーン再構成に適用し,その利点を6次元ポーズ推定と3次元メッシュ再構成の課題に適用した。
論文 参考訳(メタデータ) (2021-10-18T08:56:23Z) - Shelf-Supervised Mesh Prediction in the Wild [54.01373263260449]
本研究では,物体の3次元形状とポーズを1つの画像から推定する学習手法を提案する。
まず、カメラのポーズとともに、標準フレーム内の体積表現を推定する。
粗い体積予測はメッシュベースの表現に変換され、予測されたカメラフレームでさらに洗練される。
論文 参考訳(メタデータ) (2021-02-11T18:57:10Z) - Image GANs meet Differentiable Rendering for Inverse Graphics and
Interpretable 3D Neural Rendering [101.56891506498755]
異なるレンダリングによって、ニューラルネットワークをトレーニングして"逆グラフィックス"タスクを実行する方法が舗装された。
提案手法は,既存のデータセットでトレーニングした最先端の逆グラフネットワークを著しく上回ることを示す。
論文 参考訳(メタデータ) (2020-10-18T22:29:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。