Fugu-MT 論文翻訳(概要): Intelligent Painter: Picture Composition With Resampling Diffusion Model

論文の概要: Intelligent Painter: Picture Composition With Resampling Diffusion Model

arxiv url: http://arxiv.org/abs/2210.17106v1
Date: Mon, 31 Oct 2022 07:27:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-01 17:43:29.842455
Title: Intelligent Painter: Picture Composition With Resampling Diffusion Model
Title（参考訳）: インテリジェント・ペインティング:拡散モデルを用いた画像合成
Authors: Wing-Fung Ku, Wan-Chi Siu, Xi Cheng, H. Anthony Chan
Abstract要約: 本稿では,人物の想像的シーンを1行に生成するインテリジェントな画家について,明確なヒントを与える。本稿では,拡散確率モデル (DDPM) の再構成手法を提案する。実験結果から,本手法は効率よく生成した出力の意味を選好し,ぼやけた出力を生成する。
参考スコア（独自算出の注目度）: 19.47897338375392
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Have you ever thought that you can be an intelligent painter? This means that you can paint a picture with a few expected objects in mind, or with a desirable scene. This is different from normal inpainting approaches for which the location of specific objects cannot be determined. In this paper, we present an intelligent painter that generate a person's imaginary scene in one go, given explicit hints. We propose a resampling strategy for Denoising Diffusion Probabilistic Model (DDPM) to intelligently compose harmonized scenery images by injecting explicit landmark inputs at specific locations. By exploiting the diffusion property, we resample efficiently to produce realistic images. Experimental results show that our resampling method favors the semantic meaning of the generated output efficiently and generate less blurry output. Quantitative analysis of image quality assessment shows that our method produces higher perceptual quality images compared with the state-of-the-art methods.
Abstract（参考訳）: あなたは知的な画家になれると思ったことがありますか? これは、いくつかの期待されるオブジェクトを念頭に置いて、あるいは望ましいシーンで絵を描くことができることを意味する。これは、特定のオブジェクトの位置を決定できない通常のペイントアプローチとは異なる。本稿では,ある人物の想像上の場面を一行で生成する知的画家について,明示的なヒントを与える。本研究では,特定の場所で明示的なランドマーク入力を注入することにより,高調波画像を構成するための拡散確率モデル(DDPM)の再サンプリング手法を提案する。拡散特性を利用して効率よく再サンプリングし,現実的な画像を生成する。実験結果から,本手法は効率よく生成した出力の意味を選好し,ぼやけた出力を生成する。画像品質評価の定量的解析は,最先端の手法と比較して高い知覚的品質画像を生成することを示す。

関連論文リスト

Emergence of Painting Ability via Recognition-Driven Evolution [49.666177849272856]
脳卒中枝とパレット枝を併用したモデルを提案する。マシンビジョンで達成した認識精度を計測することにより、視覚コミュニケーションの効率を定量化する。実験結果から,本モデルは高次認識タスクにおいて優れた性能を発揮することが示された。
論文参考訳（メタデータ） (2025-01-09T04:37:31Z)
PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文参考訳（メタデータ） (2024-10-29T11:49:39Z)
Coarse-to-Fine Latent Diffusion for Pose-Guided Person Image Synthesis [65.7968515029306]
PGPIS(Pose-Guided Person Image Synthesis)のためのCFLD(Coarse-to-Fine Latent Diffusion)法を提案する。認識修正デコーダは、学習可能なクエリの集合を段階的に洗練し、粗いプロンプトとして人物画像の意味的理解を抽出するように設計されている。
論文参考訳（メタデータ） (2024-02-28T06:07:07Z)
Intrinsic Image Diffusion for Indoor Single-view Material Estimation [55.276815106443976]
室内シーンの外観分解のための生成モデルIntrinsic Image Diffusionを提案する。 1つの入力ビューから、アルベド、粗さ、および金属地図として表される複数の材料説明をサンプリングする。提案手法は,PSNRで1.5dB$,アルベド予測で45%のFIDスコアを達成し,よりシャープで,より一貫性があり,より詳細な資料を生成する。
論文参考訳（メタデータ） (2023-12-19T15:56:19Z)
Deep Richardson-Lucy Deconvolution for Low-Light Image Deblurring [48.80983873199214]
我々は,飽和画素を学習潜時マップでモデル化するデータ駆動型手法を開発した。新しいモデルに基づいて、非盲検除色タスクを最大後部(MAP)問題に定式化することができる。増幅されたアーティファクトを使わずに高品質な劣化画像を推定するために,我々は事前推定ネットワークを構築した。
論文参考訳（メタデータ） (2023-08-10T12:53:30Z)
Person Image Synthesis via Denoising Diffusion Model [116.34633988927429]
本研究では,高忠実度人物画像合成に拡散モデルをいかに応用できるかを示す。 2つの大規模ベンチマークとユーザスタディの結果は、挑戦的なシナリオ下で提案したアプローチのフォトリアリズムを実証している。
論文参考訳（メタデータ） (2022-11-22T18:59:50Z)
An Analysis of Generative Methods for Multiple Image Inpainting [4.234843176066354]
塗り絵は、観察者が検出できない方法で、欠落した領域のイメージを復元することを指す。我々は,多彩なインペイントのための学習に基づく画像補完手法に着目する。
論文参考訳（メタデータ） (2022-05-04T15:54:08Z)
EdiBERT, a generative model for image editing [12.605607949417033]
EdiBERTは、ベクトル量子化オートエンコーダによって構築された離散潜在空間で訓練された双方向変換器である。結果のモデルが,多種多様なタスクにおける最先端のパフォーマンスと一致することを示す。
論文参考訳（メタデータ） (2021-11-30T10:23:06Z)
Image Completion via Inference in Deep Generative Models [16.99337751292915]
画像生成モデルにおける償却推論の観点から画像完成を検討する。 CIFAR-10およびFFHQ-256データセットの先行技術と比較して、優れたサンプル品質と多様性を示します。
論文参考訳（メタデータ） (2021-02-24T02:59:43Z)
High-Resolution Image Inpainting with Iterative Confidence Feedback and Guided Upsampling [122.06593036862611]
既存の画像塗装法は、実アプリケーションで大きな穴を扱う際に、しばしばアーティファクトを生成する。本稿では,フィードバック機構を備えた反復インペイント手法を提案する。実験により,本手法は定量評価と定性評価の両方において既存手法よりも有意に優れていた。
論文参考訳（メタデータ） (2020-05-24T13:23:45Z)
The Maximum Entropy on the Mean Method for Image Deblurring [4.4518351404598375]
Image deblurringは、不適切な逆問題として悪名高い。本稿では、画像空間上の確率分布のレベルにおいて、正規化に向けてパラダイムをシフトする別のアプローチを提案する。本手法は,画像の確率密度関数のレベルで作業する平均エントロピーの最大値に基づく。
論文参考訳（メタデータ） (2020-02-24T18:30:40Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。