Fugu-MT 論文翻訳(概要): Texture synthesis via projection onto multiscale, multilayer statistics

論文の概要: Texture synthesis via projection onto multiscale, multilayer statistics

arxiv url: http://arxiv.org/abs/2105.10825v1
Date: Sat, 22 May 2021 23:32:34 GMT
ステータス: 翻訳完了
システム内更新日: 2021-05-25 15:16:26.340123
Title: Texture synthesis via projection onto multiscale, multilayer statistics
Title（参考訳）: マルチスケール多層統計への投影によるテクスチャー合成
Authors: Jieqian He and Matthew Hirn
Abstract要約: マルチスケール多層特徴抽出器に基づくテクスチャ合成の新しいモデルを提案する。本稿では,本モデルで使用する異なる種類のウェーブレットフィルタの必要性と,画像合成における多層構造の有用性について説明する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We provide a new model for texture synthesis based on a multiscale, multilayer feature extractor. Within the model, textures are represented by a set of statistics computed from ReLU wavelet coefficients at different layers, scales and orientations. A new image is synthesized by matching the target statistics via an iterative projection algorithm. We explain the necessity of the different types of pre-defined wavelet filters used in our model and the advantages of multilayer structures for image synthesis. We demonstrate the power of our model by generating samples of high quality textures and providing insights into deep representations for texture images.
Abstract（参考訳）: マルチスケール多層特徴抽出器に基づくテクスチャ合成のための新しいモデルを提案する。モデル内のテクスチャは、異なる層のReLUウェーブレット係数、スケール、配向から計算された統計によって表される。反復射影アルゴリズムにより、対象の統計値に一致して新しい画像が合成される。本稿では,本モデルで使用するウェーブレットフィルタの異なる種類の必要性と,画像合成における多層構造の利点について述べる。高品質なテクスチャのサンプルを生成し,テクスチャ画像の深い表現に対する洞察を提供することで,モデルのパワーを実証する。

関連論文リスト

Dataset Distillation with Probabilistic Latent Features [9.318549327568695]
合成データのコンパクトなセットは、下流の分類タスクにおける元のデータセットを効果的に置き換えることができる。本稿では,潜在特徴の共分散をモデル化する新しい手法を提案する。提案手法は,バックボーンアーキテクチャにまたがる最先端のクロスアーキテクチャ性能を実現する。
論文参考訳（メタデータ） (2025-05-10T13:53:49Z)
Infinite Texture: Text-guided High Resolution Diffusion Texture Synthesis [61.189479577198846]
Infinite Textureはテキストプロンプトから任意の大きさのテクスチャ画像を生成する方法である。本手法は,1つのテクスチャ上に拡散モデルを微調整し,その分布をモデルの出力領域に埋め込むことを学習する。 1つのGPU上で任意の解像度の出力テクスチャ画像を生成するためのスコアアグリゲーションストラテジーによって、我々の微調整拡散モデルが生成される。
論文参考訳（メタデータ） (2024-05-13T21:53:09Z)
SAMPLING: Scene-adaptive Hierarchical Multiplane Images Representation for Novel View Synthesis from a Single Image [60.52991173059486]
単一画像からの新規ビュー合成のためのシーン適応型階層型多面体画像表現であるSAMPlingを紹介する。提案手法は,KITTIデータセット上の単一画像を用いて,大規模非有界屋外シーンにおいてかなりの性能向上を示す。
論文参考訳（メタデータ） (2023-09-12T15:33:09Z)
Learning in a Single Domain for Non-Stationary Multi-Texture Synthesis [9.213030142986417]
非定常テクスチャは大規模な分散を持ち、1つのモデルではほとんど合成できない。様々なスケールの構造パターンを捕捉し,テクスチャを低コストで効果的に合成するマルチスケールジェネレータを提案する。特定のドメインのテクスチャパターンの学習に焦点をあてるカテゴリ特化学習戦略を提案する。
論文参考訳（メタデータ） (2023-05-10T14:32:21Z)
DiVAE: Photorealistic Images Synthesis with Denoising Diffusion Decoder [73.1010640692609]
本稿では,拡散デコーダ(DiVAE)を用いたVQ-VAEアーキテクチャモデルを提案する。我々のモデルは最先端の成果を達成し、さらに多くのフォトリアリスティックな画像を生成する。
論文参考訳（メタデータ） (2022-06-01T10:39:12Z)
RTMV: A Ray-Traced Multi-View Synthetic Dataset for Novel View Synthesis [104.53930611219654]
約2000の複雑なシーンからレンダリングされた300k画像からなる,新しいビュー合成のための大規模合成データセットを提案する。データセットは、新しいビュー合成のための既存の合成データセットよりも桁違いに大きい。高品質な3Dメッシュの4つのソースを使用して、私たちのデータセットのシーンは、カメラビュー、照明、形状、材料、テクスチャの難しいバリエーションを示します。
論文参考訳（メタデータ） (2022-05-14T13:15:32Z)
Multiscale Analysis for Improving Texture Classification [62.226224120400026]
本稿では,テクスチャの異なる空間周波数帯域を別々に扱うために,ガウス・ラプラシアピラミッドを用いる。バイオインスパイアされたテクスチャ記述子,情報理論測度,灰色レベルの共起行列特徴,ハリリック統計特徴から抽出した特徴を特徴ベクトルに集約した。
論文参考訳（メタデータ） (2022-04-21T01:32:22Z)
Generalized Rectifier Wavelet Covariance Models For Texture Synthesis [2.585403833659771]
畳み込みニューラルネットワーク(CNN)で定義された画像表現に依存する統計からテクスチャ合成のための最先端の最大エントロピーモデルを構築する。我々は,非線形ウェーブレットに基づく表現に基づく統計学のファミリを提案し,これを一般化された非線形性を用いて一層CNNの特定の例と見なすことができる。これらの統計は、従来のウェーブレットベースのモデルの視覚的品質を大幅に改善し、グレースケールとカラーテクスチャの両方で、最先端のモデルと類似した品質の合成を作成できる。
論文参考訳（メタデータ） (2022-03-14T17:07:40Z)
A Generative Model for Texture Synthesis based on Optimal Transport between Feature Distributions [8.102785819558978]
任意の大きさの新しいテクスチャをオンザフライで合成できるフィードフォワードニューラルネットワークを、我々のフレームワークを使って学習する方法を示す。我々のフレームワークを使ってフィードフォワードニューラルネットワークを学習し、任意のサイズの新しいテクスチャを高速に合成する方法を示します。
論文参考訳（メタデータ） (2020-06-19T13:32:55Z)
Region-adaptive Texture Enhancement for Detailed Person Image Synthesis [86.69934638569815]
RATE-Netは、シャープなテクスチャで人物画像を合成するための新しいフレームワークである。提案するフレームワークは,テクスチャ強化モジュールを利用して,画像から外観情報を抽出する。 DeepFashionベンチマークデータセットで実施された実験は、既存のネットワークと比較して、我々のフレームワークの優位性を実証した。
論文参考訳（メタデータ） (2020-05-26T02:33:21Z)
Semantic Pyramid for Image Generation [41.85213024720986]
本稿では,事前学習した分類モデルから学習した深部特徴空間を利用した新しいGANモデルを提案する。古典的な画像ピラミッド表現に触発されて、我々はセマンティック・ジェネレーション・ピラミッドとしてモデルを構築した。
論文参考訳（メタデータ） (2020-03-13T12:23:37Z)
Contextual Encoder-Decoder Network for Visual Saliency Prediction [42.047816176307066]
本稿では,大規模な画像分類タスクに基づいて事前学習した畳み込みニューラルネットワークに基づくアプローチを提案する。得られた表現をグローバルなシーン情報と組み合わせて視覚的サリエンシを正確に予測する。最先端技術と比較して、このネットワークは軽量な画像分類バックボーンに基づいている。
論文参考訳（メタデータ） (2019-02-18T16:15:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。