論文の概要: Generalized Rectifier Wavelet Covariance Models For Texture Synthesis
- arxiv url: http://arxiv.org/abs/2203.07902v1
- Date: Mon, 14 Mar 2022 17:07:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-19 12:02:37.059078
- Title: Generalized Rectifier Wavelet Covariance Models For Texture Synthesis
- Title(参考訳): テクスチャ合成のための一般化整流ウェーブレット共分散モデル
- Authors: Antoine Brochard, Sixin Zhang, St\'ephane Mallat
- Abstract要約: 畳み込みニューラルネットワーク(CNN)で定義された画像表現に依存する統計からテクスチャ合成のための最先端の最大エントロピーモデルを構築する。
我々は,非線形ウェーブレットに基づく表現に基づく統計学のファミリを提案し,これを一般化された非線形性を用いて一層CNNの特定の例と見なすことができる。
これらの統計は、従来のウェーブレットベースのモデルの視覚的品質を大幅に改善し、グレースケールとカラーテクスチャの両方で、最先端のモデルと類似した品質の合成を作成できる。
- 参考スコア(独自算出の注目度): 2.585403833659771
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: State-of-the-art maximum entropy models for texture synthesis are built from
statistics relying on image representations defined by convolutional neural
networks (CNN). Such representations capture rich structures in texture images,
outperforming wavelet-based representations in this regard. However, conversely
to neural networks, wavelets offer meaningful representations, as they are
known to detect structures at multiple scales (e.g. edges) in images. In this
work, we propose a family of statistics built upon non-linear wavelet based
representations, that can be viewed as a particular instance of a one-layer
CNN, using a generalized rectifier non-linearity. These statistics
significantly improve the visual quality of previous classical wavelet-based
models, and allow one to produce syntheses of similar quality to
state-of-the-art models, on both gray-scale and color textures.
- Abstract(参考訳): テクスチャ合成のための最先端の最大エントロピーモデルは、畳み込みニューラルネットワーク(CNN)によって定義された画像表現に依存する統計から構築される。
このような表現はテクスチャイメージのリッチな構造をキャプチャし、この点においてウェーブレットベースの表現を上回っている。
しかし、ニューラルネットワークとは逆に、ウェーブレットは画像内の複数のスケール(エッジなど)で構造を検出することで知られているように、有意義な表現を提供する。
本研究では,非線形ウェーブレットベース表現に基づく統計学のファミリを提案し,これを一般化整流器の非線形性を用いて一層CNNの特定の例と見なすことができる。
これらの統計は、従来のウェーブレットベースのモデルの視覚的品質を大幅に改善し、グレースケールとカラーテクスチャの両方で、最先端のモデルと類似した品質の合成を作成できる。
関連論文リスト
- Bayesian Inverse Graphics for Few-Shot Concept Learning [3.475273727432576]
最小限のデータのみを用いて学習するベイズ的知覚モデルを提案する。
本稿では、この表現が、数ショットの分類や推定などの下流タスクにどのように使用できるかを示す。
論文 参考訳(メタデータ) (2024-09-12T18:30:41Z) - Grounding and Enhancing Grid-based Models for Neural Fields [52.608051828300106]
本稿では,グリッドモデルに関する理論的枠組みを紹介する。
このフレームワークは、これらのモデルの近似と一般化の挙動がグリッド接カーネル(GTK)によって決定されることを指摘している。
導入されたフレームワークは、Multiplicative Fourier Adaptive Grid(MulFAGrid)と呼ばれる新しいグリッドベースモデルの開発を動機付けている。
論文 参考訳(メタデータ) (2024-03-29T06:33:13Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Capturing dynamical correlations using implicit neural representations [85.66456606776552]
実験データから未知のパラメータを復元するために、モデルハミルトンのシミュレーションデータを模倣するために訓練されたニューラルネットワークと自動微分を組み合わせた人工知能フレームワークを開発する。
そこで本研究では, 実時間から多次元散乱データに適用可能な微分可能なモデルを1回だけ構築し, 訓練する能力について述べる。
論文 参考訳(メタデータ) (2023-04-08T07:55:36Z) - Learning multi-scale local conditional probability models of images [7.07848787073901]
ディープニューラルネットワークは、最近のスコアベース拡散法で得られた高品質な世代によって証明されたように、画像の強力な事前確率モデルを学ぶことができる。
しかし、これらのネットワークが複雑なグローバルな統計構造をとらえる手段は、明らかに次元の呪いに苦しむことなく、謎のままだ。
我々は拡散法を多スケール分解に取り入れ、粗大係数に条件付きウェーブレット係数の定常局所マルコフモデルを仮定することにより次元性を減少させる。
論文 参考訳(メタデータ) (2023-03-06T09:23:14Z) - DeepDC: Deep Distance Correlation as a Perceptual Image Quality
Evaluator [53.57431705309919]
ImageNet Pre-trained Deep Neural Network (DNN)は、効果的な画像品質評価(IQA)モデルを構築するための顕著な転送性を示す。
我々は,事前学習DNN機能のみに基づく新しいフル参照IQA(FR-IQA)モデルを開発した。
5つの標準IQAデータセット上で,提案した品質モデルの優位性を示すため,包括的実験を行った。
論文 参考訳(メタデータ) (2022-11-09T14:57:27Z) - Neural Implicit Representations for Physical Parameter Inference from a Single Video [49.766574469284485]
本稿では,外見モデルのためのニューラル暗黙表現と,物理現象をモデル化するためのニューラル常微分方程式(ODE)を組み合わせることを提案する。
提案モデルでは,大規模なトレーニングデータセットを必要とする既存のアプローチとは対照的に,単一のビデオから物理的パラメータを識別することが可能になる。
ニューラル暗示表現を使用することで、高解像度ビデオの処理とフォトリアリスティック画像の合成が可能になる。
論文 参考訳(メタデータ) (2022-04-29T11:55:35Z) - An Efficient Pattern Mining Convolution Neural Network (CNN) algorithm
with Grey Wolf Optimization (GWO) [0.0]
本稿では,CPWT(Convoluted Pattern of Wavelet Transform)特徴ベクトルに基づくCNNを用いた特徴解析手法を提案する。
従来の最先端手法と比較することにより,提案手法の性能を検証することができる。
論文 参考訳(メタデータ) (2022-04-10T15:18:42Z) - Texture synthesis via projection onto multiscale, multilayer statistics [0.0]
マルチスケール多層特徴抽出器に基づくテクスチャ合成の新しいモデルを提案する。
本稿では,本モデルで使用する異なる種類のウェーブレットフィルタの必要性と,画像合成における多層構造の有用性について説明する。
論文 参考訳(メタデータ) (2021-05-22T23:32:34Z) - Probabilistic Graph Attention Network with Conditional Kernels for
Pixel-Wise Prediction [158.88345945211185]
本稿では,画素レベルの予測を基本的側面,すなわち,技術の現状を推し進める新たなアプローチを提案する。
構造化されたマルチスケール機能学習と融合。
本論文では,マルチスケール表現を原理的に学習・融合するための新しいアテンテンションゲート条件ランダムフィールド(AG-CRFs)モデルに基づく確率的グラフアテンションネットワーク構造を提案する。
論文 参考訳(メタデータ) (2021-01-08T04:14:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。