論文の概要: Generative networks as inverse problems with fractional wavelet
scattering networks
- arxiv url: http://arxiv.org/abs/2007.14177v1
- Date: Tue, 28 Jul 2020 12:58:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-06 02:57:02.900824
- Title: Generative networks as inverse problems with fractional wavelet
scattering networks
- Title(参考訳): 分数ウェーブレット散乱ネットワークにおける逆問題としての生成ネットワーク
- Authors: Jiasong Wu, Jing Zhang, Fuzhi Wu, Youyong Kong, Guanyu Yang, Lotfi
Senhadji, Huazhong Shu
- Abstract要約: Generative Adversarial Networks (GANs) と Variational Auto-Encoders (VAEs) は、ガウスホワイトノイズによる印象的な画像生成を提供する。
GANとVAEは、ジェネレータ(またはエンコーダ)とディスクリミネータ(またはデコーダ)を同時に訓練する必要があるため、トレーニングが難しい。
本稿では、より表現力のある分数ウェーブレット散乱ネットワーク(FrScatNets)をエンコーダとして使用するGFRSN(Generative Fractional Scattering Networks)を提案する。
- 参考スコア(独自算出の注目度): 12.008247352154449
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Deep learning is a hot research topic in the field of machine learning
methods and applications. Generative Adversarial Networks (GANs) and
Variational Auto-Encoders (VAEs) provide impressive image generations from
Gaussian white noise, but both of them are difficult to train since they need
to train the generator (or encoder) and the discriminator (or decoder)
simultaneously, which is easy to cause unstable training. In order to solve or
alleviate the synchronous training difficult problems of GANs and VAEs,
recently, researchers propose Generative Scattering Networks (GSNs), which use
wavelet scattering networks (ScatNets) as the encoder to obtain the features
(or ScatNet embeddings) and convolutional neural networks (CNNs) as the decoder
to generate the image. The advantage of GSNs is the parameters of ScatNets are
not needed to learn, and the disadvantage of GSNs is that the expression
ability of ScatNets is slightly weaker than CNNs and the dimensional reduction
method of Principal Component Analysis (PCA) is easy to lead overfitting in the
training of GSNs, and therefore affect the generated quality in the testing
process. In order to further improve the quality of generated images while keep
the advantages of GSNs, this paper proposes Generative Fractional Scattering
Networks (GFRSNs), which use more expressive fractional wavelet scattering
networks (FrScatNets) instead of ScatNets as the encoder to obtain the features
(or FrScatNet embeddings) and use the similar CNNs of GSNs as the decoder to
generate the image. Additionally, this paper develops a new dimensional
reduction method named Feature-Map Fusion (FMF) instead of PCA for better
keeping the information of FrScatNets and the effect of image fusion on the
quality of image generation is also discussed.
- Abstract(参考訳): ディープラーニングは、機械学習手法とアプリケーション分野におけるホットな研究トピックである。
generative adversarial network (gans) と variational auto-encoder (vaes) はガウスのホワイトノイズからの印象的な画像生成を提供するが、どちらも発電機(またはエンコーダ)と判別器(またはデコーダ)を同時に訓練する必要があるため、訓練は困難であり、不安定なトレーニングを引き起こす。
GANとVAEの同期トレーニングの難しさを解消または緩和するために、研究者は最近、ウェーブレット散乱ネットワーク(ScatNet)をエンコーダとして使用し、画像を生成するデコーダとして機能(ScatNet埋め込み)と畳み込みニューラルネットワーク(CNN)を得るジェネレーティブ散乱ネットワーク(GSN)を提案する。
GSNsの利点は、ScatNetsのパラメータを学習する必要がなく、GSNsの欠点は、ScatNetsの表現能力がCNNよりもわずかに弱く、主成分分析(PCA)の次元還元法はGSNのトレーニングにおいて過度に適合しやすく、したがってテストプロセスにおける生成品質に影響を与えることである。
本稿では,gsnsの利点を保ちつつ生成画像の品質をさらに向上させるため,スキャットネットの代わりにより表現豊かに分数的なウェーブレット散乱ネットワーク(frscatnets)を用いて特徴(frscatnet embeddeds)を取得し,gsnsの類似cnnをデコーダとして画像を生成するジェネレイティブ分数散乱ネットワーク(gfrsns)を提案する。
さらに,frscatnetsの情報を保持するため,pcaの代わりに機能マップ融合 (fmf) と呼ばれる新しい次元縮小法を開発し,画像融合が画像生成品質に与える影響についても検討した。
関連論文リスト
- A cross Transformer for image denoising [83.68175077524111]
直列ブロック(SB)、並列ブロック(PB)、残留ブロック(RB)を備えたクロストランスフォーマー(CTNet)を提案する。
CTNetは、実画像や合成画像のデノナイジングにおいて、一般的なデノナイジング法よりも優れている。
論文 参考訳(メタデータ) (2023-10-16T13:53:19Z) - PottsMGNet: A Mathematical Explanation of Encoder-Decoder Based Neural
Networks [7.668812831777923]
アルゴリズムの観点から,エンコーダ・デコーダに基づくネットワークアーキテクチャについて検討する。
画像分割には2相ポッツモデルを用いる。
離散的なPottsMGNetはエンコーダ-デコーダベースネットワークと等価であることを示す。
論文 参考訳(メタデータ) (2023-07-18T07:48:48Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Signal Processing for Implicit Neural Representations [80.38097216996164]
Inlicit Neural Representation (INR)は、マルチ層パーセプトロンを介して連続したマルチメディアデータを符号化する。
既存の作業は、その離散化されたインスタンスの処理を通じて、そのような連続的な表現を操作する。
本稿では,INSP-Netと呼ばれる暗黙的ニューラル信号処理ネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-17T06:29:07Z) - NAF: Neural Attenuation Fields for Sparse-View CBCT Reconstruction [79.13750275141139]
本稿では,スパースビューCBCT再構成のための新規かつ高速な自己教師型ソリューションを提案する。
所望の減衰係数は、3次元空間座標の連続関数として表現され、完全に接続されたディープニューラルネットワークによってパラメータ化される。
ハッシュ符号化を含む学習ベースのエンコーダが採用され、ネットワークが高周波の詳細をキャプチャするのに役立つ。
論文 参考訳(メタデータ) (2022-09-29T04:06:00Z) - Unsupervised Denoising of Optical Coherence Tomography Images with
Dual_Merged CycleWGAN [3.3909577600092122]
そこで我々は,網膜CT画像復調のためのDual-Merged Cycle-WGANと呼ばれる新しいサイクル一貫性生成適応ネットを提案する。
本モデルでは,2つのCycle-GANネットワークとデクリミネータとワッセルシュタイン損失を併用して,優れたトレーニング安定性と性能を実現する。
論文 参考訳(メタデータ) (2022-05-02T07:38:19Z) - Reducing Redundancy in the Bottleneck Representation of the Autoencoders [98.78384185493624]
オートエンコーダは教師なしニューラルネットワークの一種であり、様々なタスクを解くのに使用できる。
本稿では,ボトルネック表現における特徴冗長性を明示的に罰する手法を提案する。
我々は,3つの異なるデータセットを用いた次元削減,MNISTデータセットを用いた画像圧縮,ファッションMNISTを用いた画像デノナイズという,さまざまなタスクにまたがってアプローチを検証した。
論文 参考訳(メタデータ) (2022-02-09T18:48:02Z) - Learning Frequency-aware Dynamic Network for Efficient Super-Resolution [56.98668484450857]
本稿では、離散コサイン変換(dct)領域の係数に応じて入力を複数の部分に分割する新しい周波数認識動的ネットワークについて検討する。
実際、高周波部は高価な操作で処理され、低周波部は計算負荷を軽減するために安価な操作が割り当てられる。
ベンチマークSISRモデルおよびデータセット上での実験は、周波数認識動的ネットワークが様々なSISRニューラルネットワークに使用できることを示している。
論文 参考訳(メタデータ) (2021-03-15T12:54:26Z) - LCA-Net: Light Convolutional Autoencoder for Image Dehazing [1.433758865948252]
画像のデハジングは、画像の視覚的魅力を改善するために、ヘイズによって生じる不整合ノイズを取り除くために重要な画像前処理タスクである。
提案する汎用モデルは,大気モデルに依存しない非常に軽量な畳み込みエンコーダ・デコーダネットワークを用いている。
このネットワークは、画像品質の面で最先端の手法に匹敵する、いくつかの標準データセットにおいて、より高速に最適なデハージング性能を達成する。
論文 参考訳(メタデータ) (2020-08-24T11:20:52Z) - iSeeBetter: Spatio-temporal video super-resolution using recurrent
generative back-projection networks [0.0]
ビデオ超解像(VSR)に対する新しいGANに基づく構造時間的アプローチiSeeBetterを提案する。
iSeeBetterは、リカレントバックプロジェクションネットワークをジェネレータとして使用して、現在のフレームと隣接するフレームから時空間情報を抽出する。
以上の結果から,iSeeBetterはVSRの忠実度に優れ,最先端の性能に勝ることを示した。
論文 参考訳(メタデータ) (2020-06-13T01:36:30Z) - The Neural Tangent Link Between CNN Denoisers and Non-Local Filters [4.254099382808598]
畳み込みニューラルネットワーク(CNN)は現在、計算画像問題を解決するための確立されたツールである。
ニューラルネットワークタンジェント(NTK)とよく知られた非局所フィルタリング技術によるネットワーク間の公式なリンクを導入する。
本研究は,広範囲な画像復号化実験により評価した。
論文 参考訳(メタデータ) (2020-06-03T16:50:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。