論文の概要: Wavelet Packet Power Spectrum Kullback-Leibler Divergence: A New Metric
for Image Synthesis
- arxiv url: http://arxiv.org/abs/2312.15289v1
- Date: Sat, 23 Dec 2023 16:10:53 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-27 18:53:30.254268
- Title: Wavelet Packet Power Spectrum Kullback-Leibler Divergence: A New Metric
for Image Synthesis
- Title(参考訳): Wavelet Packet Power Spectrum Kullback-Leibler Divergence:画像合成のための新しいメトリクス
- Authors: Lokesh Veeramacheneni (University of Bonn) and Moritz Wolter
(University of Bonn) and Juergen Gall (University of Bonn)
- Abstract要約: 生成ニューラルネットワークの現在のメトリクスは、低周波数、特定のジェネレータ、ImageNetデータセットからのオブジェクト、形よりも価値テクスチャに偏っている。
本稿では,周波数領域に扉を開くとともに,空間的側面を保存できる新しい周波数帯域ベースの品質指標を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current metrics for generative neural networks are biased towards low
frequencies, specific generators, objects from the ImageNet dataset, and value
texture more than shape. Many current quality metrics do not measure frequency
information directly. In response, we propose a new frequency band-based
quality metric, which opens a door into the frequency domain yet, at the same
time, preserves spatial aspects of the data. Our metric works well even if the
distributions we compare are far from ImageNet or have been produced by
differing generator architectures. We verify the quality of our metric by
sampling a broad selection of generative networks on a wide variety of data
sets. A user study ensures our metric aligns with human perception.
Furthermore, we show that frequency band guidance can improve the frequency
domain fidelity of a current generative network.
- Abstract(参考訳): 生成ニューラルネットワークの現在のメトリクスは、低周波数、特定のジェネレータ、ImageNetデータセットからのオブジェクト、形よりも価値テクスチャに偏っている。
現在の多くの品質指標は直接周波数情報を計測しない。
そこで本研究では,周波数領域へのドアを開くと同時に,データの空間的側面を保存できる新しい周波数帯域ベースの品質指標を提案する。
比較した分布がImageNetから遠くない場合や、異なるジェネレータアーキテクチャによって生成された場合であっても、私たちのメトリックはうまく機能します。
我々は,様々なデータセット上で生成ネットワークの幅広い選択をサンプリングすることにより,測定値の品質を検証する。
ユーザスタディは、メトリックが人間の知覚と一致していることを保証する。
さらに、周波数帯域誘導により、現在の生成ネットワークの周波数領域忠実性が向上することを示す。
関連論文リスト
- Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - WFTNet: Exploiting Global and Local Periodicity in Long-term Time Series
Forecasting [61.64303388738395]
本稿では,長期連続予測のためのWavelet-Fourier Transform Network (WFTNet)を提案する。
さまざまな時系列データセットのテストでは、WFTNetは他の最先端のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-09-20T13:44:18Z) - High Fidelity 3D Hand Shape Reconstruction via Scalable Graph Frequency
Decomposition [77.29516516532439]
周波数分割ネットワークを設計し,周波数帯域の異なる3次元ハンドメッシュを粗い方法で生成する。
高周波パーソナライズされた詳細を捉えるため、3Dメッシュを周波数領域に変換し、新しい周波数分解損失を提案する。
提案手法は高忠実度3次元手指再建のための微細な細部情報を生成する。
論文 参考訳(メタデータ) (2023-07-08T19:26:09Z) - HyperTime: Implicit Neural Representation for Time Series [131.57172578210256]
暗黙の神経表現(INR)は、データの正確で解像度に依存しないエンコーディングを提供する強力なツールとして最近登場した。
本稿では、INRを用いて時系列の表現を分析し、再構成精度とトレーニング収束速度の点で異なるアクティベーション関数を比較した。
本稿では,INRを利用して時系列データセット全体の圧縮潜在表現を学習するハイパーネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2022-08-11T14:05:51Z) - Three-Way Deep Neural Network for Radio Frequency Map Generation and
Source Localization [67.93423427193055]
空間、時間、周波数領域にわたる無線スペクトルのモニタリングは、5Gと6G以上の通信技術において重要な特徴となる。
本稿では,空間領域全体にわたる不規則分散計測を補間するGAN(Generative Adversarial Network)機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-23T22:25:10Z) - FMNet: Latent Feature-wise Mapping Network for Cleaning up Noisy
Micro-Doppler Spectrogram [2.9849405664643585]
ノイズの多い環境は、マイクロドップラー分光器の解釈不能な動きパターンを引き起こす。
レーダーの帰還は しばしば マルチパス 乱雑 干渉に悩まされる
本稿では,FMNet (Feature Mapping Network) と呼ばれる潜在機能対応マッピング手法を提案する。
論文 参考訳(メタデータ) (2021-07-09T19:20:41Z) - SignalNet: A Low Resolution Sinusoid Decomposition and Estimation
Network [79.04274563889548]
本稿では,正弦波数を検出するニューラルネットワークアーキテクチャであるSignalNetを提案する。
基礎となるデータ分布と比較して,ネットワークの結果を比較するための最悪の学習しきい値を導入する。
シミュレーションでは、我々のアルゴリズムは常に3ビットデータのしきい値を超えることができるが、しばしば1ビットデータのしきい値を超えることはできない。
論文 参考訳(メタデータ) (2021-06-10T04:21:20Z) - Fake Visual Content Detection Using Two-Stream Convolutional Neural
Networks [14.781702606707642]
周波数領域と空間領域の特徴を補完する2ストリーム畳み込みニューラルネットワークアーキテクチャであるTwoStreamNetを提案する。
提案手法は, 現状の偽コンテンツ検出装置に比べ, 大幅に性能が向上した。
論文 参考訳(メタデータ) (2021-01-03T18:05:07Z) - Wavelet Networks: Scale-Translation Equivariant Learning From Raw
Time-Series [31.73386289965465]
スケール変換同変写像はウェーブレット変換と強い類似性を持っている。
この類似性に着想を得て、我々のネットワークをウェーブレットネットワークと呼び、ネストした非線形ウェーブレットのような時間周波数変換を行うことを示す。
論文 参考訳(メタデータ) (2020-06-09T13:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。