論文の概要: Wavelet Packet Power Spectrum Kullback-Leibler Divergence: A New Metric
for Image Synthesis
- arxiv url: http://arxiv.org/abs/2312.15289v1
- Date: Sat, 23 Dec 2023 16:10:53 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-12-27 18:53:30.254268
- Title: Wavelet Packet Power Spectrum Kullback-Leibler Divergence: A New Metric
for Image Synthesis
- Title(参考訳): Wavelet Packet Power Spectrum Kullback-Leibler Divergence:画像合成のための新しいメトリクス
- Authors: Lokesh Veeramacheneni (University of Bonn) and Moritz Wolter
(University of Bonn) and Juergen Gall (University of Bonn)
- Abstract要約: 生成ニューラルネットワークの現在のメトリクスは、低周波数、特定のジェネレータ、ImageNetデータセットからのオブジェクト、形よりも価値テクスチャに偏っている。
本稿では,周波数領域に扉を開くとともに,空間的側面を保存できる新しい周波数帯域ベースの品質指標を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Current metrics for generative neural networks are biased towards low
frequencies, specific generators, objects from the ImageNet dataset, and value
texture more than shape. Many current quality metrics do not measure frequency
information directly. In response, we propose a new frequency band-based
quality metric, which opens a door into the frequency domain yet, at the same
time, preserves spatial aspects of the data. Our metric works well even if the
distributions we compare are far from ImageNet or have been produced by
differing generator architectures. We verify the quality of our metric by
sampling a broad selection of generative networks on a wide variety of data
sets. A user study ensures our metric aligns with human perception.
Furthermore, we show that frequency band guidance can improve the frequency
domain fidelity of a current generative network.
- Abstract(参考訳): 生成ニューラルネットワークの現在のメトリクスは、低周波数、特定のジェネレータ、ImageNetデータセットからのオブジェクト、形よりも価値テクスチャに偏っている。
現在の多くの品質指標は直接周波数情報を計測しない。
そこで本研究では,周波数領域へのドアを開くと同時に,データの空間的側面を保存できる新しい周波数帯域ベースの品質指標を提案する。
比較した分布がImageNetから遠くない場合や、異なるジェネレータアーキテクチャによって生成された場合であっても、私たちのメトリックはうまく機能します。
我々は,様々なデータセット上で生成ネットワークの幅広い選択をサンプリングすることにより,測定値の品質を検証する。
ユーザスタディは、メトリックが人間の知覚と一致していることを保証する。
さらに、周波数帯域誘導により、現在の生成ネットワークの周波数領域忠実性が向上することを示す。
関連論文リスト
- RadioFormer: A Multiple-Granularity Radio Map Estimation Transformer with 1\textpertenthousand Spatial Sampling [60.267226205350596]
電波マップ推定は、電磁スペクトル量の密度の高い表現を生成することを目的としている。
空間スパース観測によって生じる制約に対処する新しい多重粒度変換器であるRadioFormerを提案する。
また,RadioFormerは,最小計算コストを維持しつつ,無線マップ推定における最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-04-27T08:44:41Z) - United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。
実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文 参考訳(メタデータ) (2024-11-11T04:12:27Z) - Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。
我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文 参考訳(メタデータ) (2024-07-18T04:36:10Z) - SFFNet: A Wavelet-Based Spatial and Frequency Domain Fusion Network for Remote Sensing Segmentation [9.22384870426709]
本稿ではSFFNet(Spatial and Frequency Domain Fusion Network)フレームワークを提案する。
第1段階は空間的手法を用いて特徴を抽出し、十分な空間的詳細と意味情報を持つ特徴を得る。
第2段階は、これらの特徴を空間領域と周波数領域の両方にマッピングする。
SFFNetはmIoUの点で優れた性能を示し、それぞれ84.80%と87.73%に達した。
論文 参考訳(メタデータ) (2024-05-03T10:47:56Z) - UDiFF: Generating Conditional Unsigned Distance Fields with Optimal Wavelet Diffusion [51.31220416754788]
UDiFFは非符号距離場(UDF)の3次元拡散モデルであり,テキスト条件や非条件条件から開面を有するテクスチャ化された3次元形状を生成することができる。
我々のキーとなるアイデアは、UDF生成のためのコンパクトな表現空間を生成する最適なウェーブレット変換を用いて、空間周波数領域でUDFを生成することである。
論文 参考訳(メタデータ) (2024-04-10T09:24:54Z) - Frequency-Aware Deepfake Detection: Improving Generalizability through
Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。
既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。
本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文 参考訳(メタデータ) (2024-03-12T01:28:00Z) - Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。
本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。
本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文 参考訳(メタデータ) (2024-02-28T09:27:41Z) - TransY-Net:Learning Fully Transformer Networks for Change Detection of
Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。
グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。
提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文 参考訳(メタデータ) (2023-10-22T07:42:19Z) - PVT-SSD: Single-Stage 3D Object Detector with Point-Voxel Transformer [75.2251801053839]
単段3次元検出用ポイント・ボクセル変換器(PVT-SSD)を提案する。
本稿では,voxel から長時間のコンテキストを安価に取得できる Point-Voxel Transformer (PVT) モジュールを提案する。
いくつかの自律走行ベンチマーク実験は,提案手法の有効性と有効性を検証する。
論文 参考訳(メタデータ) (2023-05-11T07:37:15Z) - Latent Space is Feature Space: Regularization Term for GANs Training on
Limited Dataset [1.8634083978855898]
LFMと呼ばれるGANの付加的な構造と損失関数を提案し、潜在空間の異なる次元間の特徴の多様性を最大化するよう訓練した。
実験では、このシステムはDCGAN上に構築されており、CelebAデータセットのスクラッチからFrechet Inception Distance(FID)トレーニングを改善することが証明されている。
論文 参考訳(メタデータ) (2022-10-28T16:34:48Z) - Multi-Scale Wavelet Transformer for Face Forgery Detection [43.33712402517951]
顔偽造検出のためのマルチスケールウェーブレットトランスフォーマフレームワークを提案する。
周波数に基づく空間的注意は、空間的特徴抽出器をフォージェリトレースに集中させるよう誘導するように設計されている。
空間的特徴と周波数特徴を融合させるため,モーダリティ間の注意が提案されている。
論文 参考訳(メタデータ) (2022-10-08T03:39:36Z) - Bitwidth Heterogeneous Federated Learning with Progressive Weight
Dequantization [58.31288475660333]
ビット幅の不均一なフェデレート学習(BHFL)を用いた実用的フェデレーション学習シナリオを提案する。
BHFLは、異なるビット幅のモデルパラメータの集約が深刻な性能劣化をもたらすという、新しい課題をもたらす。
本稿では,低ビット幅の重みをより高ビット幅の重みに段階的に再構成し,最終的に完全精度の重みに再構成する,トレーニング可能な重み決定器を中央サーバに備えたProWDフレームワークを提案する。
論文 参考訳(メタデータ) (2022-02-23T12:07:02Z) - PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。
最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文 参考訳(メタデータ) (2021-09-15T01:10:30Z) - WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。
WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。
低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文 参考訳(メタデータ) (2021-07-23T04:44:40Z) - Wavelet Networks: Scale-Translation Equivariant Learning From Raw
Time-Series [31.73386289965465]
スケール変換同変写像はウェーブレット変換と強い類似性を持っている。
この類似性に着想を得て、我々のネットワークをウェーブレットネットワークと呼び、ネストした非線形ウェーブレットのような時間周波数変換を行うことを示す。
論文 参考訳(メタデータ) (2020-06-09T13:50:34Z) - Image Generation Via Minimizing Fr\'echet Distance in Discriminator
Feature Space [10.569405119282667]
Fr'echet-GAN と OT-GAN は,既存の代表的原始的および双対的GAN アプローチよりも画像生成能力に優れていた。
我々はFr'echet距離とその勾配を計算するための効率的で数値的に安定な手法を提案する。
さらに,Fr'echet-GAN と OT-GAN は,既存の代表的なプリミティブおよびデュアルGAN アプローチに比べて,画像生成能力が大幅に向上していることを示す。
論文 参考訳(メタデータ) (2020-03-26T07:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。