Fugu-MT 論文翻訳(概要): Fréchet Wavelet Distance: A Domain-Agnostic Metric for Image Generation

論文の概要: Fréchet Wavelet Distance: A Domain-Agnostic Metric for Image Generation

arxiv url: http://arxiv.org/abs/2312.15289v3
Date: Sun, 02 Mar 2025 18:36:56 GMT
ステータス: 翻訳完了
システム内更新日: 2025-03-04 17:04:19.151298
Title: Fréchet Wavelet Distance: A Domain-Agnostic Metric for Image Generation
Title（参考訳）: Fréchet Wavelet Distance:画像生成のためのドメインに依存しないメトリクス
Authors: Lokesh Veeramacheneni, Moritz Wolter, Hildegard Kuehne, Juergen Gall,
Abstract要約: We propose the Fr'echet Wavelet Distance (FWD) as a domain-agnostic metric based on the Wavelet Packet Transform ($W_p$)。 FWDは高解像度の画像の広い周波数帯を視認し、空間的側面とテクスチャ的側面の両方を保存する。このメトリクスは、トレーニング済みのネットワークに依存しないので、汎用的でデータセットドメインに依存しない。
参考スコア（独自算出の注目度）: 11.995091514262835
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Modern metrics for generative learning like Fr\'echet Inception Distance (FID) and DINOv2-Fr\'echet Distance (FD-DINOv2) demonstrate impressive performance. However, they suffer from various shortcomings, like a bias towards specific generators and datasets. To address this problem, we propose the Fr\'echet Wavelet Distance (FWD) as a domain-agnostic metric based on the Wavelet Packet Transform ($W_p$). FWD provides a sight across a broad spectrum of frequencies in images with a high resolution, preserving both spatial and textural aspects. Specifically, we use $W_p$ to project generated and real images to the packet coefficient space. We then compute the Fr\'echet distance with the resultant coefficients to evaluate the quality of a generator. This metric is general-purpose and dataset-domain agnostic, as it does not rely on any pre-trained network, while being more interpretable due to its ability to compute Fr\'echet distance per packet, enhancing transparency. We conclude with an extensive evaluation of a wide variety of generators across various datasets that the proposed FWD can generalize and improve robustness to domain shifts and various corruptions compared to other metrics.
Abstract（参考訳）: Fr'echet Inception Distance (FID) や DINOv2-Fr'echet Distance (FD-DINOv2) のような近代的な生成学習のためのメトリクスは、素晴らしいパフォーマンスを示している。しかし、特定のジェネレータやデータセットに対するバイアスなど、さまざまな欠点に悩まされている。この問題に対処するために、Fr\'echet Wavelet Distance (FWD) をWavelet Packet Transform(W_p$)に基づくドメインに依存しない計量として提案する。 FWDは高解像度の画像の広い周波数帯を視認し、空間的側面とテクスチャ的側面の両方を保存する。具体的には、パケット係数空間に生成された実画像を投影するために$W_p$を使用します。次に、Fr'echet距離を結果係数で計算し、ジェネレータの品質を評価する。このメトリックは汎用的でデータセットドメインに依存しないが、パケット毎のFr'echet距離を計算でき、透明性を高めるため、事前訓練されたネットワークに依存しない。提案したFWDは、他の指標と比較して、ドメインシフトやさまざまな汚職に対する堅牢性を一般化し、改善できると結論付けている。

関連論文リスト

Wavelet-Guided Dual-Frequency Encoding for Remote Sensing Change Detection [67.84730634802204]
リモートセンシング画像の変化検出は,自然災害監視,都市拡張追跡,インフラ管理など,さまざまな工学的応用において重要な役割を担っている。既存のほとんどの手法は空間領域モデリングに依存しており、特徴表現の限られた多様性は微妙な変化領域の検出を妨げる。本研究では、特にウェーブレット領域における周波数領域の特徴モデリングが周波数成分の微細な違いを増幅し、空間領域において捉えにくいエッジ変化の知覚を高めることを観察する。
論文参考訳（メタデータ） (2025-08-07T11:14:16Z)
RadioFormer: A Multiple-Granularity Radio Map Estimation Transformer with 1\textpertenthousand Spatial Sampling [60.267226205350596]
電波マップ推定は、電磁スペクトル量の密度の高い表現を生成することを目的としている。空間スパース観測によって生じる制約に対処する新しい多重粒度変換器であるRadioFormerを提案する。また,RadioFormerは,最小計算コストを維持しつつ,無線マップ推定における最先端手法よりも優れていることを示す。
論文参考訳（メタデータ） (2025-04-27T08:44:41Z)
United Domain Cognition Network for Salient Object Detection in Optical Remote Sensing Images [21.76732661032257]
周波数領域と空間領域のグローバルローカル情報を共同で探索する新しい統一ドメイン認知ネットワーク(UDCNet)を提案する。実験結果から提案したUDCNetが24種類の最先端モデルよりも優れていることが示された。
論文参考訳（メタデータ） (2024-11-11T04:12:27Z)
Wavelet-based Bi-dimensional Aggregation Network for SAR Image Change Detection [53.842568573251214]
3つのSARデータセットによる実験結果から、我々のWBANetは現代最先端の手法を著しく上回っていることが明らかとなった。我々のWBANetは、それぞれのデータセットで98.33%、96.65%、96.62%の正確な分類(PCC)を達成している。
論文参考訳（メタデータ） (2024-07-18T04:36:10Z)
SFFNet: A Wavelet-Based Spatial and Frequency Domain Fusion Network for Remote Sensing Segmentation [9.22384870426709]
本稿ではSFFNet(Spatial and Frequency Domain Fusion Network)フレームワークを提案する。第1段階は空間的手法を用いて特徴を抽出し、十分な空間的詳細と意味情報を持つ特徴を得る。第2段階は、これらの特徴を空間領域と周波数領域の両方にマッピングする。 SFFNetはmIoUの点で優れた性能を示し、それぞれ84.80%と87.73%に達した。
論文参考訳（メタデータ） (2024-05-03T10:47:56Z)
UDiFF: Generating Conditional Unsigned Distance Fields with Optimal Wavelet Diffusion [51.31220416754788]
UDiFFは非符号距離場(UDF)の3次元拡散モデルであり,テキスト条件や非条件条件から開面を有するテクスチャ化された3次元形状を生成することができる。我々のキーとなるアイデアは、UDF生成のためのコンパクトな表現空間を生成する最適なウェーブレット変換を用いて、空間周波数領域でUDFを生成することである。
論文参考訳（メタデータ） (2024-04-10T09:24:54Z)
Frequency-Aware Deepfake Detection: Improving Generalizability through Frequency Space Learning [81.98675881423131]
この研究は、目に見えないディープフェイク画像を効果的に識別できるユニバーサルディープフェイク検出器を開発するという課題に対処する。既存の周波数ベースのパラダイムは、偽造検出のためにGANパイプラインのアップサンプリング中に導入された周波数レベルのアーティファクトに依存している。本稿では、周波数領域学習を中心にしたFreqNetと呼ばれる新しい周波数認識手法を導入し、ディープフェイク検出器の一般化性を高めることを目的とする。
論文参考訳（メタデータ） (2024-03-12T01:28:00Z)
Misalignment-Robust Frequency Distribution Loss for Image Transformation [51.0462138717502]
本稿では,画像強調や超解像といった深層学習に基づく画像変換手法における共通の課題に対処することを目的とする。本稿では、周波数領域内における分布距離を計算するための、新しいシンプルな周波数分布損失(FDL)を提案する。本手法は,周波数領域におけるグローバル情報の思慮深い活用により,トレーニング制約として実証的に有効であることが実証された。
論文参考訳（メタデータ） (2024-02-28T09:27:41Z)
TransY-Net:Learning Fully Transformer Networks for Change Detection of Remote Sensing Images [64.63004710817239]
リモートセンシング画像CDのためのトランスフォーマーベース学習フレームワークTransY-Netを提案する。グローバルな視点からの特徴抽出を改善し、ピラミッド方式で多段階の視覚的特徴を組み合わせる。提案手法は,4つの光学式および2つのSAR画像CDベンチマーク上での最先端性能を実現する。
論文参考訳（メタデータ） (2023-10-22T07:42:19Z)
PVT-SSD: Single-Stage 3D Object Detector with Point-Voxel Transformer [75.2251801053839]
単段3次元検出用ポイント・ボクセル変換器(PVT-SSD)を提案する。本稿では,voxel から長時間のコンテキストを安価に取得できる Point-Voxel Transformer (PVT) モジュールを提案する。いくつかの自律走行ベンチマーク実験は,提案手法の有効性と有効性を検証する。
論文参考訳（メタデータ） (2023-05-11T07:37:15Z)
Latent Space is Feature Space: Regularization Term for GANs Training on Limited Dataset [1.8634083978855898]
LFMと呼ばれるGANの付加的な構造と損失関数を提案し、潜在空間の異なる次元間の特徴の多様性を最大化するよう訓練した。実験では、このシステムはDCGAN上に構築されており、CelebAデータセットのスクラッチからFrechet Inception Distance(FID)トレーニングを改善することが証明されている。
論文参考訳（メタデータ） (2022-10-28T16:34:48Z)
Multi-Scale Wavelet Transformer for Face Forgery Detection [43.33712402517951]
顔偽造検出のためのマルチスケールウェーブレットトランスフォーマフレームワークを提案する。周波数に基づく空間的注意は、空間的特徴抽出器をフォージェリトレースに集中させるよう誘導するように設計されている。空間的特徴と周波数特徴を融合させるため,モーダリティ間の注意が提案されている。
論文参考訳（メタデータ） (2022-10-08T03:39:36Z)
Bitwidth Heterogeneous Federated Learning with Progressive Weight Dequantization [58.31288475660333]
ビット幅の不均一なフェデレート学習(BHFL)を用いた実用的フェデレーション学習シナリオを提案する。 BHFLは、異なるビット幅のモデルパラメータの集約が深刻な性能劣化をもたらすという、新しい課題をもたらす。本稿では,低ビット幅の重みをより高ビット幅の重みに段階的に再構成し,最終的に完全精度の重みに再構成する,トレーニング可能な重み決定器を中央サーバに備えたProWDフレームワークを提案する。
論文参考訳（メタデータ） (2022-02-23T12:07:02Z)
PnP-DETR: Towards Efficient Visual Analysis with Transformers [146.55679348493587]
近年、DeTRはトランスフォーマーを用いたソリューションビジョンタスクの先駆者であり、画像特徴マップを直接オブジェクト結果に変換する。最近の変圧器を用いた画像認識モデルとTTは、一貫した効率向上を示す。
論文参考訳（メタデータ） (2021-09-15T01:10:30Z)
WaveFill: A Wavelet-based Generation Network for Image Inpainting [57.012173791320855]
WaveFillはウェーブレットベースの塗装ネットワークで、画像を複数の周波数帯域に分解する。 WaveFillは、空間情報を自然に保存する離散ウェーブレット変換(DWT)を用いて画像を分解する。低周波帯にL1再構成損失を、高周波帯に敵対損失を施し、それによって周波数間紛争を効果的に軽減する。
論文参考訳（メタデータ） (2021-07-23T04:44:40Z)
Wavelet Networks: Scale-Translation Equivariant Learning From Raw Time-Series [31.73386289965465]
スケール変換同変写像はウェーブレット変換と強い類似性を持っている。この類似性に着想を得て、我々のネットワークをウェーブレットネットワークと呼び、ネストした非線形ウェーブレットのような時間周波数変換を行うことを示す。
論文参考訳（メタデータ） (2020-06-09T13:50:34Z)
Image Generation Via Minimizing Fr\'echet Distance in Discriminator Feature Space [10.569405119282667]
Fr'echet-GAN と OT-GAN は,既存の代表的原始的および双対的GAN アプローチよりも画像生成能力に優れていた。我々はFr'echet距離とその勾配を計算するための効率的で数値的に安定な手法を提案する。さらに,Fr'echet-GAN と OT-GAN は,既存の代表的なプリミティブおよびデュアルGAN アプローチに比べて,画像生成能力が大幅に向上していることを示す。
論文参考訳（メタデータ） (2020-03-26T07:37:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。