論文の概要: FLD+: Data-efficient Evaluation Metric for Generative Models
- arxiv url: http://arxiv.org/abs/2411.15584v1
- Date: Sat, 23 Nov 2024 15:12:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:22:13.198706
- Title: FLD+: Data-efficient Evaluation Metric for Generative Models
- Title(参考訳): FLD+: 生成モデルのためのデータ効率評価指標
- Authors: Pranav Jeevan, Neeraj Nixon, Amit Sethi,
- Abstract要約: 本稿では,より信頼性が高く,データ効率が高く,計算効率が高く,新しい領域に適応可能な生成画像の品質を評価するための新しい指標を提案する。
提案した計量は、任意の領域からの画像の密度(正確には対数のような)の計算を可能にする正規化フローに基づいている。
- 参考スコア(独自算出の注目度): 4.093503153499691
- License:
- Abstract: We introduce a new metric to assess the quality of generated images that is more reliable, data-efficient, compute-efficient, and adaptable to new domains than the previous metrics, such as Fr\'echet Inception Distance (FID). The proposed metric is based on normalizing flows, which allows for the computation of density (exact log-likelihood) of images from any domain. Thus, unlike FID, the proposed Flow-based Likelihood Distance Plus (FLD+) metric exhibits strongly monotonic behavior with respect to different types of image degradations, including noise, occlusion, diffusion steps, and generative model size. Additionally, because normalizing flow can be trained stably and efficiently, FLD+ achieves stable results with two orders of magnitude fewer images than FID (which requires more images to reliably compute Fr\'echet distance between features of large samples of real and generated images). We made FLD+ computationally even more efficient by applying normalizing flows to features extracted in a lower-dimensional latent space instead of using a pre-trained network. We also show that FLD+ can easily be retrained on new domains, such as medical images, unlike the networks behind previous metrics -- such as InceptionNetV3 pre-trained on ImageNet.
- Abstract(参考訳): 本稿では,Fr'echet Inception Distance (FID) のような従来の指標よりも信頼性が高く,データ効率が高く,計算効率が高く,新しい領域に適応可能な生成画像の品質を評価するための新しい指標を提案する。
提案した計量は、任意の領域からの画像の密度(正確には対数のような)の計算を可能にする正規化フローに基づいている。
したがって、FIDとは異なり、FLD+(Flow-based Likelihood Distance Plus)はノイズ、閉塞、拡散ステップ、生成モデルサイズなど、様々な種類の画像劣化に対して強い単調な振る舞いを示す。
さらに、フローの正規化を安定かつ効率的に行うことができるため、FLD+はFIDよりも2桁少ない画像で安定した結果が得られる(実画像と生成画像の大きなサンプルの特徴間のFr'echet距離を確実に計算するためにより多くの画像を必要とする)。
事前学習ネットワークではなく,低次元潜在空間で抽出した特徴に対して正規化フローを適用することにより,FLD+の計算効率をさらに高めた。
ImageNetで事前トレーニングされたInceptionNetV3のような以前のメトリクスの背後にあるネットワークとは異なり、医療画像のような新しいドメインでFLD+を簡単に再トレーニングできることも示しています。
関連論文リスト
- Normalizing Flow-Based Metric for Image Generation [4.093503153499691]
正規化フローに基づいて生成画像の現実性を評価するための2つの新しい評価指標を提案する。
正規化フローは正確な確率を計算するために使用できるため、提案したメトリクスは、与えられた領域からの実際の画像の分布とどのように密接に一致しているかを評価する。
論文 参考訳(メタデータ) (2024-10-02T20:09:58Z) - WiNet: Wavelet-based Incremental Learning for Efficient Medical Image Registration [68.25711405944239]
深部画像登録は異常な精度と高速な推測を示した。
近年の進歩は、粗大から粗大の方法で密度変形場を推定するために、複数のカスケードまたはピラミッドアーキテクチャを採用している。
本稿では,様々なスケールにわたる変位/速度場に対して,スケールワイブレット係数を漸進的に推定するモデル駆動WiNetを提案する。
論文 参考訳(メタデータ) (2024-07-18T11:51:01Z) - Bring Metric Functions into Diffusion Models [145.71911023514252]
DDPM(Denoising Diffusion Probabilistic Model)を改善するカスケード拡散モデル(Cas-DM)を導入する。
提案した拡散モデルバックボーンはLPIPS損失の有効利用を可能にし,最先端画像品質(FID, sFID, IS)を実現する。
実験結果から,提案した拡散モデルバックボーンはLPIPS損失の有効利用を可能にし,最新画像品質(FID, sFID, IS)につながることが示された。
論文 参考訳(メタデータ) (2024-01-04T18:55:01Z) - Recovering high-quality FODs from a reduced number of diffusion-weighted
images using a model-driven deep learning architecture [0.0]
モデル駆動型深層学習FOD再構成アーキテクチャを提案する。
ネットワークが生成する中間および出力FODが、入力されたDWI信号と一致していることを保証する。
モデルに基づくディープラーニングアーキテクチャは,最先端のFOD超解像ネットワークであるFOD-Netと比較して,競争性能が向上することを示す。
論文 参考訳(メタデータ) (2023-07-28T02:47:34Z) - CaloFlow: Fast and Accurate Generation of Calorimeter Showers with
Normalizing Flows [0.0]
正規化フローに基づく高速検出器シミュレーションフレームワークであるCaloFlowを紹介する。
本研究は, フローの正規化により, 極めて高い忠実度で多チャンネルのカロリーメータシャワーを再現できることを初めて実証した。
論文 参考訳(メタデータ) (2021-06-09T18:00:02Z) - Learning Optical Flow from a Few Matches [67.83633948984954]
密な相関体積表現は冗長であり、その中の要素のほんの一部で正確なフロー推定が達成できることを示した。
実験により,高い精度を維持しつつ計算コストとメモリ使用量を大幅に削減できることを示した。
論文 参考訳(メタデータ) (2021-04-05T21:44:00Z) - FlowReg: Fast Deformable Unsupervised Medical Image Registration using
Optical Flow [0.09167082845109438]
FlowRegは、ニューロイメージングアプリケーションのための教師なしイメージ登録のためのフレームワークである。
flowregは解剖学と病理の形状と構造を維持しながら、強度と空間的類似性を得ることができる。
論文 参考訳(メタデータ) (2021-01-24T03:51:34Z) - Same Same But DifferNet: Semi-Supervised Defect Detection with
Normalizing Flows [24.734388664558708]
畳み込みニューラルネットワークによって抽出された特徴の記述性を利用して、その密度を推定する。
これらの可能性に基づいて、欠陥を示すスコアリング関数を開発する。
本稿では,新しいMVTec ADとMagnetic Tile Defectsデータセットに対する既存のアプローチよりも優れた性能を示す。
論文 参考訳(メタデータ) (2020-08-28T10:49:28Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Why Normalizing Flows Fail to Detect Out-of-Distribution Data [51.552870594221865]
正規化フローは、イン・オブ・ディストリビューションデータとアウト・オブ・ディストリビューションデータの区別に失敗する。
フローは局所的な画素相関と画像からラテンス空間への変換を学習する。
フロー結合層のアーキテクチャを変更することで、ターゲットデータのセマンティック構造を学ぶためのフローに偏りがあることが示される。
論文 参考訳(メタデータ) (2020-06-15T17:00:01Z) - Semi-Supervised Learning with Normalizing Flows [54.376602201489995]
FlowGMMは、フローの正規化を伴う生成半教師付き学習におけるエンドツーエンドのアプローチである。
我々は AG-News や Yahoo Answers のテキストデータなど,幅広いアプリケーションに対して有望な結果を示す。
論文 参考訳(メタデータ) (2019-12-30T17:36:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。