論文の概要: APEX: Assumption-free Projection-based Embedding eXamination Metric for Image Quality Assessment
- arxiv url: http://arxiv.org/abs/2605.07786v1
- Date: Fri, 08 May 2026 14:21:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.110373
- Title: APEX: Assumption-free Projection-based Embedding eXamination Metric for Image Quality Assessment
- Title(参考訳): APEX:画像品質評価のための推定自由射影型埋め込みeXaminationメトリック
- Authors: Caterina Gallegati, Monica Bianchini, Franco Scarselli, Vittorio Murino, Barbara Toniella Corradini,
- Abstract要約: 本稿では,新しい評価フレームワークであるAPEX (Assumption-free Projection-based Embedding eXamination)を紹介する。
Sliced Wasserstein Distanceを数学的基盤とした仮定自由類似度尺度として活用する新しい評価フレームワーク。
我々は,APEX測定値が内部およびクロスデータセットの安定性を示し,ドメイン外のデータセットに対する高い安定した評価を確実にすることを示す。
- 参考スコア(独自算出の注目度): 9.553829288479028
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As generative models achieve unprecedented visual quality, the gold standard for image evaluation remains traditional feature-distribution metrics (e.g., FID). However, these metrics are provably hindered by the closed-vocabulary bottleneck of outdated features and the assumptive bias of rigid parametric formulations. Recent alternatives exploit modern backbones to solve the feature bottleneck, yet continue to suffer from parametric limitations. To close this gap, we introduce APEX (Assumption-free Projection-based Embedding eXamination), a novel evaluation framework leveraging the Sliced Wasserstein Distance as a mathematically grounded, assumption-free similarity measure. APEX inherits effective scalability to high-dimensional spaces, as we prove with theoretical and empirical evidences. Moreover, APEX is embedding-agnostic and uses two open-vocabulary foundation models, CLIP and DINOv2, as feature extractors. Benchmarking APEX against established baselines reveals superior robustness to visual degradations. Additionally, we show that APEX metrics exhibit intra- and cross-dataset stability, ensuring highly stable evaluations on out-of-domain datasets.
- Abstract(参考訳): 生成モデルは前例のない視覚的品質を達成するため、画像評価のゴールドスタンダードは、伝統的な特徴分布指標(例えば、FID)のままである。
しかし、これらの指標は時代遅れの特徴の閉語彙的ボトルネックと厳密なパラメトリックな定式化の集合バイアスによって確実に妨げられる。
最近の代替手段は、機能ボトルネックを解決するためにモダンなバックボーンを利用するが、パラメトリックな制限に悩まされ続けている。
このギャップを埋めるために,Sliced Wasserstein Distance を利用した新しい評価フレームワークであるAPEX (Assumption-free Projection-based Embedding eXamination) を導入する。
APEXは、理論的および経験的証拠によって証明されるように、高次元空間への効果的なスケーラビリティを継承する。
さらに、APEXは埋め込み非依存であり、2つのオープン語彙基盤モデルであるCLIPとDINOv2を特徴抽出器として使用している。
確立されたベースラインに対するAPEXのベンチマークは、視覚的劣化に対して優れた堅牢性を示す。
さらに、APEXメトリクスは、内部およびクロスデータセットの安定性を示し、ドメイン外のデータセットの高度に安定した評価を保証する。
関連論文リスト
- Suppressing Prior-Comparison Hallucinations in Radiology Report Generation via Semantically Decoupled Latent Steering [94.37535002230504]
本研究では,Semantically Decoupled Latent Steeringと呼ばれる学習自由な推論時間制御フレームワークを開発した。
提案手法は,大言語モデル (LLM) による意味分解による意味のない介入ベクトルを構築する。
本手法は歴史的幻覚の可能性を著しく低下させることを示す。
論文 参考訳(メタデータ) (2026-02-27T04:49:01Z) - Sharp Convergence Rates for Masked Diffusion Models [53.117058231393834]
制約を克服するオイラー法に対する全変分に基づく解析法を開発した。
その結果、スコア推定の仮定を緩和し、パラメータ依存性を改善し、収束保証を確立する。
全体としては,CTMC軌道に沿った直接テレビによる誤り分解と,FHSのためのデカップリングに基づく経路解析を導入している。
論文 参考訳(メタデータ) (2026-02-26T00:47:51Z) - Reference-Specific Unlearning Metrics Can Hide the Truth: A Reality Check [60.77691669644931]
本研究では,非学習モデルと参照モデル間の分布類似度を測定する新しい尺度であるFADE(Functional Alignment for Distributional Equivalence)を提案する。
FADEは出力分布全体の機能的アライメントをキャプチャし、真の未学習の原則的評価を提供する。
これらの知見は、現在の評価実践における根本的なギャップを明らかにし、FADEが真に効果的な未学習手法を開発し評価するための、より堅牢な基盤を提供することを示した。
論文 参考訳(メタデータ) (2025-10-14T20:50:30Z) - Continual Action Quality Assessment via Adaptive Manifold-Aligned Graph Regularization [53.82400605816587]
アクション品質アセスメント(AQA)は、ビデオにおける人間の行動を定量化し、スポーツスコアリング、リハビリテーション、スキル評価の応用を支援する。
大きな課題は、現実世界のシナリオにおける品質分布の非定常的な性質にある。
本稿では,進化する分布を扱うための連続学習機能を備えた連続AQA(Continuous AQA)を紹介する。
論文 参考訳(メタデータ) (2025-10-08T10:09:47Z) - AUPIMO: Redefining Visual Anomaly Detection Benchmarks with High Speed and Low Tolerance [0.562479170374811]
Per-IMage Overlap(PIMO)は、AUROCとAUPROの欠点に対処する新しいメトリクスである。
画像ごとのリコールの測定は、計算を単純化し、ノイズの多いアノテーションに対してより堅牢である。
実験の結果,PIMOは実用的優位性があり,性能の見識に乏しいことがわかった。
論文 参考訳(メタデータ) (2024-01-03T21:24:44Z) - Exploring validation metrics for offline model-based optimisation with
diffusion models [50.404829846182764]
モデルベース最適化(MBO)では、マシンラーニングを使用して、(基底真理)オラクルと呼ばれるブラックボックス関数に対する報酬の尺度を最大化する候補を設計することに興味があります。
モデル検証中に基底オラクルに対する近似をトレーニングし、その代わりに使用することができるが、その評価は近似的であり、敵の例に対して脆弱である。
本手法は,外挿量を測定するために提案した評価フレームワークにカプセル化されている。
論文 参考訳(メタデータ) (2022-11-19T16:57:37Z) - Evaluation Metrics for Conditional Image Generation [100.69766435176557]
クラス条件画像生成設定において生成モデルを評価するための2つの新しい指標を提案する。
理論的分析は、提案されたメトリクスの背景にあるモチベーションを示し、新しいメトリクスと条件のないメトリクスを結びつける。
我々は,実験的な評価を行い,その指標を条件のない変種や他の指標と比較し,既存の生成モデルの解析に利用した。
論文 参考訳(メタデータ) (2020-04-26T12:15:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。