Fugu-MT 論文翻訳(概要): Towards Bridging the Performance Gaps of Joint Energy-based Models

論文の概要: Towards Bridging the Performance Gaps of Joint Energy-based Models

arxiv url: http://arxiv.org/abs/2209.07959v1
Date: Fri, 16 Sep 2022 14:19:48 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-19 12:49:31.599006
Title: Towards Bridging the Performance Gaps of Joint Energy-based Models
Title（参考訳）: 共同エネルギーモデルの性能ギャップの橋渡しに向けて
Authors: Xiulong Yang, Qing Su, Shihao Ji
Abstract要約: 共同エネルギーベースモデル(JEM)は高い分類精度と画像生成品質を同時に達成する。本稿では,JEMの精度ギャップと生成品質ギャップを橋渡しする様々なトレーニング手法を紹介する。我々のSADA-JEMは、画像分類、画像生成、キャリブレーション、アウト・オブ・ディストリビューション検出、対向ロバストネスにおいて、最先端のパフォーマンスを達成し、JEMより優れています。
参考スコア（独自算出の注目度）: 1.933681537640272
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Can we train a hybrid discriminative-generative model within a single network? This question has recently been answered in the affirmative, introducing the field of Joint Energy-based Model (JEM), which achieves high classification accuracy and image generation quality simultaneously. Despite recent advances, there remain two performance gaps: the accuracy gap to the standard softmax classifier, and the generation quality gap to state-of-the-art generative models. In this paper, we introduce a variety of training techniques to bridge the accuracy gap and the generation quality gap of JEM. 1) We incorporate a recently proposed sharpness-aware minimization (SAM) framework to train JEM, which promotes the energy landscape smoothness and the generalizability of JEM. 2) We exclude data augmentation from the maximum likelihood estimate pipeline of JEM, and mitigate the negative impact of data augmentation to image generation quality. Extensive experiments on multiple datasets demonstrate that our SADA-JEM achieves state-of-the-art performances and outperforms JEM in image classification, image generation, calibration, out-of-distribution detection and adversarial robustness by a notable margin.
Abstract（参考訳）: 単一ネットワーク内でハイブリッド判別生成モデルをトレーニングできるだろうか? この質問は、最近、高い分類精度と画像生成品質を同時に達成するJEM(Joint Energy-based Model)の分野を導入して、肯定的な回答を得た。最近の進歩にもかかわらず、標準的なソフトマックス分類器の精度ギャップと、最先端生成モデルに対する生成品質ギャップの2つのパフォーマンスギャップが残っている。本稿では,JEMの精度ギャップと生成品質ギャップを橋渡しする各種トレーニング手法を提案する。 1) 最近提案されたシャープネス認識最小化(SAM)フレームワークを組み込んでJEMを訓練し,JEMのスムーズさと一般化性を促進する。 2) JEMの最大推定パイプラインからデータ拡張を除外し,画像生成品質に対するデータ拡張の負の影響を軽減する。 SADA-JEMは, 画像分類, 画像生成, キャリブレーション, アウト・オブ・ディストリビューション検出, 対向ロバストネスにおいて, 最先端の性能を達成し, JEMより優れていることを示す。

関連論文リスト

Your Classifier Can Do More: Towards Bridging the Gaps in Classification, Robustness, and Generation [18.149950949071982]
本研究では, クリーン, 逆数, 生成サンプルのエネルギー分布の差異について検討した。クリーンなデータ分布, 逆流分布, 分類器を共同でモデル化するためのエネルギーベース共同配信支援訓練を提案する。
論文参考訳（メタデータ） (2025-05-26T03:26:55Z)
D2C: Unlocking the Potential of Continuous Autoregressive Image Generation with Discrete Tokens [80.75893450536577]
モデル生成能力を向上させる新しい2段階法であるD2Cを提案する。第1段階では、小さな離散値発生器を用いて粗粒度画像特徴を表す離散値トークンをサンプリングする。第2段階では、離散トークンシーケンスに基づいて、きめ細かい画像特徴を表す連続値トークンを学習する。
論文参考訳（メタデータ） (2025-03-21T13:58:49Z)
ICE-Bench: A Unified and Comprehensive Benchmark for Image Creating and Editing [23.512687688393346]
ICE-Benchは、画像生成モデルを厳格に評価するために設計された包括的なベンチマークである。評価フレームワークは、6次元にわたる画像生成能力を評価する。既存の世代モデルを徹底的に分析し、ベンチマークの難易度と現在のモデル能力と実世界の世代要件のギャップを明らかにする。
論文参考訳（メタデータ） (2025-03-18T17:53:29Z)
Can We Generate Images with CoT? Let's Verify and Reinforce Image Generation Step by Step [77.86514804787622]
CoT(Chain-of-Thought)推論は、複雑な理解タスクに取り組むために大規模なモデルで広く研究されている。自己回帰画像生成を促進するために,CoT推論の可能性について,初めて包括的調査を行った。本稿では,自動回帰画像生成に特化したPARMとPARM++を提案する。
論文参考訳（メタデータ） (2025-01-23T18:59:43Z)
Model Inversion Attacks Through Target-Specific Conditional Diffusion Models [54.69008212790426]
モデル反転攻撃(MIA)は、ターゲット分類器のトレーニングセットからプライベートイメージを再構築することを目的としており、それによってAIアプリケーションにおけるプライバシー上の懸念が高まる。従来のGANベースのMIAは、GANの固有の欠陥と潜伏空間における最適化の偏りにより、劣った遺伝子的忠実度に悩まされる傾向にある。これらの問題を緩和するために拡散モデル反転(Diff-MI)攻撃を提案する。
論文参考訳（メタデータ） (2024-07-16T06:38:49Z)
DemosaicFormer: Coarse-to-Fine Demosaicing Network for HybridEVS Camera [70.28702677370879]
Hybrid Event-Based Vision Sensor (HybridEVS)は、従来のフレームベースとイベントベースのセンサーを統合する新しいセンサーである。その可能性にもかかわらず、ハイブリッドEVS用に特別に設計された画像信号処理(ISP)パイプラインの欠如は大きな課題である。粗大な復調と画素補正を含む,粗大で微細なフレームワークであるDemosaicFormerを提案する。
論文参考訳（メタデータ） (2024-06-12T07:20:46Z)
GECO: Generative Image-to-3D within a SECOnd [51.20830808525894]
本稿では,1秒以内に動作する高品質な3次元生成モデリング手法GECOを紹介する。 GECOは、前例のないレベルの効率で高品質な3Dメッシュ生成を実現する。
論文参考訳（メタデータ） (2024-05-30T17:58:00Z)
Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。本研究では,既存のデータ拡張技術の欠点について検討する。 Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文参考訳（メタデータ） (2024-03-28T17:23:45Z)
Class-Prototype Conditional Diffusion Model with Gradient Projection for Continual Learning [20.175586324567025]
破滅的な忘れ方を減らすことは、継続的な学習における重要なハードルである。大きな問題は、生成したデータの品質がオリジナルのものと比べて低下することである。本稿では,ジェネレータにおける画像品質を向上させる連続学習のためのGRに基づくアプローチを提案する。
論文参考訳（メタデータ） (2023-12-10T17:39:42Z)
Energy-Calibrated VAE with Test Time Free Lunch [10.698329211674372]
可変オートエンコーダ(VAE)の強化のための条件付きエネルギーベースモデル(EBM)を提案する。 VAEは、生成方向に生成されたサンプルの調整されたトレーニングが欠如しているため、しばしばぼやけた生成サンプルに悩まされる。我々は,EC-VAEの校正アイデアを変分学習と正規化フローに拡張し,ニューラルトランスポートとレンジヌル理論によるゼロショット画像復元にEC-VAEを適用した。
論文参考訳（メタデータ） (2023-11-07T15:35:56Z)
Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。 EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文参考訳（メタデータ） (2023-09-10T22:05:24Z)
A Bayesian Non-parametric Approach to Generative Models: Integrating Variational Autoencoder and Generative Adversarial Networks using Wasserstein and Maximum Mean Discrepancy [2.966338139852619]
GAN(Generative Adversarial Network)とVAE(VAE)は、最も顕著で広く研究されている生成モデルである。ベイズ的非パラメトリック(BNP)アプローチを用いて、GANとVAEを融合する。本稿では,GANの識別能力とVAEの再構成能力とを融合させることにより,多種多様な生成タスクにおいて優れた性能を実現する。
論文参考訳（メタデータ） (2023-08-27T08:58:31Z)
JNDMix: JND-Based Data Augmentation for No-reference Image Quality Assessment [5.0789200970424035]
NR-IQAタスクに対するジャストインタブル差分(JND)ノイズミキシングに基づく有効で汎用的なデータ拡張を提案する。そこで本研究では,人間の視覚システム(HVS)に非受容なJNDノイズを,ラベルの調整なしにトレーニング画像にランダムに注入する。 JNDMixは様々な最先端NR-IQAモデルの性能とデータ効率を大幅に改善することを示した。
論文参考訳（メタデータ） (2023-02-20T08:55:00Z)
Controllable and Compositional Generation with Latent-Space Energy-Based Models [60.87740144816278]
制御可能な生成は、現実世界のアプリケーションで深層生成モデルの採用を成功させる上で重要な要件の1つである。本研究では, エネルギーモデル(EBM)を用いて, 属性の集合上での合成生成を扱う。エネルギー関数を論理演算子と合成することにより、分解能1024x1024のフォトリアリスティック画像を生成する際に、このような構成性を実現するのはこれが初めてである。
論文参考訳（メタデータ） (2021-10-21T03:31:45Z)
Generative Max-Mahalanobis Classifiers for Image Classification, Generation and More [6.89001867562902]
Max-Mahalanobis (MMC) は、画像分類と生成のために、識別、生成、共同で訓練することができる。ジェネラティブMCC(Generative MMC)は、画像分類と生成のために、識別的、生成的、または共同でトレーニングできることを示します。
論文参考訳（メタデータ） (2021-01-01T00:42:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。