Fugu-MT 論文翻訳(概要): An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques

論文の概要: An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques

arxiv url: http://arxiv.org/abs/2412.09063v2
Date: Fri, 13 Dec 2024 02:41:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-16 13:36:12.837151
Title: An Efficient Framework for Enhancing Discriminative Models via Diffusion Techniques
Title（参考訳）: 拡散法による識別モデル構築のための効率的なフレームワーク
Authors: Chunxiao Li, Xiaoxiao Wang, Boming Miao, Chuanlong Xie, Zizhe Wang, Yao Zhu,
Abstract要約: 拡散に基づく識別モデル強化フレームワーク(DBMEF)を提案する。このフレームワークは、差別的および生成的モデルをトレーニング不要な方法でシームレスに統合する。 DBMEFは、プラグアンドプレイ方式で識別モデルの分類精度と能力を効果的に向上させることができる。
参考スコア（独自算出の注目度）: 12.470257882838126
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Image classification serves as the cornerstone of computer vision, traditionally achieved through discriminative models based on deep neural networks. Recent advancements have introduced classification methods derived from generative models, which offer the advantage of zero-shot classification. However, these methods suffer from two main drawbacks: high computational overhead and inferior performance compared to discriminative models. Inspired by the coordinated cognitive processes of rapid-slow pathway interactions in the human brain during visual signal recognition, we propose the Diffusion-Based Discriminative Model Enhancement Framework (DBMEF). This framework seamlessly integrates discriminative and generative models in a training-free manner, leveraging discriminative models for initial predictions and endowing deep neural networks with rethinking capabilities via diffusion models. Consequently, DBMEF can effectively enhance the classification accuracy and generalization capability of discriminative models in a plug-and-play manner. We have conducted extensive experiments across 17 prevalent deep model architectures with different training methods, including both CNN-based models such as ResNet and Transformer-based models like ViT, to demonstrate the effectiveness of the proposed DBMEF. Specifically, the framework yields a 1.51\% performance improvement for ResNet-50 on the ImageNet dataset and 3.02\% on the ImageNet-A dataset. In conclusion, our research introduces a novel paradigm for image classification, demonstrating stable improvements across different datasets and neural networks. The code is available at https://github.com/ChunXiaostudy/DBMEF.
Abstract（参考訳）: 画像分類は、ディープニューラルネットワークに基づく識別モデルによって伝統的に達成されるコンピュータビジョンの基盤となる。近年の進歩は、ゼロショット分類の利点を生かした生成モデルに基づく分類手法を導入している。しかし、これらの手法には2つの大きな欠点がある:高い計算オーバーヘッドと判別モデルと比較して性能が劣る。視覚信号認識における脳内高速スロー経路相互作用の協調的認知過程に着想を得て,拡散に基づく識別モデル強化フレームワーク(DBMEF)を提案する。このフレームワークは、差別モデルと生成モデルとをトレーニング不要な方法でシームレスに統合し、初期予測に識別モデルを活用し、拡散モデルによる再考機能を備えたディープニューラルネットワークを提供する。これにより、DBMEFは、プラグアンドプレイ方式で識別モデルの分類精度と一般化能力を効果的に向上させることができる。我々は、ResNetのようなCNNベースのモデルとViTのようなTransformerベースのモデルの両方を含む、17の一般的な深層モデルアーキテクチャに対して広範な実験を行い、提案したDBMEFの有効性を実証した。具体的には、ImageNetデータセットでResNet-50のパフォーマンスが1.51\%、ImageNet-Aデータセットで3.02\%向上している。結論として、画像分類のための新しいパラダイムを導入し、異なるデータセットとニューラルネットワーク間で安定した改善を実証する。コードはhttps://github.com/ChunXiaostudy/DBMEFで入手できる。

関連論文リスト

In-Model Merging for Enhancing the Robustness of Medical Imaging Classification Models [5.871732354387235]
In-model merging(InMerge)を提案する。異なるCNNアーキテクチャに対する本手法の有効性と有効性を示す。提案したInMerge学習モデルは、典型的に訓練されたモデルをかなりのマージンで上回る。
論文参考訳（メタデータ） (2025-02-27T20:52:55Z)
MBInception: A new Multi-Block Inception Model for Enhancing Image Processing Efficiency [3.3748750222488657]
本稿では,畳み込みニューラルネットワークフレームワーク内で連続する3つの開始ブロックを用いた,革新的な画像分類モデルを提案する。モデルとVisual Geometry Group、Residual Network、MobileNetといった確立したアーキテクチャを比較した。その結果、私たちの新しいモデルは、さまざまなデータセットで一貫してそのモデルよりも優れています。
論文参考訳（メタデータ） (2024-12-18T10:46:04Z)
Self-Supervised Learning in Deep Networks: A Pathway to Robust Few-Shot Classification [0.0]
まず、ラベルのない大量のデータから共通特徴表現を学習できるように、自己スーパービジョンでモデルを事前訓練する。その後、数ショットのデータセットMini-ImageNetで微調整を行い、限られたデータの下でモデルの精度と一般化能力を改善する。
論文参考訳（メタデータ） (2024-11-19T01:01:56Z)
Domain-decomposed image classification algorithms using linear discriminant analysis and convolutional neural networks [0.0]
2つの異なる領域分割されたCNNモデルは、異なる画像分類問題に対して実験的に比較される。その結果,グローバルCNNモデルと比較すると,分類精度が向上した。局所化アプローチにも依存し,小さなニューラルネットワークモデルと組み合わせた,新しい分解型LDA戦略を提案する。
論文参考訳（メタデータ） (2024-10-30T18:07:12Z)
Reinforcing Pre-trained Models Using Counterfactual Images [54.26310919385808]
本稿では,言語誘導型生成対実画像を用いた分類モデル強化のための新しいフレームワークを提案する。逆ファクト画像データセットを用いてモデルをテストすることにより、モデルの弱点を同定する。我々は、分類モデルを微調整し強化するために、デファクトイメージを拡張データセットとして採用する。
論文参考訳（メタデータ） (2024-06-19T08:07:14Z)
Neural Residual Diffusion Models for Deep Scalable Vision Generation [17.931568104324985]
我々は,統一的かつ大規模に拡張可能なニューラルネットワーク残差拡散モデルフレームワーク(Neural-RDM)を提案する。提案したニューラル残差モデルは、画像およびビデオ生成ベンチマークの最先端スコアを取得する。
論文参考訳（メタデータ） (2024-06-19T04:57:18Z)
BEND: Bagging Deep Learning Training Based on Efficient Neural Network Diffusion [56.9358325168226]
BEND(Efficient Neural Network Diffusion)に基づくバッグング深層学習学習アルゴリズムを提案する。我々のアプローチは単純だが効果的であり、まず複数のトレーニングされたモデルの重みとバイアスを入力として、オートエンコーダと潜伏拡散モデルを訓練する。提案したBENDアルゴリズムは,元のトレーニングモデルと拡散モデルの両方の平均および中央値の精度を一貫して向上させることができる。
論文参考訳（メタデータ） (2024-03-23T08:40:38Z)
Diffusion-Based Neural Network Weights Generation [80.89706112736353]
D2NWGは拡散に基づくニューラルネットワーク重み生成技術であり、転送学習のために高性能な重みを効率よく生成する。本稿では,ニューラルネットワーク重み生成のための遅延拡散パラダイムを再放送するために,生成的ハイパー表現学習を拡張した。我々のアプローチは大規模言語モデル(LLM)のような大規模アーキテクチャにスケーラブルであり、現在のパラメータ生成技術の限界を克服しています。
論文参考訳（メタデータ） (2024-02-28T08:34:23Z)
Visual Prompting Upgrades Neural Network Sparsification: A Data-Model Perspective [64.04617968947697]
より優れた重量空間を実現するために、新しいデータモデル共設計視点を導入する。具体的には、提案したVPNフレームワークでニューラルネットワークのスパーシフィケーションをアップグレードするために、カスタマイズされたVisual Promptが実装されている。
論文参考訳（メタデータ） (2023-12-03T13:50:24Z)
Diffusion-TTA: Test-time Adaptation of Discriminative Models via Generative Feedback [97.0874638345205]
生成モデルは、識別モデルのための優れたテストタイムアダプタになり得る。提案手法であるDiffusion-TTAは,事前学習した判別モデルを,テストセットの各未学習例に適応させる。拡散-TTAは,様々な大規模事前学習型判別モデルの精度を著しく向上させることを示した。
論文参考訳（メタデータ） (2023-11-27T18:59:53Z)
Diffusion Models Beat GANs on Image Classification [37.70821298392606]
拡散モデルは、画像生成、復調、塗装、超解像、操作などの最先端の手法として注目されている。本稿では,これらの埋め込みは識別情報を含むため,ノイズ予測タスクを超えて有用であり,分類にも活用できることを示す。注意深い特徴選択とプーリングにより、拡散モデルは、分類タスクにおいて同等な生成的識別的手法より優れていることが判明した。
論文参考訳（メタデータ） (2023-07-17T17:59:40Z)
Reconciliation of Pre-trained Models and Prototypical Neural Networks in Few-shot Named Entity Recognition [35.34238362639678]
本研究では,このようなミスマッチを経験的・理論的根拠と整合させる一線符号正規化法を提案する。我々の研究は、数発のエンティティ認識における一般的な問題に対処するための分析的な視点も提供します。
論文参考訳（メタデータ） (2022-11-07T02:33:45Z)
Firearm Detection via Convolutional Neural Networks: Comparing a Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文参考訳（メタデータ） (2020-12-17T15:19:29Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。