論文の概要: Model Doctor: A Simple Gradient Aggregation Strategy for Diagnosing and
Treating CNN Classifiers
- arxiv url: http://arxiv.org/abs/2112.04934v1
- Date: Thu, 9 Dec 2021 14:05:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-10 18:47:44.850787
- Title: Model Doctor: A Simple Gradient Aggregation Strategy for Diagnosing and
Treating CNN Classifiers
- Title(参考訳): Model Doctor: CNN分類器の診断と治療のための簡易なグラディエント集約戦略
- Authors: Zunlei Feng, Jiacong Hu, Sai Wu, Xiaotian Yu, Jie Song, Mingli Song
- Abstract要約: 畳み込みニューラルネットワーク(CNN)は,分類タスクにおいて優れた性能を発揮する。
CNNは、予測メカニズムを理解するのが難しい「ブラックボックス」と見なされていることが広く知られている。
本稿では,モデルドクターと呼ばれる,最初の完全自動診断・治療ツールを提案する。
- 参考スコア(独自算出の注目度): 33.82339346293966
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, Convolutional Neural Network (CNN) has achieved excellent
performance in the classification task. It is widely known that CNN is deemed
as a 'black-box', which is hard for understanding the prediction mechanism and
debugging the wrong prediction. Some model debugging and explanation works are
developed for solving the above drawbacks. However, those methods focus on
explanation and diagnosing possible causes for model prediction, based on which
the researchers handle the following optimization of models manually. In this
paper, we propose the first completely automatic model diagnosing and treating
tool, termed as Model Doctor. Based on two discoveries that 1) each category is
only correlated with sparse and specific convolution kernels, and 2)
adversarial samples are isolated while normal samples are successive in the
feature space, a simple aggregate gradient constraint is devised for
effectively diagnosing and optimizing CNN classifiers. The aggregate gradient
strategy is a versatile module for mainstream CNN classifiers. Extensive
experiments demonstrate that the proposed Model Doctor applies to all existing
CNN classifiers, and improves the accuracy of $16$ mainstream CNN classifiers
by 1%-5%.
- Abstract(参考訳): 近年,畳み込みニューラルネットワーク (CNN) は分類作業において優れた性能を発揮している。
CNNは、予測メカニズムを理解し、間違った予測をデバッグすることが難しい「ブラックボックス」と見なされていることが広く知られている。
いくつかのモデルデバッギングと説明作業は、上記の欠点を解決するために開発されている。
しかし,これらの手法はモデル予測の潜在的な原因の説明と診断に焦点が当てられており,研究者が手動でモデルの次の最適化を処理している。
本稿では,最初の完全自動診断・治療ツールであるモデルドクターを提案する。
2つの発見に基づいて
1)各カテゴリは、スパースおよび特定の畳み込み核とのみ相関しており、
2) 通常のサンプルが特徴空間に連続する間, 逆サンプルを分離し, cnn分類器を効果的に診断し最適化するために, 単純な集計勾配制約を考案する。
アグリゲートグラデーション戦略は主流のcnn分類器の汎用モジュールである。
大規模な実験では、提案されたモデルドクターが既存のCNN分類器すべてに適用され、メインストリームCNN分類器の精度を1%-5%向上することを示した。
関連論文リスト
- Reusing Convolutional Neural Network Models through Modularization and
Composition [22.823870645316397]
我々はCNNSplitterとGradSplitterという2つのモジュール化手法を提案する。
CNNSplitterは、トレーニングされた畳み込みニューラルネットワーク(CNN)モデルを、小さな再利用可能なモジュールとして$N$に分解する。
生成されたモジュールは、既存のCNNモデルにパッチを当てたり、コンポジションを通じて新しいCNNモデルを構築するために再利用することができる。
論文 参考訳(メタデータ) (2023-11-08T03:18:49Z) - Benign Overfitting in Two-Layer ReLU Convolutional Neural Networks for
XOR Data [24.86314525762012]
勾配降下法により訓練されたReLU CNNがベイズ最適精度付近で実現できることを示す。
以上の結果から,CNNは高い相関性のある特徴が存在する場合でも,効率よくXOR問題を学習する能力を有することが明らかとなった。
論文 参考訳(メタデータ) (2023-10-03T11:31:37Z) - Continuous time recurrent neural networks: overview and application to
forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。
重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文 参考訳(メタデータ) (2023-04-14T09:39:06Z) - Convolutional Neural Network-Based Automatic Classification of
Colorectal and Prostate Tumor Biopsies Using Multispectral Imagery: System
Development Study [7.566742780233967]
生検標本の多スペクトル画像から大腸癌と前立腺腫瘍を分類するためのCNNモデルを提案する。
その結果,前立腺および大腸のデータセットの平均検査精度は99.8%と99.5%と優れた成績を示した。
提案したCNNアーキテクチャは,大腸癌と前立腺癌を分類する上で,最も優れたシステムであった。
論文 参考訳(メタデータ) (2023-01-30T18:28:25Z) - On the Generalization and Adaption Performance of Causal Models [99.64022680811281]
異なる因果発見は、データ生成プロセスを一連のモジュールに分解するために提案されている。
このようなモジュラニューラル因果モデルの一般化と適応性能について検討する。
我々の分析では、モジュラーニューラル因果モデルが、低データレギュレーションにおけるゼロおよび少数ショットの適応において、他のモデルよりも優れていることを示している。
論文 参考訳(メタデータ) (2022-06-09T17:12:32Z) - Lost Vibration Test Data Recovery Using Convolutional Neural Network: A
Case Study [0.0]
本稿では,アラモサキャニオン橋のCNNアルゴリズムを実構造として提案する。
3つの異なるCNNモデルは、1つと2つの故障したセンサーを予測するものとされた。
畳み込み層を追加することによりモデルの精度が向上した。
論文 参考訳(メタデータ) (2022-04-11T23:24:03Z) - Do We Really Need a Learnable Classifier at the End of Deep Neural
Network? [118.18554882199676]
本研究では、ニューラルネットワークを学習して分類器をランダムにETFとして分類し、訓練中に固定する可能性について検討する。
実験結果から,バランスの取れたデータセットの画像分類において,同様の性能が得られることがわかった。
論文 参考訳(メタデータ) (2022-03-17T04:34:28Z) - Interpreting Graph Neural Networks for NLP With Differentiable Edge
Masking [63.49779304362376]
グラフニューラルネットワーク(GNN)は、構造的帰納バイアスをNLPモデルに統合する一般的なアプローチとなっている。
本稿では,不要なエッジを識別するGNNの予測を解釈するポストホック手法を提案する。
モデルの性能を劣化させることなく,多数のエッジを落とせることを示す。
論文 参考訳(メタデータ) (2020-10-01T17:51:19Z) - ACDC: Weight Sharing in Atom-Coefficient Decomposed Convolution [57.635467829558664]
我々は,CNNにおいて,畳み込みカーネル間の構造正則化を導入する。
我々はCNNがパラメータや計算量を劇的に減らして性能を維持していることを示す。
論文 参考訳(メタデータ) (2020-09-04T20:41:47Z) - Convolutional neural networks for classification and regression analysis
of one-dimensional spectral data [0.0]
畳み込みニューラルネットワーク(CNN)は画像認識やテキスト解析に広く利用されている。
CNNの性能をスペクトルデータの分類と回帰分析のために検討した。
論文 参考訳(メタデータ) (2020-05-15T13:20:05Z) - Approximation and Non-parametric Estimation of ResNet-type Convolutional
Neural Networks [52.972605601174955]
本稿では,ResNet型CNNが重要な関数クラスにおいて最小誤差率を達成可能であることを示す。
Barron と H'older のクラスに対する前述のタイプの CNN の近似と推定誤差率を導出する。
論文 参考訳(メタデータ) (2019-03-24T19:42:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。