論文の概要: Learning Robust Convolutional Neural Networks with Relevant Feature
Focusing via Explanations
- arxiv url: http://arxiv.org/abs/2202.04237v1
- Date: Wed, 9 Feb 2022 02:46:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-10 14:23:48.720529
- Title: Learning Robust Convolutional Neural Networks with Relevant Feature
Focusing via Explanations
- Title(参考訳): 説明による特徴量に着目したロバスト畳み込みニューラルネットワークの学習
- Authors: Kazuki Adachi, Shin'ya Yamaguchi
- Abstract要約: 畳み込みニューラルネットワーク(CNN)のための関連する特徴集中(ReFF)を提案する。
ReFFはタスク関連機能を検出し、説明出力(Grad-CAMなど)を介してCNNを正規化する
我々は、ReFFで訓練されたCNNが対象タスクに関連する機能に注目し、ReFFがテスト時間精度を向上させることを実証した。
- 参考スコア(独自算出の注目度): 1.8275108630751844
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing image recognition techniques based on convolutional neural networks
(CNNs) basically assume that the training and test datasets are sampled from
i.i.d distributions. However, this assumption is easily broken in the real
world because of the distribution shift that occurs when the co-occurrence
relations between objects and backgrounds in input images change. Under this
type of distribution shift, CNNs learn to focus on features that are not
task-relevant, such as backgrounds from the training data, and degrade their
accuracy on the test data. To tackle this problem, we propose relevant feature
focusing (ReFF). ReFF detects task-relevant features and regularizes CNNs via
explanation outputs (e.g., Grad-CAM). Since ReFF is composed of post-hoc
explanation modules, it can be easily applied to off-the-shelf CNNs.
Furthermore, ReFF requires no additional inference cost at test time because it
is only used for regularization while training. We demonstrate that CNNs
trained with ReFF focus on features relevant to the target task and that ReFF
improves the test-time accuracy.
- Abstract(参考訳): 畳み込みニューラルネットワーク(CNN)に基づく既存の画像認識技術は、基本的にトレーニングとテストデータセットがi.d分布からサンプリングされていると仮定する。
しかし、この仮定は、入力画像におけるオブジェクトと背景の共起関係が変化するときに発生する分布シフトのため、現実世界では容易に破られる。
このような分散シフトの下で、cnnは、トレーニングデータからのバックグラウンドなどタスクに関係のない機能に注目し、テストデータの精度を低下させることを学ぶ。
この問題に対処するために、関連する特徴焦点(ReFF)を提案する。
ReFFはタスク関連機能を検出し、説明出力(Grad-CAMなど)を通じてCNNを正規化する。
ReFFはポストホックな説明モジュールで構成されているので、市販のCNNにも容易に適用できる。
さらに、ReFFはトレーニング中に正規化にのみ使用されるため、テスト時に追加の推論コストを必要としない。
我々は、ReFFで訓練されたCNNが対象タスクに関連する機能に注目し、ReFFがテスト時間精度を向上させることを示した。
関連論文リスト
- When do Convolutional Neural Networks Stop Learning? [0.0]
畳み込みニューラルネットワーク(CNN)はコンピュータビジョンタスクにおいて優れた性能を示した。
現在の実践は、トレーニング損失が減少し、トレーニングと検証エラーの間のギャップが増加すると、トレーニングをやめることである。
この研究は、CNNの変種の全層にわたるデータ変動を分析し、その準最適学習能力を予測する仮説を導入している。
論文 参考訳(メタデータ) (2024-03-04T20:35:09Z) - Training Convolutional Neural Networks with the Forward-Forward
algorithm [1.74440662023704]
Forward Forward (FF)アルゴリズムは、現在まで完全に接続されたネットワークでしか使われていない。
FFパラダイムをCNNに拡張する方法を示す。
我々のFF学習したCNNは、空間的に拡張された新しいラベリング手法を特徴とし、MNISTの手書き桁データセットにおいて99.16%の分類精度を実現している。
論文 参考訳(メタデータ) (2023-12-22T18:56:35Z) - Random Padding Data Augmentation [23.70951896315126]
畳み込みニューラルネットワーク(CNN)は、画像内の異なる位置で同じ物体を学習する。
CNNにおける特徴情報の空間的情報の有用性はよく研究されていない。
我々はCNNを訓練するための新しいタイプのパディング手法であるランダムパディングを紹介する。
論文 参考訳(メタデータ) (2023-02-17T04:15:33Z) - Decoupled Mixup for Generalized Visual Recognition [71.13734761715472]
視覚認識のためのCNNモデルを学習するための新しい「デカップリング・ミクスアップ」手法を提案する。
本手法は,各画像を識別領域と雑音発生領域に分離し,これらの領域を均一に組み合わせてCNNモデルを訓練する。
実験結果から,未知のコンテキストからなるデータに対する本手法の高一般化性能を示す。
論文 参考訳(メタデータ) (2022-10-26T15:21:39Z) - CAFA: Class-Aware Feature Alignment for Test-Time Adaptation [50.26963784271912]
テスト時間適応(TTA)は、テスト時にラベルのないデータにモデルを適応させることによって、この問題に対処することを目的としている。
本稿では,クラス認識特徴アライメント(CAFA, Class-Aware Feature Alignment)と呼ばれる単純な機能アライメント損失を提案する。
論文 参考訳(メタデータ) (2022-06-01T03:02:07Z) - Feature Flow: In-network Feature Flow Estimation for Video Object
Detection [56.80974623192569]
光の流れはコンピュータビジョンのタスクで広く使われ、ピクセルレベルのモーション情報を提供する。
一般的なアプローチは、ニューラルネットワークへの前向き光学フローと、タスクデータセット上のこのネットワークの微調整である。
ビデオオブジェクト検出のための textbfIn-network textbfFeature textbfFlow 推定モジュールを用いた新しいネットワーク (IFF-Net) を提案する。
論文 参考訳(メタデータ) (2020-09-21T07:55:50Z) - RIFLE: Backpropagation in Depth for Deep Transfer Learning through
Re-Initializing the Fully-connected LayEr [60.07531696857743]
事前訓練されたモデルを用いたディープ畳み込みニューラルネットワーク(CNN)の微調整は、より大きなデータセットから学習した知識をターゲットタスクに転送するのに役立つ。
転送学習環境におけるバックプロパゲーションを深める戦略であるRIFLEを提案する。
RIFLEは、深いCNN層の重み付けに意味のあるアップデートをもたらし、低レベルの機能学習を改善する。
論文 参考訳(メタデータ) (2020-07-07T11:27:43Z) - Self-Challenging Improves Cross-Domain Generalization [81.99554996975372]
畳み込みニューラルネットワーク(CNN)は、ラベルと相関する支配的特徴を活性化することにより、画像分類を行う。
ドメイン外データに対するCNNの一般化を著しく改善する簡単なトレーニングである自己整合表現(RSC)を導入する。
RSCはトレーニングデータ上で活性化される主要な機能に対して反復的に挑戦し、ラベルと相関する残りの機能を有効にするようネットワークに強制する。
論文 参考訳(メタデータ) (2020-07-05T21:42:26Z) - Teaching CNNs to mimic Human Visual Cognitive Process & regularise
Texture-Shape bias [18.003188982585737]
コンピュータビジョンにおける最近の実験は、畳み込みニューラルネットワーク(CNN)を用いたモデルにおいて、テクスチャバイアスが最高の結果の主因であることを実証している。
コスト関数は、CNNが欲張りなアプローチを採り、テクスチャのような局所的な情報に対する生産性を向上させ、その結果、グローバルな統計を探索することができないと信じられている。
画像の再構成と分類に形状,テクスチャ,エッジなどの人間の解釈可能な特徴を活用するために,心理学における特徴統合理論から着想を得た,新しい直感的なアーキテクチャであるCognitiveCNNを提案する。
論文 参考訳(メタデータ) (2020-06-25T22:32:54Z) - The Neural Tangent Link Between CNN Denoisers and Non-Local Filters [4.254099382808598]
畳み込みニューラルネットワーク(CNN)は現在、計算画像問題を解決するための確立されたツールである。
ニューラルネットワークタンジェント(NTK)とよく知られた非局所フィルタリング技術によるネットワーク間の公式なリンクを導入する。
本研究は,広範囲な画像復号化実験により評価した。
論文 参考訳(メタデータ) (2020-06-03T16:50:54Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。