論文の概要: Background Invariant Classification on Infrared Imagery by Data
Efficient Training and Reducing Bias in CNNs
- arxiv url: http://arxiv.org/abs/2201.09144v1
- Date: Sat, 22 Jan 2022 23:29:42 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-28 03:33:27.896526
- Title: Background Invariant Classification on Infrared Imagery by Data
Efficient Training and Reducing Bias in CNNs
- Title(参考訳): CNNにおけるデータ効率向上とバイアス低減による赤外画像の背景不変分類
- Authors: Maliha Arif, Calvin Yong, Abhijit Mahalanobis
- Abstract要約: 畳み込みニューラルネットワークは 画像中の物体を 正確に分類できます
ネットワークの注意が常にシーンのセマンティックな重要な領域にあるとは限らないことはよく知られている。
我々は、赤外線画像とRGBデータの両方におけるCNNのバイアスを低減するために、textitsplit trainingと呼ばれる2段階のトレーニング手順を提案する。
- 参考スコア(独自算出の注目度): 1.2891210250935146
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Even though convolutional neural networks can classify objects in images very
accurately, it is well known that the attention of the network may not always
be on the semantically important regions of the scene. It has been observed
that networks often learn background textures which are not relevant to the
object of interest. In turn this makes the networks susceptible to variations
and changes in the background which negatively affect their performance. We
propose a new two-step training procedure called \textit{split training} to
reduce this bias in CNNs on both Infrared imagery and RGB data. Our split
training procedure has two steps: using MSE loss first train the layers of the
network on images with background to match the activations of the same network
when it is trained using images without background; then with these layers
frozen, train the rest of the network with cross-entropy loss to classify the
objects. Our training method outperforms the traditional training procedure in
both a simple CNN architecture, and deep CNNs like VGG and Densenet which use
lots of hardware resources, and learns to mimic human vision which focuses more
on shape and structure than background with higher accuracy.
- Abstract(参考訳): 畳み込みニューラルネットワークは、画像中のオブジェクトを非常に正確に分類することができるが、ネットワークの注意が常にシーンのセマンティックな重要な領域にあるとは限らないことはよく知られている。
ネットワークはしばしば、関心の対象とは無関係な背景テクスチャを学習することが観察されている。
これにより、ネットワークはバックグラウンドのバリエーションや変化に影響を受けやすくなり、パフォーマンスに悪影響を及ぼす。
Infrared image と RGB data の CNN におけるこのバイアスを低減するために,新しい2段階のトレーニング手法である \textit{split training} を提案する。
我々の分断訓練手順には2つのステップがある: まず、背景のない画像を用いて同じネットワークのアクティベーションに合うように、背景を持つ画像上のネットワークの層をトレーニングし、次にこれらの層を凍結して、残りの層をクロスエントロピーロスでトレーニングしてオブジェクトを分類する。
我々のトレーニング方法は、単純なCNNアーキテクチャと、多くのハードウェアリソースを使用するVGGやDensenetのようなディープCNNの両方で従来のトレーニング手順より優れており、より高精度な背景よりも形状や構造に重点を置いた人間の視覚を模倣することを学ぶ。
関連論文リスト
- Neural Maximum A Posteriori Estimation on Unpaired Data for Motion
Deblurring [87.97330195531029]
本稿では、ニューラルネットワークをトレーニングし、失明したデータから視覚情報や鋭いコンテンツを復元するためのニューラルネットワークの最大Aポストエリオリ(NeurMAP)推定フレームワークを提案する。
提案されたNeurMAPは、既存のデブロアリングニューラルネットワークに対するアプローチであり、未使用データセット上のイメージデブロアリングネットワークのトレーニングを可能にする最初のフレームワークである。
論文 参考訳(メタデータ) (2022-04-26T08:09:47Z) - Is Deep Image Prior in Need of a Good Education? [57.3399060347311]
画像再構成に有効な先行画像として, 奥行き画像が導入された。
その印象的な再建性にもかかわらず、学習技術や伝統的な再建技術と比べてアプローチは遅い。
計算課題に対処する2段階の学習パラダイムを開発する。
論文 参考訳(メタデータ) (2021-11-23T15:08:26Z) - Weakly-supervised fire segmentation by visualizing intermediate CNN
layers [82.75113406937194]
画像やビデオにおける火の局所化は、火災事故に対処するための自律システムにとって重要なステップである。
我々は,ネットワークのトレーニングに画像ラベルのみを使用する,画像中の火の弱い制御セグメント化について検討する。
CNNの中間層における特徴量の平均値は,2値セグメンテーション問題である火災セグメンテーションの場合,従来のクラスアクティベーションマッピング(CAM)法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-16T11:56:28Z) - ResMLP: Feedforward networks for image classification with
data-efficient training [73.26364887378597]
画像分類のための多層パーセプトロン上に構築されたアーキテクチャであるResMLPを提案する。
Timmライブラリと事前トレーニングされたモデルに基づいたコードを共有します。
論文 参考訳(メタデータ) (2021-05-07T17:31:44Z) - Image Restoration by Deep Projected GSURE [115.57142046076164]
Ill-posed inverse problem は、デブロアリングや超解像など、多くの画像処理アプリケーションに現れる。
本稿では,一般化されたSteinUnbiased Risk Estimator(GSURE)の「投影変換」とCNNによる潜在画像のパラメータ化を含む損失関数の最小化に基づく,新たな画像復元フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-04T08:52:46Z) - Increasing the Robustness of Semantic Segmentation Models with
Painting-by-Numbers [39.95214171175713]
我々は,物体の形状に対するネットワークバイアスを増大させることにより,出力を改善することができる画像分類からの洞察に基づいて構築する。
我々の基本的な考え方は、RGBトレーニング画像の一部を偽画像でアルファブレンドすることであり、各クラスラベルには、固定されたランダムに選択された色が与えられる。
各種ネットワークバックボーン,MobileNet-V2,ResNets,Xceptionを用いたDeepLabv3+のトレーニングスキーマの有効性を実証し,Cityscapesデータセットで評価した。
論文 参考訳(メタデータ) (2020-10-12T07:42:39Z) - Deep Artifact-Free Residual Network for Single Image Super-Resolution [0.2399911126932526]
本研究では,残差学習の利点と,地中構造像を目標として用いることの利点を活かしたDAFR(Deep Artifact-Free Residual)ネットワークを提案する。
我々のフレームワークは、高品質な画像再構成に必要な高周波情報を抽出するために、ディープモデルを用いている。
実験の結果,提案手法は既存の手法に比べて定量的,定性的な画像品質を実現することがわかった。
論文 参考訳(メタデータ) (2020-09-25T20:53:55Z) - The Neural Tangent Link Between CNN Denoisers and Non-Local Filters [4.254099382808598]
畳み込みニューラルネットワーク(CNN)は現在、計算画像問題を解決するための確立されたツールである。
ニューラルネットワークタンジェント(NTK)とよく知られた非局所フィルタリング技術によるネットワーク間の公式なリンクを導入する。
本研究は,広範囲な画像復号化実験により評価した。
論文 参考訳(メタデータ) (2020-06-03T16:50:54Z) - Curriculum By Smoothing [52.08553521577014]
畳み込みニューラルネットワーク(CNN)は、画像分類、検出、セグメンテーションなどのコンピュータビジョンタスクにおいて顕著な性能を示している。
アンチエイリアスフィルタやローパスフィルタを用いてCNNの機能埋め込みを円滑化するエレガントなカリキュラムベースのスキームを提案する。
トレーニング中に特徴マップ内の情報量が増加するにつれて、ネットワークはデータのより優れた表現を徐々に学習することができる。
論文 参考訳(メタデータ) (2020-03-03T07:27:44Z) - Retrain or not retrain? -- efficient pruning methods of deep CNN
networks [0.30458514384586394]
畳み込みニューラルネットワーク(CNN)は、画像分類、オブジェクト検出、セマンティックセグメンテーションといった画像処理タスクにおいて重要な役割を果たしている。
CNNネットワークは数百から数百の積み重ねレイヤーと数メガバイトの重みを持つことが多い。
複雑性とメモリフットプリントを削減する方法の1つは、プルーニングである。
論文 参考訳(メタデータ) (2020-02-12T23:24:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。