論文の概要: Human-Aided Saliency Maps Improve Generalization of Deep Learning
- arxiv url: http://arxiv.org/abs/2105.03492v1
- Date: Fri, 7 May 2021 20:24:40 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-11 14:59:30.290235
- Title: Human-Aided Saliency Maps Improve Generalization of Deep Learning
- Title(参考訳): 深層学習の一般化を向上する人間支援サリエンシマップ
- Authors: Aidan Boyd, Kevin Bowyer, Adam Czajka
- Abstract要約: 画像のサラエント領域に関する人間の判断をトレーニングデータにエンコードする。
バイオメトリック提示攻撃検出における難しい問題に対して,最先端のディープラーニングアルゴリズムの精度と一般化を比較した。
後者のアプローチは、より高い精度とより良い一般化を達成し、LivDet-Iris 2020の勝者のエラーを29.78%から16.37%に減少させるモデルをもたらす。
- 参考スコア(独自算出の注目度): 5.723697351415206
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning has driven remarkable accuracy increases in many computer
vision problems. One ongoing challenge is how to achieve the greatest accuracy
in cases where training data is limited. A second ongoing challenge is that
trained models are sometimes fragile in the sense that the accuracy achieved
does not generalize well, even to new data that is subjectively similar to the
training set. We address these challenges in a novel way, with the first-ever
(to our knowledge) exploration of encoding human judgement about salient
regions of images into the training data. We compare the accuracy and
generalization of a state-of-the-art deep learning algorithm for a difficult
problem in biometric presentation attack detection when trained on (a) original
images with typical data augmentations, and (b) the same original images
transformed to encode human judgement about salient image regions. The latter
approach results in models that achieve higher accuracy and better
generalization, decreasing the error of the LivDet-Iris 2020 winner from 29.78%
to 16.37%, and achieving impressive generalization in a
leave-one-attack-type-out evaluation scenario. This work opens a new area of
study for how to embed human intelligence into training strategies for deep
learning to achieve high accuracy and generalization in cases of limited
training data.
- Abstract(参考訳): ディープラーニングは多くのコンピュータビジョン問題において顕著な精度の向上をもたらした。
進行中の課題のひとつは、トレーニングデータが制限された場合の最大の精度を達成する方法だ。
第2の課題は、トレーニングセットと主観的に類似した新しいデータでさえも、達成された精度がうまく一般化しないという意味で、トレーニングされたモデルが脆弱な場合があることだ。
画像の正常な領域に関する人間の判断をトレーニングデータにエンコードする、初めての(私たちの知る限り)調査によって、これらの課題に新しい方法で対処する。
本稿では,(a)オリジナル画像に典型的データ拡張を加えた場合の生体情報提示アタック検出における難しい問題に対して,最先端のディープラーニングアルゴリズムの精度と一般化を比較し,(b)サルエント画像領域に関する人間の判断をエンコードするように変換した同じオリジナル画像と比較する。
後者のアプローチは、より高い精度とより良い一般化を実現し、LivDet-Iris 2020の勝者の誤差を29.78%から16.37%に減らし、離脱攻撃型評価シナリオにおいて印象的な一般化を実現した。
この研究は、人間の知性を深層学習の訓練戦略に組み込んで、限られた訓練データの場合の高精度化と一般化を実現するための新しい研究分野を開く。
関連論文リスト
- What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - MENTOR: Human Perception-Guided Pretraining for Increased Generalization [5.596752018167751]
MENTOR (huMan pErceptioN-guided preTraining fOr increased geneRalization) を紹介する。
我々は、クラスラベルを使わずに、入力された画像からヒトの唾液マップを学習するためにオートエンコーダを訓練する。
我々は、デコーダ部分を取り除き、エンコーダの上に分類層を追加し、従来の新しいモデルを微調整する。
論文 参考訳(メタデータ) (2023-10-30T13:50:44Z) - Rapid Training Data Creation by Synthesizing Medical Images for
Classification and Localization [10.506584969668792]
本稿では,この問題を解決するために,任意のディープニューラルネットワークをトレーニングするための実データ変換手法を提案する。
弱教師付きモデルでは,生成したデータを用いて局所化精度が著しく向上することを示す。
後者のモデルでは、生成した画像でトレーニングされた精度は、完全に注釈付けされた実画像でトレーニングされた精度と密接に一致している。
論文 参考訳(メタデータ) (2023-08-09T03:49:12Z) - Pruning Distorted Images in MNIST Handwritten Digits [0.0]
手書き文字を認識できる2段階の深層学習手法を提案する。
最初の段階では、トレーニングセット内で歪んだ桁を識別する単純なニューラルネットワークを作成します。
第2段階では、これらの識別された画像をトレーニングデータセットから除外し、フィルタデータセットを使用してモデルを再トレーニングする。
実験の結果,提案手法の有効性を実証し,テストデータセットの精度を99.5%以上とした。
論文 参考訳(メタデータ) (2023-05-26T11:44:35Z) - CutPaste: Self-Supervised Learning for Anomaly Detection and
Localization [59.719925639875036]
通常のトレーニングデータのみを用いて異常検知器を構築するためのフレームワークを提案する。
まず、自己教師付き深層表現を学習し、学習した表現の上に生成的1クラス分類器を構築する。
MVTec異常検出データセットに関する実証研究は,提案アルゴリズムが実世界の様々な欠陥を検出可能であることを実証している。
論文 参考訳(メタデータ) (2021-04-08T19:04:55Z) - Pre-training strategies and datasets for facial representation learning [58.8289362536262]
いくつかの顔分析タスクやデータセットに適用可能な普遍的な顔表現の探索方法を示す。
顔に適応する2つの大規模表現学習を体系的に検討する。
私たちの主な2つの発見は以下の通りです: 完全にインザワイルドな未処理データに対する教師なし事前トレーニングは一貫性を提供し、場合によっては大幅な精度向上をもたらします。
論文 参考訳(メタデータ) (2021-03-30T17:57:25Z) - Deepfake Forensics via An Adversarial Game [99.84099103679816]
顔偽造と画像・映像品質の両面での一般化能力向上のための対人訓練を提唱する。
AIベースの顔操作は、しばしば、一般化が困難であるモデルによって容易に発見できる高周波アーティファクトにつながることを考慮し、これらの特定のアーティファクトを曖昧にしようとする新しい逆トレーニング手法を提案する。
論文 参考訳(メタデータ) (2021-03-25T02:20:08Z) - Data optimization for large batch distributed training of deep neural
networks [0.19336815376402716]
ディープニューラルネットワークの分散トレーニングの現在のプラクティスは、大規模運用における通信ボトルネックの課題に直面している。
本研究では,局所的ミニマの少ない損失環境を暗黙的に平滑化するために,機械学習を用いたデータ最適化手法を提案する。
当社のアプローチでは,機能学習において重要でないデータポイントをフィルタリングすることで,より大きなバッチサイズでのモデルのトレーニングを高速化し,精度の向上を実現しています。
論文 参考訳(メタデータ) (2020-12-16T21:22:02Z) - Deep Traffic Sign Detection and Recognition Without Target Domain Real
Images [52.079665469286496]
本稿では,ターゲットドメインからの実際の画像を必要としない新しいデータベース生成手法と,(ii)交通標識のテンプレートを提案する。
この方法は、実際のデータでトレーニングを克服することではなく、実際のデータが利用できない場合に互換性のある代替手段になることを目的としている。
大規模なデータセットでは、完全に合成されたデータセットによるトレーニングは、実際のデータセットとトレーニングのパフォーマンスにほぼ一致する。
論文 参考訳(メタデータ) (2020-07-30T21:06:47Z) - Semi-Siamese Training for Shallow Face Learning [78.7386209619276]
セミ・シームズ・トレーニング(SST)という新しいトレーニング手法を導入する。
一対のセミ・シームズネットワークが前方伝播構造を構成し、トレーニング損失を更新ギャラリーキューで計算する。
提案手法は外部依存を伴わずに開発されており,既存の損失関数やネットワークアーキテクチャと柔軟に統合することができる。
論文 参考訳(メタデータ) (2020-07-16T15:20:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。