論文の概要: Vision Based Machine Learning Algorithms for Out-of-Distribution
Generalisation
- arxiv url: http://arxiv.org/abs/2301.06975v1
- Date: Tue, 17 Jan 2023 15:58:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-18 13:42:28.998640
- Title: Vision Based Machine Learning Algorithms for Out-of-Distribution
Generalisation
- Title(参考訳): 分散一般化のためのビジョンベース機械学習アルゴリズム
- Authors: Hamza Riaz and Alan F. Smeaton
- Abstract要約: ドメインシフトに対処しなければならない場合、単純な畳み込みニューラルネットワーク(CNN)ベースのディープラーニング手法が不十分であることを示す。
PACSとOffice-Homeの2つの人気のあるビジョンベースのベンチマークで実験が行われている。
- 参考スコア(独自算出の注目度): 3.236217153362305
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There are many computer vision applications including object segmentation,
classification, object detection, and reconstruction for which machine learning
(ML) shows state-of-the-art performance. Nowadays, we can build ML tools for
such applications with real-world accuracy. However, each tool works well
within the domain in which it has been trained and developed. Often, when we
train a model on a dataset in one specific domain and test on another unseen
domain known as an out of distribution (OOD) dataset, models or ML tools show a
decrease in performance. For instance, when we train a simple classifier on
real-world images and apply that model on the same classes but with a different
domain like cartoons, paintings or sketches then the performance of ML tools
disappoints. This presents serious challenges of domain generalisation (DG),
domain adaptation (DA), and domain shifting. To enhance the power of ML tools,
we can rebuild and retrain models from scratch or we can perform transfer
learning. In this paper, we present a comparison study between vision-based
technologies for domain-specific and domain-generalised methods. In this
research we highlight that simple convolutional neural network (CNN) based deep
learning methods perform poorly when they have to tackle domain shifting.
Experiments are conducted on two popular vision-based benchmarks, PACS and
Office-Home. We introduce an implementation pipeline for domain generalisation
methods and conventional deep learning models. The outcome confirms that
CNN-based deep learning models show poor generalisation compare to other
extensive methods.
- Abstract(参考訳): オブジェクトセグメンテーション、分類、オブジェクト検出、再構築など多くのコンピュータビジョンアプリケーションがあり、機械学習(ML)は最先端のパフォーマンスを示している。
現在、そのようなアプリケーションのためのMLツールを現実の精度で構築できる。
しかし、各ツールは、それが訓練され開発されているドメイン内でうまく機能する。
ある特定のドメインのデータセット上でモデルをトレーニングし、OOD(out of distribution)データセットとして知られる別の見えないドメインでテストする場合、モデルやMLツールはパフォーマンスの低下を示しています。
例えば、実世界のイメージに対して単純な分類器をトレーニングし、同じクラスにそのモデルを適用した場合、漫画、絵、スケッチのような異なるドメインで、MLツールのパフォーマンスは失望します。
これは、ドメイン一般化(DG)、ドメイン適応(DA)、ドメインシフトといった重大な課題を示す。
mlツールのパワーを高めるために、モデルをスクラッチから再構築し、再トレーニングしたり、転送学習を実行できる。
本稿では,ドメイン固有手法とドメイン一般化手法の視覚ベース技術の比較研究を行う。
本研究では,単純な畳み込みニューラルネットワーク(cnn)ベースのディープラーニング手法が,ドメインシフトに対処しなければならない場合,性能に乏しいことを強調する。
PACSとOffice-Homeの2つの人気のあるビジョンベースのベンチマークで実験が行われている。
本稿では,ドメイン一般化手法と従来のディープラーニングモデルの実装パイプラインを紹介する。
その結果、CNNに基づくディープラーニングモデルでは、他の広範囲な手法と比較して一般化が不十分であることが確認された。
関連論文リスト
- Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - CHALLENGER: Training with Attribution Maps [63.736435657236505]
ニューラルネットワークのトレーニングに属性マップを利用すると、モデルの正規化が向上し、性能が向上することを示す。
特に、我々の汎用的なドメインに依存しないアプローチは、ビジョン、自然言語処理、時系列タスクにおける最先端の結果をもたらすことを示す。
論文 参考訳(メタデータ) (2022-05-30T13:34:46Z) - Comparison Analysis of Traditional Machine Learning and Deep Learning
Techniques for Data and Image Classification [62.997667081978825]
本研究の目的は、コンピュータビジョン2次元オブジェクト分類タスクに使用される最も一般的な機械学習およびディープラーニング技術を分析し比較することである。
まず、視覚語モデルと深部畳み込みニューラルネットワーク(DCNN)の理論的背景を示す。
次に、Bag of Visual Wordsモデル、VGG16 CNN Architectureを実装します。
論文 参考訳(メタデータ) (2022-04-11T11:34:43Z) - Improving the Generalization of Meta-learning on Unseen Domains via
Adversarial Shift [3.1219977244201056]
ドメインシフトをシミュレートし、擬似タスクを生成する方法を学ぶためのモデルに依存しないシフト層を提案する。
擬似的なタスクに基づいて、メタ学習モデルはクロスドメインメタ知識を学習することができる。
論文 参考訳(メタデータ) (2021-07-23T07:29:30Z) - Semi-supervised Meta-learning with Disentanglement for
Domain-generalised Medical Image Segmentation [15.351113774542839]
新たなセンター(ここではドメイン)からの新しいデータにモデルを一般化することは、依然として課題である。
本稿では,絡み合いを伴う半教師付きメタラーニングフレームワークを提案する。
提案手法は,異なるセグメンテーションタスクに対して頑健であり,2つの公開ベンチマーク上での最先端の一般化性能を実現する。
論文 参考訳(メタデータ) (2021-06-24T19:50:07Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Revisiting Contrastive Methods for Unsupervised Learning of Visual
Representations [78.12377360145078]
対照的な自己教師型学習は、セグメンテーションやオブジェクト検出といった多くの下流タスクにおいて教師付き事前訓練よりも優れています。
本稿では,データセットのバイアスが既存手法にどのように影響するかを最初に検討する。
現在のコントラストアプローチは、(i)オブジェクト中心対シーン中心、(ii)一様対ロングテール、(iii)一般対ドメイン固有データセットなど、驚くほどうまく機能することを示す。
論文 参考訳(メタデータ) (2021-06-10T17:59:13Z) - Learning to Generalize Unseen Domains via Memory-based Multi-Source
Meta-Learning for Person Re-Identification [59.326456778057384]
本稿では,メモリベースのマルチソースメタラーニングフレームワークを提案する。
また,メタテスト機能を多様化するメタバッチ正規化層(MetaBN)を提案する。
実験により、M$3$Lは、目に見えない領域に対するモデルの一般化能力を効果的に向上できることが示された。
論文 参考訳(メタデータ) (2020-12-01T11:38:16Z) - Unsupervised Neural Machine Translation for Low-Resource Domains via
Meta-Learning [27.86606560170401]
unsupervised neural machine translation (UNMT) のための新しいメタ学習アルゴリズムを提案する。
私たちは、少量のトレーニングデータだけを利用して、別のドメインに適応するようにモデルを訓練します。
我々のモデルは、最大2-4 BLEUスコアの転送学習に基づくアプローチを超越している。
論文 参考訳(メタデータ) (2020-10-18T17:54:13Z) - Improving the Performance of Fine-Grain Image Classifiers via Generative
Data Augmentation [0.5161531917413706]
我々は、ロバスト生成アドリアルネットワーク(DAPPER GAN)の熟練した事前学習からデータ拡張を開発する。
DAPPER GANは、トレーニングイメージの新しいビューを自動的に生成するML分析支援ツールである。
本手法をStanford Carsデータセット上で実験的に評価し,車体形状とモデル分類精度の向上を実証した。
論文 参考訳(メタデータ) (2020-08-12T15:29:11Z) - Eigen-CAM: Class Activation Map using Principal Components [1.2691047660244335]
この論文は、解釈可能で堅牢で透明なモデルに対する需要の増加に対応するために、従来の考え方に基づいている。
提案したEigen-CAMは、畳み込み層から学習した特徴/表現の基本的なコンポーネントを計算し、視覚化する。
論文 参考訳(メタデータ) (2020-08-01T17:14:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。