論文の概要: Radon cumulative distribution transform subspace modeling for image
classification
- arxiv url: http://arxiv.org/abs/2004.03669v3
- Date: Wed, 2 Mar 2022 20:43:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 23:41:43.813003
- Title: Radon cumulative distribution transform subspace modeling for image
classification
- Title(参考訳): 画像分類のためのラドン累積分布変換部分空間モデリング
- Authors: Mohammad Shifat-E-Rabbi, Xuwang Yin, Abu Hasnat Mohammad Rubaiyat,
Shiying Li, Soheil Kolouri, Akram Aldroubi, Jonathan M. Nichols, and Gustavo
K. Rohde
- Abstract要約: 画像変形モデルの幅広いクラスに適用可能な新しい教師付き画像分類法を提案する。
この方法は、画像データに先述のRandon Cumulative Distribution Transform(R-CDT)を用いる。
テスト精度の向上に加えて,計算効率の向上も示す。
- 参考スコア(独自算出の注目度): 18.709734704950804
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a new supervised image classification method applicable to a broad
class of image deformation models. The method makes use of the previously
described Radon Cumulative Distribution Transform (R-CDT) for image data, whose
mathematical properties are exploited to express the image data in a form that
is more suitable for machine learning. While certain operations such as
translation, scaling, and higher-order transformations are challenging to model
in native image space, we show the R-CDT can capture some of these variations
and thus render the associated image classification problems easier to solve.
The method -- utilizing a nearest-subspace algorithm in R-CDT space -- is
simple to implement, non-iterative, has no hyper-parameters to tune, is
computationally efficient, label efficient, and provides competitive accuracies
to state-of-the-art neural networks for many types of classification problems.
In addition to the test accuracy performances, we show improvements (with
respect to neural network-based methods) in terms of computational efficiency
(it can be implemented without the use of GPUs), number of training samples
needed for training, as well as out-of-distribution generalization. The Python
code for reproducing our results is available at
https://github.com/rohdelab/rcdt_ns_classifier.
- Abstract(参考訳): 画像変形モデルの幅広いクラスに適用可能な新しい教師付き画像分類法を提案する。
この方法は、前述のRandon Cumulative Distribution Transform (R-CDT) を画像データに利用し、その数学的特性を利用して画像データを機械学習により適した形で表現する。
変換やスケーリング,高次変換といった特定の操作は,ネイティブな画像空間においてモデル化することが難しいが,R-CDTはこれらのバリエーションのいくつかを捉え,関連する画像分類問題を解くのが容易であることを示す。
r-cdt空間で最寄りのサブスペースアルゴリズムを利用するこの手法は、実装が簡単で、非イテレーティブで、チューニングするハイパーパラメータがなく、計算効率が高く、ラベル効率が高く、多くの種類の分類問題に対して最先端のニューラルネットワークに競合性を提供する。
テスト精度のパフォーマンスに加えて、計算効率(GPUを使わずに実装できる)、トレーニングに必要なトレーニングサンプルの数、アウト・オブ・ディストリビューションの一般化といった点において、(ニューラルネットワークベースの手法に関して)改善点を示す。
結果を再現するためのpythonコードはhttps://github.com/rohdelab/rcdt_ns_classifierで入手できる。
関連論文リスト
- Performance of GAN-based augmentation for deep learning COVID-19 image
classification [57.1795052451257]
ディープラーニングを医療分野に適用する上で最大の課題は、トレーニングデータの提供である。
データ拡張は、限られたデータセットに直面した時に機械学習で使用される典型的な方法論である。
本研究は, 新型コロナウイルスの胸部X線画像セットを限定して, StyleGAN2-ADAモデルを用いて訓練するものである。
論文 参考訳(メタデータ) (2023-04-18T15:39:58Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Large-Margin Representation Learning for Texture Classification [67.94823375350433]
本稿では,テクスチャ分類のための小さなデータセット上で教師付きモデルをトレーニングするために,畳み込み層(CL)と大規模計量学習を組み合わせた新しいアプローチを提案する。
テクスチャと病理画像データセットの実験結果から,提案手法は同等のCNNと比較して計算コストが低く,収束が早く,競争精度が向上することが示された。
論文 参考訳(メタデータ) (2022-06-17T04:07:45Z) - TransformNet: Self-supervised representation learning through predicting
geometric transformations [0.8098097078441623]
入力データに適用された幾何変換の認識のための教師なし意味特徴学習手法について述べる。
我々のアプローチの基本概念は、画像中の物体を知らない人が、それらに適用された幾何学的変換を定量的に予測できないことである。
論文 参考訳(メタデータ) (2022-02-08T22:41:01Z) - Feature transforms for image data augmentation [74.12025519234153]
画像分類において、多くの拡張アプローチは単純な画像操作アルゴリズムを利用する。
本研究では,14種類の拡張アプローチを組み合わせて生成した画像を追加することで,データレベルでのアンサンブルを構築する。
事前トレーニングされたResNet50ネットワークは、各拡張メソッドから派生した画像を含むトレーニングセットに基づいて微調整される。
論文 参考訳(メタデータ) (2022-01-24T14:12:29Z) - Invariance encoding in sliced-Wasserstein space for image classification
with limited training data [10.435990685398595]
我々は、ラドン累積分布変換(R-CDT)の特定の数学的性質を利用して、スライスされたワッサーシュタイン空間における最近傍部分空間分類モデルを数学的に拡張することを提案する。
特定の学習問題に対して,我々の数学的解法は,分類精度と計算複雑性の観点から,深層CNNによるデータ拡張よりも有利であることを示す。
論文 参考訳(メタデータ) (2022-01-09T10:25:27Z) - FeatMatch: Feature-Based Augmentation for Semi-Supervised Learning [64.32306537419498]
本稿では,複雑な変換を多様に生成する特徴量に基づく改良・拡張手法を提案する。
これらの変換は、クラスタリングを通じて抽出したクラス内およびクラス間の両方の情報も利用します。
提案手法は,大規模データセットにスケールアップしながら,より小さなデータセットに対して,現在の最先端技術に匹敵するものであることを実証する。
論文 参考訳(メタデータ) (2020-07-16T17:55:31Z) - Learning to Learn Parameterized Classification Networks for Scalable
Input Images [76.44375136492827]
畳み込みニューラルネットワーク(CNN)は、入力解像度の変化に関して予測可能な認識動作を持たない。
我々はメタラーナーを用いて、様々な入力スケールのメインネットワークの畳み込み重みを生成する。
さらに、異なる入力解像度に基づいて、モデル予測よりもフライでの知識蒸留を利用する。
論文 参考訳(メタデータ) (2020-07-13T04:27:25Z) - Improving accuracy and speeding up Document Image Classification through
parallel systems [4.102028235659611]
RVL-CDIPデータセットで、より軽量なモデルで以前の結果を改善することができることを示す。
画像入力のみを増強できるアンサンブルパイプラインを提案する。
最後に、PyTorchとDeep Learningフレームワーク間のトレーニングパフォーマンスの違いを明らかにします。
論文 参考訳(メタデータ) (2020-06-16T13:36:07Z) - Adaptive Fractional Dilated Convolution Network for Image Aesthetics
Assessment [33.945579916184364]
適応型分数拡張畳み込み(AFDC)は、畳み込みカーネルレベルでこの問題に取り組むために開発された。
ミニバッチ学習のための簡潔な定式化を行い,グループ化戦略を用いて計算オーバーヘッドを削減する。
提案手法は,AVAデータセットを用いた画像美学評価において,最先端の性能を実現することを実証した。
論文 参考訳(メタデータ) (2020-04-06T21:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。