論文の概要: Deep Learning Image Recognition for Non-images
- arxiv url: http://arxiv.org/abs/2106.14350v1
- Date: Mon, 28 Jun 2021 00:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 13:55:31.883709
- Title: Deep Learning Image Recognition for Non-images
- Title(参考訳): 非画像のためのディープラーニング画像認識
- Authors: Boris Kovalerchuk, Divya Chandrika Kalla, Bedant Agarwal
- Abstract要約: CPC-Rアルゴリズムは、非画像データを可視化することにより、非画像データを画像に変換する。
ディープラーニングCNNアルゴリズムは、これらの画像の学習問題を解決する。
- 参考スコア(独自算出の注目度): 6.88204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Powerful deep learning algorithms open an opportunity for solving non-image
Machine Learning (ML) problems by transforming these problems to into the image
recognition problems. The CPC-R algorithm presented in this chapter converts
non-image data into images by visualizing non-image data. Then deep learning
CNN algorithms solve the learning problems on these images. The design of the
CPC-R algorithm allows preserving all high-dimensional information in 2-D
images. The use of pair values mapping instead of single value mapping used in
the alternative approaches allows encoding each n-D point with 2 times fewer
visual elements. The attributes of an n-D point are divided into pairs of its
values and each pair is visualized as 2-D points in the same 2-D Cartesian
coordinates. Next, grey scale or color intensity values are assigned to each
pair to encode the order of pairs. This is resulted in the heatmap image. The
computational experiments with CPC-R are conducted for different CNN
architectures, and methods to optimize the CPC-R images showing that the
combined CPC-R and deep learning CNN algorithms are able to solve non-image ML
problems reaching high accuracy on the benchmark datasets. This chapter expands
our prior work by adding more experiments to test accuracy of classification,
exploring saliency and informativeness of discovered features to test their
interpretability, and generalizing the approach.
- Abstract(参考訳): 強力なディープラーニングアルゴリズムは、これらの問題を画像認識問題に変換することによって、非イメージ機械学習(ML)問題を解決する機会を開く。
本章で提示されるCPC-Rアルゴリズムは、非画像データを可視化することにより、非画像データを画像に変換する。
次に、深層学習CNNアルゴリズムがこれらの画像の学習問題を解決する。
CPC-Rアルゴリズムの設計により、2次元画像中のすべての高次元情報を保存できる。
代替手法で用いられる単一の値マッピングの代わりにペア値マッピングを使用することで、各n-D点を2倍の視覚的要素で符号化することができる。
n-d 点の属性はその値の対に分割され、それぞれの対は同じ 2-次元デカルト座標で 2-d 点として視覚化される。
次に、グレースケールまたはカラー強度値を各ペアに割り当ててペアの順序を符号化する。
その結果、ヒートマップ画像が生成される。
CPC-Rの計算実験は、異なるCNNアーキテクチャに対して行われ、CPC-RとディープラーニングのCNNアルゴリズムを組み合わせることで、ベンチマークデータセット上で高い精度で非画像ML問題を解くことができることを示す。
この章では、分類の正確さをテストするためにより多くの実験を追加し、その解釈可能性をテストするために発見された特徴の正当性と情報性を探究し、アプローチを一般化することで、これまでの作業を拡張します。
関連論文リスト
- EDCSSM: Edge Detection with Convolutional State Space Model [3.649463841174485]
画像のエッジ検出は、コンピュータグラフィックスにおける多くの複雑なタスクの基礎となっている。
多層畳み込みとプールアーキテクチャによる特徴損失のため、学習ベースのエッジ検出モデルは、しばしば厚いエッジを生成する。
本稿では,上記の問題に効果的に対処するエッジ検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-09-03T05:13:25Z) - Annotation Cost-Efficient Active Learning for Deep Metric Learning Driven Remote Sensing Image Retrieval [3.2109665109975696]
ANNEALは、類似した、異種のイメージペアで構成された、小さくて情報的なトレーニングセットを作成することを目的としている。
不確実性と多様性の基準を組み合わせることにより、画像対の情報性を評価する。
このアノテート方式は、ランド・ユース・ランド・カバー・クラスラベルによるアノテート画像と比較して、アノテーションコストを著しく削減する。
論文 参考訳(メタデータ) (2024-06-14T15:08:04Z) - Parameter-Inverted Image Pyramid Networks [49.35689698870247]
Inverted Image Pyramid Networks (PIIP) と呼ばれる新しいネットワークアーキテクチャを提案する。
私たちの中核となる考え方は、パラメータサイズの異なるモデルを使用して、画像ピラミッドの解像度の異なるレベルを処理することです。
PIIPは、オブジェクト検出、セグメンテーション、画像分類などのタスクにおいて優れたパフォーマンスを達成する。
論文 参考訳(メタデータ) (2024-06-06T17:59:10Z) - CricaVPR: Cross-image Correlation-aware Representation Learning for Visual Place Recognition [73.51329037954866]
視覚的位置認識のための画像間相関認識を用いたロバストなグローバル表現手法を提案する。
本手法では,バッチ内の複数の画像の相関にアテンション機構を用いる。
本手法は,訓練時間を大幅に短縮し,最先端の手法よりも優れた性能を示す。
論文 参考訳(メタデータ) (2024-02-29T15:05:11Z) - Exploring Deep Learning Image Super-Resolution for Iris Recognition [50.43429968821899]
重畳自動エンコーダ(SAE)と畳み込みニューラルネットワーク(CNN)の2つの深層学習単一画像超解法手法を提案する。
精度評価と認識実験により,1.872個の近赤外虹彩画像のデータベースを用いて評価を行い,比較アルゴリズムよりも深層学習の方が優れていることを示す。
論文 参考訳(メタデータ) (2023-11-02T13:57:48Z) - SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA [0.6770292596301478]
そこで本研究では,ISTA (SC-VAE) を用いたスパース符号化に基づくVAEを新たに導入し,スパース符号化を可変オートエンコーダフレームワークに統合する。
2つの画像データセットに対する実験により、我々のモデルは、最先端の手法と比較して、画像再構成結果の改善を実現していることが示された。
論文 参考訳(メタデータ) (2023-03-29T13:18:33Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。