論文の概要: Deep Learning Image Recognition for Non-images
- arxiv url: http://arxiv.org/abs/2106.14350v1
- Date: Mon, 28 Jun 2021 00:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-29 13:55:31.883709
- Title: Deep Learning Image Recognition for Non-images
- Title(参考訳): 非画像のためのディープラーニング画像認識
- Authors: Boris Kovalerchuk, Divya Chandrika Kalla, Bedant Agarwal
- Abstract要約: CPC-Rアルゴリズムは、非画像データを可視化することにより、非画像データを画像に変換する。
ディープラーニングCNNアルゴリズムは、これらの画像の学習問題を解決する。
- 参考スコア(独自算出の注目度): 6.88204255655161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Powerful deep learning algorithms open an opportunity for solving non-image
Machine Learning (ML) problems by transforming these problems to into the image
recognition problems. The CPC-R algorithm presented in this chapter converts
non-image data into images by visualizing non-image data. Then deep learning
CNN algorithms solve the learning problems on these images. The design of the
CPC-R algorithm allows preserving all high-dimensional information in 2-D
images. The use of pair values mapping instead of single value mapping used in
the alternative approaches allows encoding each n-D point with 2 times fewer
visual elements. The attributes of an n-D point are divided into pairs of its
values and each pair is visualized as 2-D points in the same 2-D Cartesian
coordinates. Next, grey scale or color intensity values are assigned to each
pair to encode the order of pairs. This is resulted in the heatmap image. The
computational experiments with CPC-R are conducted for different CNN
architectures, and methods to optimize the CPC-R images showing that the
combined CPC-R and deep learning CNN algorithms are able to solve non-image ML
problems reaching high accuracy on the benchmark datasets. This chapter expands
our prior work by adding more experiments to test accuracy of classification,
exploring saliency and informativeness of discovered features to test their
interpretability, and generalizing the approach.
- Abstract(参考訳): 強力なディープラーニングアルゴリズムは、これらの問題を画像認識問題に変換することによって、非イメージ機械学習(ML)問題を解決する機会を開く。
本章で提示されるCPC-Rアルゴリズムは、非画像データを可視化することにより、非画像データを画像に変換する。
次に、深層学習CNNアルゴリズムがこれらの画像の学習問題を解決する。
CPC-Rアルゴリズムの設計により、2次元画像中のすべての高次元情報を保存できる。
代替手法で用いられる単一の値マッピングの代わりにペア値マッピングを使用することで、各n-D点を2倍の視覚的要素で符号化することができる。
n-d 点の属性はその値の対に分割され、それぞれの対は同じ 2-次元デカルト座標で 2-d 点として視覚化される。
次に、グレースケールまたはカラー強度値を各ペアに割り当ててペアの順序を符号化する。
その結果、ヒートマップ画像が生成される。
CPC-Rの計算実験は、異なるCNNアーキテクチャに対して行われ、CPC-RとディープラーニングのCNNアルゴリズムを組み合わせることで、ベンチマークデータセット上で高い精度で非画像ML問題を解くことができることを示す。
この章では、分類の正確さをテストするためにより多くの実験を追加し、その解釈可能性をテストするために発見された特徴の正当性と情報性を探究し、アプローチを一般化することで、これまでの作業を拡張します。
関連論文リスト
- Exploring Deep Learning Image Super-Resolution for Iris Recognition [50.43429968821899]
重畳自動エンコーダ(SAE)と畳み込みニューラルネットワーク(CNN)の2つの深層学習単一画像超解法手法を提案する。
精度評価と認識実験により,1.872個の近赤外虹彩画像のデータベースを用いて評価を行い,比較アルゴリズムよりも深層学習の方が優れていることを示す。
論文 参考訳(メタデータ) (2023-11-02T13:57:48Z) - SC-VAE: Sparse Coding-based Variational Autoencoder with Learned ISTA [0.6770292596301478]
そこで本研究では,ISTA (SC-VAE) を用いたスパース符号化に基づくVAEを新たに導入し,スパース符号化を可変オートエンコーダフレームワークに統合する。
2つの画像データセットに対する実験により、我々のモデルは、最先端の手法と比較して、画像再構成結果の改善を実現していることが示された。
論文 参考訳(メタデータ) (2023-03-29T13:18:33Z) - Learning to Detect Good Keypoints to Match Non-Rigid Objects in RGB
Images [7.428474910083337]
本稿では,非剛性画像対応タスクの正マッチ数を最大化するために,新しい学習キーポイント検出手法を提案する。
我々のトレーニングフレームワークは、アノテートされた画像対と予め定義された記述子抽出器をマッチングして得られる真の対応を利用して、畳み込みニューラルネットワーク(CNN)を訓練する。
実験の結果,本手法は平均整合精度で20時までに非剛体物体の実像に対して,最先端のキーポイント検出器よりも優れていた。
論文 参考訳(メタデータ) (2022-12-13T11:59:09Z) - Forged Image Detection using SOTA Image Classification Deep Learning
Methods for Image Forensics with Error Level Analysis [2.719418335747252]
画像法医学はコンピュータビジョンアプリケーションの主要な分野の1つである。
forgery of image is sub-category of image forensics and can detected using Error Level Analysis。
我々は,CASIA ITDE v.2データセットを用いた誤りレベルの解析により,最先端の画像分類モデルを用いて転送学習を行う。
論文 参考訳(メタデータ) (2022-11-28T10:10:42Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Deep Learning Based Automated COVID-19 Classification from Computed
Tomography Images [0.0]
本稿では,画像分類のための畳み込みニューラルネットワーク(CNN)モデルを提案する。
本研究では,2次元CNNモデルを用いて2次元CTスキャン画像のスライスを簡易に分類する手法を提案する。
アーキテクチャの単純さにもかかわらず、提案モデルでは、同じ画像のデータセット上で、最先端技術を上回る定量的結果が得られた。
論文 参考訳(メタデータ) (2021-11-22T13:35:10Z) - Learning Co-segmentation by Segment Swapping for Retrieval and Discovery [67.6609943904996]
この研究の目的は、一対のイメージから視覚的に類似したパターンを効率的に識別することである。
画像中のオブジェクトセグメントを選択し、それを別の画像にコピーペーストすることで、合成トレーニングペアを生成する。
提案手法は,Brueghelデータセット上でのアートワークの詳細検索に対して,明確な改善をもたらすことを示す。
論文 参考訳(メタデータ) (2021-10-29T16:51:16Z) - DetCo: Unsupervised Contrastive Learning for Object Detection [64.22416613061888]
教師なしのコントラスト学習は,CNNを用いた画像表現学習において大きな成功を収めている。
我々は,グローバルイメージとローカルイメージパッチのコントラストをフルに検討する,DetCoという新しいコントラスト学習手法を提案する。
DetCoは1倍のスケジュールでMask RCNN-C4/FPN/RetinaNet上で1.6/1.2/1.0 APで教師付き手法を一貫して上回っている。
論文 参考訳(メタデータ) (2021-02-09T12:47:20Z) - A deep primal-dual proximal network for image restoration [8.797434238081372]
我々は、プリミティブ・デュアル・イテレーションから構築されたディープPDNetというディープネットワークを設計し、前もって分析を行い、標準的なペナル化可能性の最小化を図った。
フルラーニング」と「パートラーニング」の2つの異なる学習戦略が提案され、第1は最も効率的な数値である。
以上の結果から,提案したDeepPDNetは,MNISTと,より複雑なBSD68,BSD100,SET14データセットにおいて,画像復元と単一画像超解像処理に優れた性能を示した。
論文 参考訳(メタデータ) (2020-07-02T08:29:52Z) - Data Consistent CT Reconstruction from Insufficient Data with Learned
Prior Images [70.13735569016752]
偽陰性病変と偽陽性病変を呈示し,CT画像再構成における深層学習の堅牢性について検討した。
本稿では,圧縮センシングと深層学習の利点を組み合わせた画像品質向上のためのデータ一貫性再構築手法を提案する。
提案手法の有効性は,円錐ビームCTにおいて,トランキャットデータ,リミテッドアングルデータ,スパースビューデータで示される。
論文 参考訳(メタデータ) (2020-05-20T13:30:49Z) - RANSAC-Flow: generic two-stage image alignment [53.11926395028508]
単純な教師なしのアプローチは、様々なタスクにおいて驚くほどうまく機能することを示す。
その単純さにもかかわらず、我々の手法は様々なタスクやデータセットで競合する結果を示す。
論文 参考訳(メタデータ) (2020-04-03T12:37:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。