論文の概要: Superpixel-based Domain-Knowledge Infusion in Computer Vision
- arxiv url: http://arxiv.org/abs/2105.09448v1
- Date: Thu, 20 May 2021 01:25:42 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 13:39:50.154591
- Title: Superpixel-based Domain-Knowledge Infusion in Computer Vision
- Title(参考訳): コンピュータビジョンにおけるスーパーピクセルベースドメイン知識注入
- Authors: Gunjan Chhablani, Abheesht Sharma, Harshit Pandey, Tirtharaj Dash
- Abstract要約: スーパーピクセルは画像中の高次の知覚的ピクセル群であり、しばしば生のピクセルよりもはるかに多くの情報を運ぶ。
画像の異なるスーパーピクセル間の関係に固有の関係構造が存在する。
この関係情報は、猫画像中の2つの目を表すスーパーピクセル間の関係など、画像に関するある種のドメイン情報を伝達することができる。
- 参考スコア(独自算出の注目度): 0.7349727826230862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Superpixels are higher-order perceptual groups of pixels in an image, often
carrying much more information than raw pixels. There is an inherent relational
structure to the relationship among different superpixels of an image. This
relational information can convey some form of domain information about the
image, e.g. relationship between superpixels representing two eyes in a cat
image. Our interest in this paper is to construct computer vision models,
specifically those based on Deep Neural Networks (DNNs) to incorporate these
superpixels information. We propose a methodology to construct a hybrid model
that leverages (a) Convolutional Neural Network (CNN) to deal with spatial
information in an image, and (b) Graph Neural Network (GNN) to deal with
relational superpixel information in the image. The proposed deep model is
learned using a generic hybrid loss function that we call a `hybrid' loss. We
evaluate the predictive performance of our proposed hybrid vision model on four
popular image classification datasets: MNIST, FMNIST, CIFAR-10 and CIFAR-100.
Moreover, we evaluate our method on three real-world classification tasks:
COVID-19 X-Ray Detection, LFW Face Recognition, and SOCOFing Fingerprint
Identification. The results demonstrate that the relational superpixel
information provided via a GNN could improve the performance of standard
CNN-based vision systems.
- Abstract(参考訳): スーパーピクセルは画像内のピクセルの高次知覚群であり、しばしば生のピクセルよりも多くの情報を運ぶ。
画像の異なるスーパーピクセル間の関係に固有の関係構造が存在する。
この関係情報は、画像に関するある種のドメイン情報を伝達することができる。
猫画像における2つの目を表すスーパーピクセル間の関係
本稿では,コンピュータビジョンモデルの構築,特にDeep Neural Networks(DNN)に基づくスーパーピクセル情報の統合に関心がある。
本稿では,画像内の空間情報を扱う畳み込みニューラルネットワーク(cnn)と,画像内の関連スーパーピクセル情報を扱うグラフニューラルネットワーク(gnn)を組み合わせたハイブリッドモデルを構築する手法を提案する。
提案する深層モデルでは,'ハイブリッド'損失と呼ぶ汎用ハイブリッド損失関数を用いて学習する。
MNIST,FMNIST,CIFAR-10,CIFAR-100の4つの画像分類データセットを用いたハイブリッドビジョンモデルの予測性能の評価を行った。
さらに, 実世界の3つの分類課題, COVID-19 X線検出, LFW顔認証, SOCOFing Fingerprint Identificationについて検討した。
以上の結果から,gnnを経由するスーパーピクセル情報により,標準cnnベースの視覚システムの性能が向上する可能性が示唆された。
関連論文リスト
- T-former: An Efficient Transformer for Image Inpainting [50.43302925662507]
トランスフォーマーと呼ばれる注目に基づくネットワークアーキテクチャのクラスは、自然言語処理の分野で大きなパフォーマンスを示している。
本稿では,Taylorの展開に応じて,解像度に線形に関連付けられた新たな注意を設計し,この注意に基づいて,画像インペイントのためのネットワークである$T$-formerを設計する。
いくつかのベンチマークデータセットの実験により,提案手法は比較的少ないパラメータ数と計算複雑性を維持しつつ,最先端の精度を達成できることが示されている。
論文 参考訳(メタデータ) (2023-05-12T04:10:42Z) - Single-Image Super-Resolution Reconstruction based on the Differences of
Neighboring Pixels [3.257500143434429]
深層学習技術は、単一画像超解像(SISR)の性能向上に用いられた。
本稿では,推定画像と接地構造画像からグラフを構築することにより,CNNを正規化するための隣接画素の違いを提案する。
提案手法は, ベンチマークデータセットの定量的, 質的評価の観点から, 最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2022-12-28T07:30:07Z) - Traditional Classification Neural Networks are Good Generators: They are
Competitive with DDPMs and GANs [104.72108627191041]
従来のニューラルネットワーク分類器は、最先端の生成モデルに匹敵する高品質な画像を生成することができることを示す。
マスクをベースとした再構成モジュールを提案し, 意味的勾配を意識し, 可視画像の合成を行う。
また,本手法は,画像テキスト基盤モデルに関して,テキスト・画像生成にも適用可能であることを示す。
論文 参考訳(メタデータ) (2022-11-27T11:25:35Z) - Unsupervised Image Semantic Segmentation through Superpixels and Graph
Neural Networks [6.123324869194195]
ラベル付きデータが不足している多くの実世界のシナリオでは、教師なしのイメージセグメンテーションが重要なタスクである。
本稿では,相互情報最大化(MIM),ニューラルスーパーピクセル,グラフニューラルネットワーク(GNN)をエンドツーエンドに組み合わせて,教師なし学習の最近の進歩を活用する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2022-10-21T08:35:18Z) - Rethinking Unsupervised Neural Superpixel Segmentation [6.123324869194195]
CNNによるスーパーピクセルセグメンテーションのための教師なし学習が研究されている。
このようなネットワークの有効性を改善するために,3つの重要な要素を提案する。
BSDS500データセットを実験した結果,提案手法の意義を示す証拠が得られた。
論文 参考訳(メタデータ) (2022-06-21T09:30:26Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - Two-Stream Graph Convolutional Network for Intra-oral Scanner Image
Segmentation [133.02190910009384]
本稿では,2ストリームグラフ畳み込みネットワーク(TSGCN)を提案する。
TSGCNは3次元歯(表面)セグメンテーションにおいて最先端の方法よりも優れています。
論文 参考訳(メタデータ) (2022-04-19T10:41:09Z) - Implicit Integration of Superpixel Segmentation into Fully Convolutional
Networks [11.696069523681178]
スーパーピクセル方式をCNNに暗黙的に統合する方法を提案する。
提案手法では,下地層に画素を階層的にグループ化し,スーパーピクセルを生成する。
本手法は,セマンティックセグメンテーション,スーパーピクセルセグメンテーション,モノクル深度推定などのタスクで評価する。
論文 参考訳(メタデータ) (2021-03-05T02:20:26Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - AINet: Association Implantation for Superpixel Segmentation [82.21559299694555]
今回提案する新しいtextbfAssociation textbfImplantation(AI)モジュールは、ネットワークがピクセルとその周辺グリッド間の関係を明示的にキャプチャすることを可能にする。
本手法は最先端性能を実現するだけでなく,十分な推論効率を維持することができた。
論文 参考訳(メタデータ) (2021-01-26T10:40:13Z) - Superpixel Image Classification with Graph Attention Networks [4.714325419968082]
本稿では,グラフニューラルネットワーク(GNN)モデルを用いた画像分類手法を提案する。
入力画像を領域隣接グラフ (RAG) に変換する。
グラフ畳み込みと自己アテンション機構を組み合わせたグラフアテンションネットワーク(GAT)は、他のGNNモデルより優れていることを実験的に示唆している。
論文 参考訳(メタデータ) (2020-02-13T14:52:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。