論文の概要: Combining pretrained CNN feature extractors to enhance clustering of
complex natural images
- arxiv url: http://arxiv.org/abs/2101.02767v1
- Date: Thu, 7 Jan 2021 21:23:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 13:46:43.871425
- Title: Combining pretrained CNN feature extractors to enhance clustering of
complex natural images
- Title(参考訳): 複雑な自然画像のクラスタリングを促進するcnn特徴抽出器の試作
- Authors: Joris Guerin, Stephane Thiery, Eric Nyiri, Olivier Gibaru, Byron Boots
- Abstract要約: 本稿では,画像クラスタリング(IC)における事前学習CNN機能の利用に関する知見を提供することを目的とする。
そこで本研究では,IC問題をマルチビュークラスタリング(MVC)問題として再構成することを提案する。
次に、MVC問題を効果的に解くためにエンドツーエンドに訓練されたマルチインプットニューラルネットワークアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 27.784346095205358
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recently, a common starting point for solving complex unsupervised image
classification tasks is to use generic features, extracted with deep
Convolutional Neural Networks (CNN) pretrained on a large and versatile dataset
(ImageNet). However, in most research, the CNN architecture for feature
extraction is chosen arbitrarily, without justification. This paper aims at
providing insight on the use of pretrained CNN features for image clustering
(IC). First, extensive experiments are conducted and show that, for a given
dataset, the choice of the CNN architecture for feature extraction has a huge
impact on the final clustering. These experiments also demonstrate that proper
extractor selection for a given IC task is difficult. To solve this issue, we
propose to rephrase the IC problem as a multi-view clustering (MVC) problem
that considers features extracted from different architectures as different
"views" of the same data. This approach is based on the assumption that
information contained in the different CNN may be complementary, even when
pretrained on the same data. We then propose a multi-input neural network
architecture that is trained end-to-end to solve the MVC problem effectively.
This approach is tested on nine natural image datasets, and produces
state-of-the-art results for IC.
- Abstract(参考訳): 近年、複雑な教師なし画像分類タスクを解決するための共通の出発点は、大規模で汎用的なデータセット(ImageNet)で事前訓練された深層畳み込みニューラルネットワーク(CNN)で抽出された一般的な特徴を使用することである。
しかし、ほとんどの研究において、特徴抽出のためのcnnアーキテクチャは正当化なしで任意に選択される。
本稿では,画像クラスタリング(IC)における事前学習CNN機能の利用に関する知見を提供する。
まず、広範な実験を行い、与えられたデータセットに対して、特徴抽出のためのCNNアーキテクチャの選択が最終的なクラスタリングに大きな影響を与えることを示す。
これらの実験は、与えられたICタスクに対する適切な抽出器の選択が困難であることを示す。
この問題を解決するために,異なるアーキテクチャから抽出された特徴を同一データの異なる「ビュー」とみなすマルチビュークラスタリング(MVC)問題として,IC問題を言い換えることを提案する。
このアプローチは、同じデータで事前トレーニングされた場合でも、異なるcnnに含まれる情報は相補的であるかもしれないという仮定に基づいている。
次に、MVC問題を効果的に解くためにエンドツーエンドに訓練されたマルチインプットニューラルネットワークアーキテクチャを提案する。
このアプローチは9つの自然画像データセットでテストされ、ICの最先端結果を生成する。
関連論文リスト
- Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - CompNet: A Designated Model to Handle Combinations of Images and
Designed features [0.24596929878045565]
本稿では,複合畳み込みニューラルネットワークであるCompNetを提案する。
分類タスクにこの構造を用いることで,本手法は過度な適合を著しく低減できることを示す。
論文 参考訳(メタデータ) (2022-09-28T22:43:22Z) - Image Super-resolution with An Enhanced Group Convolutional Neural
Network [102.2483249598621]
学習能力の強いCNNは、超解像問題を解くために広く選択されている。
浅層構造を持つ超解像群CNN(ESRGCNN)を提案する。
ESRGCNNは、SISRの性能、複雑さ、実行速度、画質評価およびSISRの視覚効果の観点から、最先端技術を上回っていると報告されている。
論文 参考訳(メタデータ) (2022-05-29T00:34:25Z) - Classification of diffraction patterns using a convolutional neural
network in single particle imaging experiments performed at X-ray
free-electron lasers [53.65540150901678]
X線自由電子レーザー(XFEL)における単一粒子イメージング(SPI)は、その自然環境における粒子の3次元構造を決定するのに特に適している。
再建を成功させるためには、単一のヒットに由来する回折パターンを多数の取得パターンから分離する必要がある。
本稿では,この課題を画像分類問題として定式化し,畳み込みニューラルネットワーク(CNN)アーキテクチャを用いて解決することを提案する。
論文 参考訳(メタデータ) (2021-12-16T17:03:14Z) - Image Quality Assessment using Contrastive Learning [50.265638572116984]
我々は、補助的な問題を解決するために、対照的な対の目的を用いて深層畳み込みニューラルネットワーク(CNN)を訓練する。
本研究では,最新のNR画像品質モデルと比較して,ContriQUEが競争性能を向上することを示す。
以上の結果から,大きなラベル付き主観的画像品質データセットを必要とせずに,知覚的関連性を持つ強力な品質表現が得られることが示唆された。
論文 参考訳(メタデータ) (2021-10-25T21:01:00Z) - Deep Features for training Support Vector Machine [16.795405355504077]
本稿では,訓練済みcnnから抽出した特徴に基づく汎用コンピュータビジョンシステムを開発した。
複数の学習特徴を単一の構造に組み合わせ、異なる画像分類タスクに取り組んでいます。
論文 参考訳(メタデータ) (2021-04-08T03:13:09Z) - The Mind's Eye: Visualizing Class-Agnostic Features of CNNs [92.39082696657874]
本稿では,特定のレイヤの最も情報性の高い特徴を表現した対応する画像を作成することにより,画像の集合を視覚的に解釈する手法を提案する。
本手法では, 生成ネットワークを必要とせず, 元のモデルに変更を加えることなく, デュアルオブジェクトのアクティベーションと距離損失を利用する。
論文 参考訳(メタデータ) (2021-01-29T07:46:39Z) - Convolutional Neural Networks for Multispectral Image Cloud Masking [7.812073412066698]
畳み込みニューラルネットワーク(CNN)は多くの画像分類タスクの最先端技術であることが証明されている。
Proba-Vマルチスペクトル画像のクラウドマスキングにおける異なるCNNアーキテクチャの利用について検討する。
論文 参考訳(メタデータ) (2020-12-09T21:33:20Z) - Multi-pooled Inception features for no-reference image quality
assessment [0.0]
畳み込みニューラルネットワーク(CNN)を用いた画像品質評価の新しい手法を提案する。
従来の手法とは対照的に、入力画像からパッチを取らない。代わりに、入力画像は全体として処理され、事前訓練されたCNN本体を通して実行され、解像度に依存しない多段階の深い特徴を抽出する。
我々は、MultiGAP-NRIQAと呼ばれるベストな提案が、3つのベンチマークIQAデータベースに対して最先端の結果を提供することができることを実証した。
論文 参考訳(メタデータ) (2020-11-10T15:09:49Z) - DC-NAS: Divide-and-Conquer Neural Architecture Search [108.57785531758076]
本稿では,ディープ・ニューラル・アーキテクチャーを効果的かつ効率的に探索するためのディバイド・アンド・コンカ(DC)手法を提案する。
ImageNetデータセットで75.1%の精度を達成しており、これは同じ検索空間を使った最先端の手法よりも高い。
論文 参考訳(メタデータ) (2020-05-29T09:02:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。