論文の概要: Semantic Clustering based Deduction Learning for Image Recognition and
Classification
- arxiv url: http://arxiv.org/abs/2112.13165v1
- Date: Sat, 25 Dec 2021 01:31:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 09:53:51.691616
- Title: Semantic Clustering based Deduction Learning for Image Recognition and
Classification
- Title(参考訳): セマンティッククラスタリングに基づく画像認識と分類のための推論学習
- Authors: Wenchi Ma, Xuemin Tu, Bo Luo, Guanghui Wang
- Abstract要約: 本稿では,人間の脳の学習・思考過程を模倣した意味的クラスタリングに基づく推論学習を提案する。
提案手法は広範な実験を通じて理論的,実証的に支持される。
- 参考スコア(独自算出の注目度): 19.757743366620613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper proposes a semantic clustering based deduction learning by
mimicking the learning and thinking process of human brains. Human beings can
make judgments based on experience and cognition, and as a result, no one would
recognize an unknown animal as a car. Inspired by this observation, we propose
to train deep learning models using the clustering prior that can guide the
models to learn with the ability of semantic deducing and summarizing from
classification attributes, such as a cat belonging to animals while a car
pertaining to vehicles. %Specifically, if an image is labeled as a cat, then
the model is trained to learn that "this image is totally not any random class
that is the outlier of animal". The proposed approach realizes the high-level
clustering in the semantic space, enabling the model to deduce the relations
among various classes during the learning process. In addition, the paper
introduces a semantic prior based random search for the opposite labels to
ensure the smooth distribution of the clustering and the robustness of the
classifiers. The proposed approach is supported theoretically and empirically
through extensive experiments. We compare the performance across
state-of-the-art classifiers on popular benchmarks, and the generalization
ability is verified by adding noisy labeling to the datasets. Experimental
results demonstrate the superiority of the proposed approach.
- Abstract(参考訳): 本稿では,人間の脳の学習・思考過程を模倣した意味クラスタリングに基づく推論学習を提案する。
人間は経験と認知に基づいて判断を行うことができ、その結果、未知の動物を車として認識することはできない。
本研究は,動物に属する猫や自動車に関連する車などの分類属性から意味的推論と要約の能力を用いて,モデルの学習を指導する,クラスタリングを用いたディープラーニングモデルを訓練することを提案する。
特に、画像が猫としてラベル付けされた場合、モデルは「この画像は動物の異常値である無作為なクラスではない」ことを学ぶように訓練される。
提案手法はセマンティック空間における高レベルクラスタリングを実現し,学習過程における様々なクラス間の関係をモデル化する。
さらに,クラスタリングのスムーズな分布と分類器のロバスト性を保証するために,逆ラベルに対する意味的先行的ランダム探索を導入する。
提案手法は広範な実験を通じて理論的,実証的に支持される。
一般的なベンチマークでは,最先端の分類器間での性能を比較し,データセットにノイズラベリングを加えることで一般化能力を検証する。
実験の結果,提案手法の優位性を示した。
関連論文リスト
- Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Learning Primitive-aware Discriminative Representations for Few-shot
Learning [28.17404445820028]
少ないショットラーニングは、いくつかのラベル付き例で、新しいクラスを容易に認識できる分類器を学習することを目的としている。
プリミティブ・マイニング・アンド・リ共振ネットワーク(PMRN)を提案し,プリミティブ・アウェアな表現を学習する。
提案手法は,6つの標準ベンチマークの最先端結果を実現する。
論文 参考訳(メタデータ) (2022-08-20T16:22:22Z) - Open-Set Recognition with Gradient-Based Representations [16.80077149399317]
本稿では、勾配に基づく表現を利用して未知の検出器を既知のクラスのみで訓練することを提案する。
我々の勾配に基づくアプローチは、オープンセットの分類において、最先端の手法を最大11.6%上回っていることを示す。
論文 参考訳(メタデータ) (2022-06-16T14:54:12Z) - A Top-down Supervised Learning Approach to Hierarchical Multi-label
Classification in Networks [0.21485350418225244]
本稿では,階層型マルチラベル分類(HMC)に対する一般的な予測モデルを提案する。
クラスごとの局所分類器を構築することで教師あり学習により階層的マルチラベル分類に対処するトップダウン分類アプローチに基づいている。
本モデルでは, イネOryza sativa Japonicaの遺伝子機能の予測について事例研究を行った。
論文 参考訳(メタデータ) (2022-03-23T17:29:17Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。