論文の概要: Semantic Clustering based Deduction Learning for Image Recognition and
Classification
- arxiv url: http://arxiv.org/abs/2112.13165v1
- Date: Sat, 25 Dec 2021 01:31:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-29 09:53:51.691616
- Title: Semantic Clustering based Deduction Learning for Image Recognition and
Classification
- Title(参考訳): セマンティッククラスタリングに基づく画像認識と分類のための推論学習
- Authors: Wenchi Ma, Xuemin Tu, Bo Luo, Guanghui Wang
- Abstract要約: 本稿では,人間の脳の学習・思考過程を模倣した意味的クラスタリングに基づく推論学習を提案する。
提案手法は広範な実験を通じて理論的,実証的に支持される。
- 参考スコア(独自算出の注目度): 19.757743366620613
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The paper proposes a semantic clustering based deduction learning by
mimicking the learning and thinking process of human brains. Human beings can
make judgments based on experience and cognition, and as a result, no one would
recognize an unknown animal as a car. Inspired by this observation, we propose
to train deep learning models using the clustering prior that can guide the
models to learn with the ability of semantic deducing and summarizing from
classification attributes, such as a cat belonging to animals while a car
pertaining to vehicles. %Specifically, if an image is labeled as a cat, then
the model is trained to learn that "this image is totally not any random class
that is the outlier of animal". The proposed approach realizes the high-level
clustering in the semantic space, enabling the model to deduce the relations
among various classes during the learning process. In addition, the paper
introduces a semantic prior based random search for the opposite labels to
ensure the smooth distribution of the clustering and the robustness of the
classifiers. The proposed approach is supported theoretically and empirically
through extensive experiments. We compare the performance across
state-of-the-art classifiers on popular benchmarks, and the generalization
ability is verified by adding noisy labeling to the datasets. Experimental
results demonstrate the superiority of the proposed approach.
- Abstract(参考訳): 本稿では,人間の脳の学習・思考過程を模倣した意味クラスタリングに基づく推論学習を提案する。
人間は経験と認知に基づいて判断を行うことができ、その結果、未知の動物を車として認識することはできない。
本研究は,動物に属する猫や自動車に関連する車などの分類属性から意味的推論と要約の能力を用いて,モデルの学習を指導する,クラスタリングを用いたディープラーニングモデルを訓練することを提案する。
特に、画像が猫としてラベル付けされた場合、モデルは「この画像は動物の異常値である無作為なクラスではない」ことを学ぶように訓練される。
提案手法はセマンティック空間における高レベルクラスタリングを実現し,学習過程における様々なクラス間の関係をモデル化する。
さらに,クラスタリングのスムーズな分布と分類器のロバスト性を保証するために,逆ラベルに対する意味的先行的ランダム探索を導入する。
提案手法は広範な実験を通じて理論的,実証的に支持される。
一般的なベンチマークでは,最先端の分類器間での性能を比較し,データセットにノイズラベリングを加えることで一般化能力を検証する。
実験の結果,提案手法の優位性を示した。
関連論文リスト
- Explainable Metric Learning for Deflating Data Bias [2.977255700811213]
本稿では,画像の階層的なセマンティックセマンティックセマンティクスを構築し,解釈性を向上させるための説明可能なメトリクス学習フレームワークを提案する。
提案手法により,2つの画像間のセマンティックセグメントに基づくより人間的に理解可能な類似度測定が可能となる。
論文 参考訳(メタデータ) (2024-07-05T21:07:27Z) - Accurate Explanation Model for Image Classifiers using Class Association Embedding [5.378105759529487]
本稿では,グローバルな知識とローカルな知識の利点を組み合わせた生成的説明モデルを提案する。
クラスアソシエーション埋め込み(CAE)は、各サンプルを1組のクラス関連コードと個別コードにエンコードする。
クラス関連特徴を個々の特徴から効率的に分離するビルディングブロック・コヒーレンシー特徴抽出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-12T07:41:00Z) - Convolutional autoencoder-based multimodal one-class classification [80.52334952912808]
1クラス分類は、単一のクラスからのデータを用いた学習のアプローチを指す。
マルチモーダルデータに適した深層学習一クラス分類法を提案する。
論文 参考訳(メタデータ) (2023-09-25T12:31:18Z) - Open-Set Recognition with Gradient-Based Representations [16.80077149399317]
本稿では、勾配に基づく表現を利用して未知の検出器を既知のクラスのみで訓練することを提案する。
我々の勾配に基づくアプローチは、オープンセットの分類において、最先端の手法を最大11.6%上回っていることを示す。
論文 参考訳(メタデータ) (2022-06-16T14:54:12Z) - Resolving label uncertainty with implicit posterior models [71.62113762278963]
本稿では,データサンプルのコレクション間でラベルを共同で推論する手法を提案する。
異なる予測子を後部とする生成モデルの存在を暗黙的に仮定することにより、弱い信念の下での学習を可能にする訓練目標を導出する。
論文 参考訳(メタデータ) (2022-02-28T18:09:44Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - GAN for Vision, KG for Relation: a Two-stage Deep Network for Zero-shot
Action Recognition [33.23662792742078]
ゼロショット動作認識のための2段階のディープニューラルネットワークを提案する。
サンプリング段階では,授業の動作特徴と単語ベクトルによって訓練されたGAN(Generative Adversarial Network)を利用する。
分類段階において、アクションクラスの単語ベクトルと関連するオブジェクトの関係に基づいて知識グラフを構築する。
論文 参考訳(メタデータ) (2021-05-25T09:34:42Z) - Intersection Regularization for Extracting Semantic Attributes [72.53481390411173]
本稿では,ネットワーク抽出した特徴が意味属性のセットと一致するように,教師付き分類の問題を考える。
例えば、鳥類のイメージを種に分類することを学ぶとき、動物学者が鳥類を分類するために使用する特徴の出現を観察したい。
本稿では,複数層パーセプトロン(MLP)と並列決定木を併用した,離散的なトップレベルアクティベーションを持つニューラルネットワークのトレーニングを提案する。
論文 参考訳(メタデータ) (2021-03-22T14:32:44Z) - Learning and Evaluating Representations for Deep One-class
Classification [59.095144932794646]
ディープワンクラス分類のための2段階フレームワークを提案する。
まず,一級データから自己教師付き表現を学習し,学習した表現に基づいて一級分類器を構築する。
実験では、視覚領域の1クラス分類ベンチマークで最先端の性能を示す。
論文 参考訳(メタデータ) (2020-11-04T23:33:41Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。