Fugu-MT 論文翻訳(概要): Spatial-context-aware deep neural network for multi-class image classification

論文の概要: Spatial-context-aware deep neural network for multi-class image classification

arxiv url: http://arxiv.org/abs/2111.12296v1
Date: Wed, 24 Nov 2021 06:36:10 GMT
ステータス: 翻訳完了
システム内更新日: 2021-11-25 15:37:25.747185
Title: Spatial-context-aware deep neural network for multi-class image classification
Title（参考訳）: 多クラス画像分類のための空間文脈対応深層ニューラルネットワーク
Authors: Jialu Zhang, Qian Zhang, Jianfeng Ren, Yitian Zhao, Jiang Liu
Abstract要約: 意味情報と空間情報の両方を考慮したラベル予測のために,空間コンテキストを考慮した深層ニューラルネットワークを提案する。このフレームワークはMicrosoft COCOとPASCAL VOCで評価され、画像のマルチラベリングに広く使われているベンチマークデータセットである。
参考スコア（独自算出の注目度）: 12.961070515143161
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Multi-label image classification is a fundamental but challenging task in computer vision. Over the past few decades, solutions exploring relationships between semantic labels have made great progress. However, the underlying spatial-contextual information of labels is under-exploited. To tackle this problem, a spatial-context-aware deep neural network is proposed to predict labels taking into account both semantic and spatial information. This proposed framework is evaluated on Microsoft COCO and PASCAL VOC, two widely used benchmark datasets for image multi-labelling. The results show that the proposed approach is superior to the state-of-the-art solutions on dealing with the multi-label image classification problem.
Abstract（参考訳）: マルチラベル画像分類はコンピュータビジョンにおける基本だが挑戦的な課題である。過去数十年間、セマンティックラベル間の関係を探究するソリューションは大きな進歩を遂げてきた。しかし,ラベルの空間的・文脈的情報は未公開である。この問題に対処するために,意味的情報と空間的情報の両方を考慮したラベル予測のために,空間文脈認識型深層ニューラルネットワークを提案する。このフレームワークはMicrosoft COCOとPASCAL VOCで評価され、画像のマルチラベリングに広く使われているベンチマークデータセットである。その結果,提案手法はマルチラベル画像分類問題に対する最先端ソリューションよりも優れていることがわかった。

関連論文リスト

Semantic-Aware Representation Learning for Multi-label Image Classification [6.444512435220748]
本稿では,多ラベル画像分類のためのセマンティック・アウェア表現学習(SARL)を提案する。まず、ラベル意味関連特徴学習モジュールを用いて意味関連特徴を抽出する。第2に、セマンティックに整合した画像表現を得るために、最適輸送に基づくアテンション機構が設計されている。
論文参考訳（メタデータ） (2025-07-20T11:15:24Z)
Semi-Supervised Semantic Segmentation Based on Pseudo-Labels: A Survey [49.47197748663787]
本総説は, 半教師付きセマンティックセグメンテーション分野における擬似ラベル手法に関する最新の研究成果について, 包括的かつ組織的に概観することを目的としている。さらに,医用およびリモートセンシング画像のセグメンテーションにおける擬似ラベル技術の適用について検討する。
論文参考訳（メタデータ） (2024-03-04T10:18:38Z)
Fine-grained Recognition with Learnable Semantic Data Augmentation [68.48892326854494]
きめ細かい画像認識は、長年続くコンピュータビジョンの課題である。本稿では,識別領域損失問題を軽減するため,特徴レベルのトレーニングデータを多様化することを提案する。本手法は,いくつかの人気分類ネットワーク上での一般化性能を著しく向上させる。
論文参考訳（メタデータ） (2023-09-01T11:15:50Z)
Structured Semantic Transfer for Multi-Label Recognition with Partial Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。 Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文参考訳（メタデータ） (2021-12-21T02:15:01Z)
Maximize the Exploration of Congeneric Semantics for Weakly Supervised Semantic Segmentation [27.155133686127474]
グラフニューラルネットワーク(P-GNN)を,同一のクラスラベルを含む異なる画像からの自己検出パッチに基づいて構築する。 PASCAL VOC 2012ベンチマークで実験を行い、そのモデルにより最先端の性能が得られた。
論文参考訳（メタデータ） (2021-10-08T08:59:16Z)
Multi-layered Semantic Representation Network for Multi-label Image Classification [8.17894017454724]
マルチラベル画像分類(MLIC)は,複数の可能なラベルを画像に割り当てることを目的とした,基本的で実践的な課題である。近年,多くのディープ畳み込みニューラルネットワーク(CNN)に基づく手法が提案され,ラベル相関がモデル化されている。本稿では,ラベル相関のモデル化と意味表現の学習を改善することにより,この研究の方向性を推し進める。
論文参考訳（メタデータ） (2021-06-22T08:04:22Z)
Semantic Segmentation with Generative Models: Semi-Supervised Learning and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文参考訳（メタデータ） (2021-04-12T21:41:25Z)
Knowledge-Guided Multi-Label Few-Shot Learning for General Image Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文参考訳（メタデータ） (2020-09-20T15:05:29Z)
SSKD: Self-Supervised Knowledge Distillation for Cross Domain Adaptive Person Re-Identification [25.96221714337815]
ドメイン適応型人物再識別(re-ID)は、ソースドメインとターゲットドメインの間に大きな違いがあるため、難しい課題である。既存の手法は主にクラスタリングアルゴリズムによって未ラベルのターゲット画像の擬似ラベルを生成する。本稿では,識別学習とソフトラベル学習の2つのモジュールを含む自己監督的知識蒸留(SSKD)手法を提案する。
論文参考訳（メタデータ） (2020-09-13T10:12:02Z)
Reconstruction Regularized Deep Metric Learning for Multi-label Image Classification [39.055689258395624]
本稿では,多ラベル画像分類問題に対処する新しい深度距離学習法を提案する。私たちのモデルはエンドツーエンドでトレーニングできます。
論文参考訳（メタデータ） (2020-07-27T13:28:50Z)
Adversarial Learning for Personalized Tag Recommendation [61.76193196463919]
大規模データセットでトレーニング可能なエンドツーエンドのディープネットワークを提案する。ユーザの嗜好と視覚的エンコーディングの合同トレーニングにより、ネットワークは視覚的嗜好をタグ付け行動と効率的に統合することができる。本稿では,提案モデルの有効性を2つの大規模および公開データセットで示す。
論文参考訳（メタデータ） (2020-04-01T20:41:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。