論文の概要: Multi-label Classification using Deep Multi-order Context-aware Kernel Networks
- arxiv url: http://arxiv.org/abs/2412.19491v1
- Date: Fri, 27 Dec 2024 07:16:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-30 17:26:11.514486
- Title: Multi-label Classification using Deep Multi-order Context-aware Kernel Networks
- Title(参考訳): 深層多階コンテキスト認識カーネルネットワークを用いたマルチラベル分類
- Authors: Mingyuan Jiu, Hailong Zhu, Hichem Sahbi,
- Abstract要約: コンテキストは学習したモデルにさらなる手がかりを与え、分類性能を大幅に向上させるかもしれない。
本研究では,コンテクスト情報(画像の幾何学的構造)をフル活用して,画像間のコンテクスト認識の類似性(カーネルなど)を改善する。
得られたコンテキスト対応カーネルネットワークは、異なる距離の複数のパッチ隣人の順序を更に活用し、マルチラベル分類のためのより識別性の高い深層多階コンテキスト対応カーネルネットワーク(DMCKN)を実現する。
- 参考スコア(独自算出の注目度): 8.350913884523083
- License:
- Abstract: Multi-label classification is a challenging task in pattern recognition. Many deep learning methods have been proposed and largely enhanced classification performance. However, most of the existing sophisticated methods ignore context in the models' learning process. Since context may provide additional cues to the learned models, it may significantly boost classification performances. In this work, we make full use of context information (namely geometrical structure of images) in order to learn better context-aware similarities (a.k.a. kernels) between images. We reformulate context-aware kernel design as a feed-forward network that outputs explicit kernel mapping features. Our obtained context-aware kernel network further leverages multiple orders of patch neighbors within different distances, resulting into a more discriminating Deep Multi-order Context-aware Kernel Network (DMCKN) for multi-label classification. We evaluate the proposed method on the challenging Corel5K and NUS-WIDE benchmarks, and empirical results show that our method obtains competitive performances against the related state-of-the-art, and both quantitative and qualitative performances corroborate its effectiveness and superiority for multi-label image classification.
- Abstract(参考訳): マルチラベル分類はパターン認識において難しい課題である。
多くのディープラーニング手法が提案され、分類性能が大幅に向上した。
しかし、既存の洗練された手法のほとんどは、モデルの学習プロセスにおけるコンテキストを無視している。
文脈は学習モデルに付加的な手がかりを与える可能性があるため、分類性能を大幅に向上させる可能性がある。
本研究では,コンテクスト情報(画像の幾何学的構造)をフル活用して,画像間のコンテクスト認識の類似性(カーネルなど)を改善する。
我々は、コンテキスト対応カーネル設計を、明示的なカーネルマッピング機能を出力するフィードフォワードネットワークとして再構成する。
得られたコンテキスト対応カーネルネットワークは、異なる距離の複数のパッチ隣人の順序を更に活用し、マルチラベル分類のためのより識別性の高い深層多階コンテキスト対応カーネルネットワーク(DMCKN)を実現する。
提案手法は,Corel5K と NUS-WIDE のベンチマークを用いて評価し,提案手法が関連する最先端技術に対して競合性能を得ることを示した。
関連論文リスト
- Semi-supervised Semantic Segmentation for Remote Sensing Images via Multi-scale Uncertainty Consistency and Cross-Teacher-Student Attention [59.19580789952102]
本稿では,RS画像セマンティックセグメンテーションタスクのための,新しい半教師付きマルチスケール不確かさとクロスTeacher-Student Attention(MUCA)モデルを提案する。
MUCAは、マルチスケールの不確実性整合正則化を導入することにより、ネットワークの異なる層における特徴写像間の整合性を制限する。
MUCAは学生ネットワークの誘導にクロス教師・学生の注意機構を使用し、学生ネットワークにより差別的な特徴表現を構築するよう誘導する。
論文 参考訳(メタデータ) (2025-01-18T11:57:20Z) - Deep Dependency Networks and Advanced Inference Schemes for Multi-Label Classification [7.643377057724898]
我々は、ディープ・ディペンデンス・ネットワーク(DDN)と呼ばれる統合されたフレームワークを提案する。
DDNは依存ネットワークと深層学習アーキテクチャを組み合わせてマルチラベル分類を行う。
マルコフネットワークと比較してDDNの欠点は、高度な推論スキームがないことである。
論文 参考訳(メタデータ) (2024-04-17T18:04:37Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Reliable Representations Learning for Incomplete Multi-View Partial Multi-Label Classification [78.15629210659516]
本稿ではRANKという不完全なマルチビュー部分的マルチラベル分類ネットワークを提案する。
既存の手法に固有のビューレベルの重みを分解し、各サンプルのビューに品質スコアを動的に割り当てる品質対応サブネットワークを提案する。
我々のモデルは、完全なマルチビューマルチラベルデータセットを処理できるだけでなく、欠落したインスタンスやラベルを持つデータセットでも機能する。
論文 参考訳(メタデータ) (2023-03-30T03:09:25Z) - Semantic Representation and Dependency Learning for Multi-Label Image
Recognition [76.52120002993728]
本稿では,各カテゴリのカテゴリ固有のセマンティック表現を学習するための,新しい,効果的なセマンティック表現と依存性学習(SRDL)フレームワークを提案する。
具体的には,カテゴリー別注意領域(CAR)モジュールを設計し,チャネル/空間的注意行列を生成してモデルを導出する。
また、カテゴリ間のセマンティック依存を暗黙的に学習するオブジェクト消去(OE)モジュールを設計し、セマンティック認識領域を消去する。
論文 参考訳(メタデータ) (2022-04-08T00:55:15Z) - MFNet: Multi-class Few-shot Segmentation Network with Pixel-wise Metric
Learning [34.059257121606336]
この研究は、まだほとんど探索されていない分野である少数ショットセマンティックセマンティックセグメンテーションに焦点を当てている。
まず,マルチウェイ符号化とデコードアーキテクチャを提案する。このアーキテクチャは,マルチスケールクエリ情報とマルチクラスサポート情報を1つのクエリ支援埋め込みに効果的に融合する。
標準ベンチマーク PASCAL-5i と COCO-20i による実験により, 数発のセグメンテーションにおいて, 本手法の利点が明らかに示された。
論文 参考訳(メタデータ) (2021-10-30T11:37:36Z) - Multi-Label Image Classification with Contrastive Learning [57.47567461616912]
コントラスト学習の直接適用は,複数ラベルの場合においてほとんど改善できないことを示す。
完全教師付き環境下でのコントラスト学習を用いたマルチラベル分類のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-24T15:00:47Z) - Learning Discriminative Representations for Multi-Label Image
Recognition [13.13795708478267]
マルチラベルタスクにおける識別的特徴を学習するための統合深層ネットワークを提案する。
ネットワーク全体を正規化することで、よく知られたResNet-101の適用性能が大幅に向上する。
論文 参考訳(メタデータ) (2021-07-23T12:10:46Z) - Fine-Grained Visual Classification via Progressive Multi-Granularity
Training of Jigsaw Patches [67.51747235117]
きめ細かい視覚分類(FGVC)は従来の分類よりもはるかに難しい。
最近の研究は主に、最も差別的な部分の発見に焦点をあてることによってこの問題に対処している。
本稿では,これらの問題に対処するための視覚的細粒度分類のための新しい枠組みを提案する。
論文 参考訳(メタデータ) (2020-03-08T19:27:30Z) - Deep Context-Aware Kernel Networks [15.99072005190786]
本稿では,カーネル設計におけるコンテキストを学習する新しいディープネットワークアーキテクチャを提案する。
実験の結果, 深層文脈ネットワークは画像分類に極めて有効であり, 学習コンテキストは画像アノテーションの性能をさらに向上させることがわかった。
論文 参考訳(メタデータ) (2019-12-29T21:18:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。