論文の概要: ELFIS: Expert Learning for Fine-grained Image Recognition Using Subsets
- arxiv url: http://arxiv.org/abs/2303.09269v1
- Date: Thu, 16 Mar 2023 12:45:19 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-17 15:41:18.766272
- Title: ELFIS: Expert Learning for Fine-grained Image Recognition Using Subsets
- Title(参考訳): ELFIS:サブセットを用いたきめ細かい画像認識のためのエキスパート学習
- Authors: Pablo Villacorta, Jes\'us M. Rodr\'iguez-de-Vera, Marc Bola\~nos,
Ignacio Saras\'ua, Bhalaji Nagarajan, Petia Radeva
- Abstract要約: ファイングラインド・ビジュアル・認識のためのエキスパート・ラーニング・フレームワークであるELFISを提案する。
ニューラルネットワークベースのエキスパートのセットは、メタカテゴリに焦点を当ててトレーニングされ、マルチタスクフレームワークに統合される。
実験では、CNNとトランスフォーマーベースのネットワークを使用して、最大+1.3%の精度でSoTA FGVRベンチマークが改善された。
- 参考スコア(独自算出の注目度): 6.632855264705276
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fine-Grained Visual Recognition (FGVR) tackles the problem of distinguishing
highly similar categories. One of the main approaches to FGVR, namely subset
learning, tries to leverage information from existing class taxonomies to
improve the performance of deep neural networks. However, these methods rely on
the existence of handcrafted hierarchies that are not necessarily optimal for
the models. In this paper, we propose ELFIS, an expert learning framework for
FGVR that clusters categories of the dataset into meta-categories using both
dataset-inherent lexical and model-specific information. A set of neural
networks-based experts are trained focusing on the meta-categories and are
integrated into a multi-task framework. Extensive experimentation shows
improvements in the SoTA FGVR benchmarks of up to +1.3% of accuracy using both
CNNs and transformer-based networks. Overall, the obtained results evidence
that ELFIS can be applied on top of any classification model, enabling the
obtention of SoTA results. The source code will be made public soon.
- Abstract(参考訳): ファイングラインド視覚認識(FGVR)は、非常に類似したカテゴリーを区別する問題に取り組む。
FGVRの主なアプローチの1つ、すなわちサブセット学習は、ディープニューラルネットワークの性能を改善するために、既存のクラス分類からの情報を活用しようとしている。
しかし、これらの手法は必ずしもモデルに最適ではない手作り階層の存在に依存している。
本稿では,データセットのカテゴリをメタデータとモデル固有情報の両方を用いてメタカテゴリに分類する,fgvrのためのエキスパート学習フレームワークであるelfisを提案する。
ニューラルネットワークベースのエキスパートのセットは、メタカテゴリに焦点を当ててトレーニングされ、マルチタスクフレームワークに統合される。
大規模な実験では、CNNとトランスフォーマーベースのネットワークを使用して、最大1.3%の精度でSoTA FGVRベンチマークが改善された。
その結果,いずれの分類モデルにもALFISが適用可能であることが確認された。
ソースコードは近々公開される予定だ。
関連論文リスト
- Language Models are Graph Learners [70.14063765424012]
言語モデル(LM)は、グラフニューラルネットワーク(GNN)やグラフトランスフォーマー(GT)など、ドメイン固有のモデルの優位性に挑戦している。
本稿では,ノード分類タスクにおける最先端のGNNに匹敵する性能を実現するために,既製のLMを有効活用する手法を提案する。
論文 参考訳(メタデータ) (2024-10-03T08:27:54Z) - Informed deep hierarchical classification: a non-standard analysis inspired approach [0.0]
出力層の前に配置された特定のプロジェクション演算子を備えた多出力ディープニューラルネットワークで構成されている。
このようなアーキテクチャの設計は、LH-DNN(Lexicographic Hybrid Deep Neural Network)と呼ばれ、異なる研究分野と非常に離れた研究分野のツールを組み合わせることで実現されている。
アプローチの有効性を評価するために、階層的な分類タスクに適した畳み込みニューラルネットワークであるB-CNNと比較する。
論文 参考訳(メタデータ) (2024-09-25T14:12:50Z) - Subgraph Clustering and Atom Learning for Improved Image Classification [4.499833362998488]
本稿では,特徴抽出のための畳み込みニューラルネットワーク(CNN)と構造モデリングのためのグラフニューラルネットワーク(GNN)の長所を融合した,新しいハイブリッド画像分類モデルであるグラフサブグラフネットワーク(GSN)を提案する。
GSNはk平均クラスタリングを使用してグラフノードをクラスタにグループ化し、サブグラフの作成を容易にする。
これらの部分グラフを使用して、辞書学習のための代表原子を学習し、スパースでクラス区別可能な特徴の識別を可能にする。
論文 参考訳(メタデータ) (2024-07-20T06:32:00Z) - Guiding Generative Language Models for Data Augmentation in Few-Shot
Text Classification [59.698811329287174]
我々は、GPT-2を用いて、分類性能を向上させるために、人工訓練インスタンスを生成する。
実験の結果,少数のラベルインスタンスでGPT-2を微調整すると,一貫した分類精度が向上することがわかった。
論文 参考訳(メタデータ) (2021-11-17T12:10:03Z) - Calibrating Class Activation Maps for Long-Tailed Visual Recognition [60.77124328049557]
本稿では,CNNの長期分布からネットワーク学習を改善するための2つの効果的な修正を提案する。
まず,ネットワーク分類器の学習と予測を改善するために,CAMC (Class Activation Map) モジュールを提案する。
第2に,長期化問題における表現学習における正規化分類器の利用について検討する。
論文 参考訳(メタデータ) (2021-08-29T05:45:03Z) - Cross-layer Navigation Convolutional Neural Network for Fine-grained
Visual Classification [21.223130735592516]
FGVCは、オブジェクトのサブクラスを同じスーパークラスで分類することを目的としている。
FGVCタスクにとって重要な解決策は、地域からターゲットの識別的微妙な情報を見つけることである。
機能融合のための階層間ナビゲーション畳み込みニューラルネットワークを提案する。
論文 参考訳(メタデータ) (2021-06-21T08:38:27Z) - No Fear of Heterogeneity: Classifier Calibration for Federated Learning
with Non-IID Data [78.69828864672978]
実世界のフェデレーションシステムにおける分類モデルのトレーニングにおける中心的な課題は、非IIDデータによる学習である。
このアルゴリズムは, 近似されたssian混合モデルからサンプリングした仮想表現を用いて分類器を調整する。
実験の結果,CIFAR-10,CIFAR-100,CINIC-10など,一般的なフェデレーション学習ベンチマークにおけるCCVRの現状が示された。
論文 参考訳(メタデータ) (2021-06-09T12:02:29Z) - Adversarial Feature Augmentation and Normalization for Visual
Recognition [109.6834687220478]
最近のコンピュータビジョンの進歩は、分類モデルの一般化能力を改善するために、逆データ拡張を利用する。
本稿では,中間的特徴埋め込みにおける敵対的拡張を提唱する効率的かつ効率的な代替手法を提案する。
代表的なバックボーンネットワークを用いて,多様な視覚認識タスクにまたがる提案手法を検証する。
論文 参考訳(メタデータ) (2021-03-22T20:36:34Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - PK-GCN: Prior Knowledge Assisted Image Classification using Graph
Convolution Networks [3.4129083593356433]
クラス間の類似性は、分類のパフォーマンスに影響を与える可能性がある。
本稿では,クラス類似性の知識を畳み込みニューラルネットワークモデルに組み込む手法を提案する。
実験結果から, 利用可能なデータの量が少ない場合には, 分類精度が向上することが示唆された。
論文 参考訳(メタデータ) (2020-09-24T18:31:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。