論文の概要: Open Long-Tailed Recognition in a Dynamic World
- arxiv url: http://arxiv.org/abs/2208.08349v1
- Date: Wed, 17 Aug 2022 15:22:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-18 12:28:04.841972
- Title: Open Long-Tailed Recognition in a Dynamic World
- Title(参考訳): ダイナミックな世界でのオープンロングテール認識
- Authors: Ziwei Liu, Zhongqi Miao, Xiaohang Zhan, Jiayun Wang, Boqing Gong,
Stella X. Yu
- Abstract要約: 実世界のデータは、しばしば長い尾を持ち、(目に見えないクラスを持つ)オープンな分布を示す。
現実的な認識システムは、多数派(頭)クラスと少数派(尾)クラスの間でバランスを取り、分布を一般化し、見知らぬクラス(オープンクラス)のインスタンスで新規性を認める必要がある。
我々は,Open Long-Tailed Recognition++を,このような自然分布データからの学習として定義し,バランスの取れたテストセット上での分類精度を最適化する。
- 参考スコア(独自算出の注目度): 82.91025831618545
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Real world data often exhibits a long-tailed and open-ended (with unseen
classes) distribution. A practical recognition system must balance between
majority (head) and minority (tail) classes, generalize across the
distribution, and acknowledge novelty upon the instances of unseen classes
(open classes). We define Open Long-Tailed Recognition++ (OLTR++) as learning
from such naturally distributed data and optimizing for the classification
accuracy over a balanced test set which includes both known and open classes.
OLTR++ handles imbalanced classification, few-shot learning, open-set
recognition, and active learning in one integrated algorithm, whereas existing
classification approaches often focus only on one or two aspects and deliver
poorly over the entire spectrum. The key challenges are: 1) how to share visual
knowledge between head and tail classes, 2) how to reduce confusion between
tail and open classes, and 3) how to actively explore open classes with learned
knowledge. Our algorithm, OLTR++, maps images to a feature space such that
visual concepts can relate to each other through a memory association mechanism
and a learned metric (dynamic meta-embedding) that both respects the closed
world classification of seen classes and acknowledges the novelty of open
classes. Additionally, we propose an active learning scheme based on visual
memory, which learns to recognize open classes in a data-efficient manner for
future expansions. On three large-scale open long-tailed datasets we curated
from ImageNet (object-centric), Places (scene-centric), and MS1M (face-centric)
data, as well as three standard benchmarks (CIFAR-10-LT, CIFAR-100-LT, and
iNaturalist-18), our approach, as a unified framework, consistently
demonstrates competitive performance. Notably, our approach also shows strong
potential for the active exploration of open classes and the fairness analysis
of minority groups.
- Abstract(参考訳): 現実世界のデータは、しばしば、ロングテールかつオープンエンドの(未知のクラスを含む)分布を示す。
現実的な認識システムは、多数派(頭)クラスと少数派(尾)クラスの間でバランスを取り、分布を一般化し、目に見えないクラス(オープンクラス)のインスタンスで新規性を認める必要がある。
我々は,Long-Tailed Recognition++ (OLTR++) を,そのような自然分布データからの学習として定義し,既知のクラスとオープンクラスの両方を含むバランステストセット上での分類精度を最適化する。
OLTR++は、不均衡な分類、少数ショット学習、オープンセット認識、アクティブラーニングを1つの統合アルゴリズムで処理する。
主な課題は:
1) 頭と尾の授業における視覚知識の共有方法
2)テールクラスとオープンクラスとの混同を減らす方法
3)学習知識のあるオープンクラスを積極的に探究する方法。
私たちのアルゴリズムであるoltr++は、視覚的概念がメモリアソシエーション機構と学習されたメトリック(動的メタエンベディング)を通じて相互に関連付けられるような特徴空間に画像をマッピングします。
さらに,オープンクラスをデータ効率の良い方法で認識し,今後の拡張のために学習する,視覚記憶に基づくアクティブラーニングスキームを提案する。
imagenet(object-centric)、places(scene-centric)、ms1m(face-centric)のデータと3つの標準ベンチマーク(cifar-10-lt、cifar-100-lt、inaturalist-18)から収集した3つの大規模オープンロングテールデータセットについて、統一フレームワークとしての我々のアプローチは、一貫して競合性能を示しています。
特に,本手法は,オープンクラスの活発な探索と少数群の公正性分析に強い可能性を示す。
関連論文リスト
- Robust Semi-Supervised Learning for Self-learning Open-World Classes [5.714673612282175]
実世界のアプリケーションでは、ラベル付きデータは常にラベル付き集合に存在しないクラスを含んでいる。
本稿では,自己学習型オープンワールドクラス(SSOC)のためのオープンワールドSSL手法を提案する。
SSOCは、複数の人気のある分類ベンチマークで最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2024-01-15T09:27:46Z) - Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph
Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。
我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文 参考訳(メタデータ) (2023-06-14T13:07:48Z) - Bayesian Embeddings for Few-Shot Open World Recognition [60.39866770427436]
埋め込みベースの数ショット学習アルゴリズムをオープンワールド認識設定に拡張する。
当社のフレームワークは,MiniImageNetとTieredImageNetによる数ショット学習データセットのオープンワールド拡張をベンチマークする。
論文 参考訳(メタデータ) (2021-07-29T00:38:47Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Open-World Semi-Supervised Learning [66.90703597468377]
本稿では,従来のクラスを認識するためにモデルを必要とする,新しいオープンワールド半教師付き学習環境を提案する。
データの分類とクラスタ化を同時に行うアプローチであるORCAを提案する。
我々は,ORCAが新しいクラスを正確に発見し,ベンチマーク画像分類データセット上で以前に見られたクラスにサンプルを割り当てることを示した。
論文 参考訳(メタデータ) (2021-02-06T07:11:07Z) - CLASTER: Clustering with Reinforcement Learning for Zero-Shot Action
Recognition [52.66360172784038]
各インスタンスを個別に最適化するのではなく,すべてのトレーニングサンプルを同時に考慮したクラスタリングモデルを提案する。
提案手法をCLASTERと呼び,すべての標準データセットの最先端性を常に改善することを確認する。
論文 参考訳(メタデータ) (2021-01-18T12:46:24Z) - Boosting Deep Open World Recognition by Clustering [37.5993398894786]
我々は、新たな損失定式化により、ディープ・オープンな世界認識アルゴリズムの性能を高める方法を示す。
本研究では,グローバルな1つの閾値を推定するのではなく,クラス固有の拒絶閾値を学習する戦略を提案する。
RGB-D ObjectとCore50の実験は、我々のアプローチの有効性を示している。
論文 参考訳(メタデータ) (2020-04-20T12:07:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。