論文の概要: Deep Long-Tailed Learning: A Survey
- arxiv url: http://arxiv.org/abs/2110.04596v1
- Date: Sat, 9 Oct 2021 15:25:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-12 17:32:14.377239
- Title: Deep Long-Tailed Learning: A Survey
- Title(参考訳): 深層ロングテール学習:調査
- Authors: Yifan Zhang, Bingyi Kang, Bryan Hooi, Shuicheng Yan, Jiashi Feng
- Abstract要約: ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
- 参考スコア(独自算出の注目度): 149.53332189001338
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep long-tailed learning, one of the most challenging problems in visual
recognition, aims to train well-performing deep models from a large number of
images that follow a long-tailed class distribution. In the last decade, deep
learning has emerged as a powerful recognition model for learning high-quality
image representations and has led to remarkable breakthroughs in generic visual
recognition. However, long-tailed class imbalance, a common problem in
practical visual recognition tasks, often limits the practicality of deep
network based recognition models in real-world applications, since they can be
easily biased towards dominant classes and perform poorly on tail classes. To
address this problem, a large number of studies have been conducted in recent
years, making promising progress in the field of deep long-tailed learning.
Considering the rapid evolution of this field, this paper aims to provide a
comprehensive survey on recent advances in deep long-tailed learning. To be
specific, we group existing deep long-tailed learning studies into three main
categories (i.e., class re-balancing, information augmentation and module
improvement), and review these methods following this taxonomy in detail.
Afterward, we empirically analyze several state-of-the-art methods by
evaluating to what extent they address the issue of class imbalance via a newly
proposed evaluation metric, i.e., relative accuracy. We conclude the survey by
highlighting important applications of deep long-tailed learning and
identifying several promising directions for future research.
- Abstract(参考訳): ディープロングテール学習(deep long-tailed learning)は、視覚認識における最も難しい問題の1つで、ロングテールのクラス分布に従う多数の画像から、高性能なディープラーニングモデルをトレーニングすることを目的としている。
過去10年間で、ディープラーニングは高品質な画像表現を学習するための強力な認識モデルとして現れ、一般的な視覚認識において顕著なブレークスルーをもたらした。
しかし、現実的な視覚認識タスクにおける一般的な問題である長い尾のクラス不均衡は、しばしば現実世界のアプリケーションにおけるディープネットワークベースの認識モデルの実用性を制限している。
この問題に対処するために、近年多くの研究が行われており、長い長い学習分野において有望な進歩を遂げている。
本稿では,この分野の急速な発展を考慮し,深層ロングテール学習の最近の進歩に関する包括的調査を行う。
具体的には,既存の長期学習研究を3つの主要なカテゴリ(クラス再バランス,情報強化,モジュール改良)に分類し,これらの手法を詳細に検討する。
その後,新しく提案された評価基準,すなわち相対的精度を用いて,クラス不均衡の問題にどの程度対処しているかを評価することにより,いくつかの最先端手法を実証的に分析した。
我々は,深層ロングテール学習の重要な応用を強調し,今後の研究への有望な方向性を明らかにした。
関連論文リスト
- LCReg: Long-Tailed Image Classification with Latent Categories based
Recognition [81.5551335554507]
本稿では,Lar-tail Recognition(LCReg)法を提案する。
我々の仮説は、頭と尾のクラスで共有される一般的な潜伏的特徴は、特徴表現を改善するために使用できるというものである。
具体的には、頭と尾の両方で共有されるクラス非依存の潜伏特徴の集合を学習し、潜伏特徴のセマンティックデータ拡張を用いてトレーニングサンプルの多様性を暗黙的に増加させる。
論文 参考訳(メタデータ) (2023-09-13T02:03:17Z) - Propheter: Prophetic Teacher Guided Long-Tailed Distribution Learning [44.947984354108094]
本稿では,より深いネットワークの学習を外部の事前知識で導くことによってボトルネックを突破する,革新的なロングテール学習パラダイムを提案する。
提案された予言的パラダイムは、長い尾のデータセットにおける限られたクラス知識の挑戦に対する有望な解決策として機能する。
論文 参考訳(メタデータ) (2023-04-09T02:02:19Z) - Label-Efficient Deep Learning in Medical Image Analysis: Challenges and
Future Directions [10.502964056448283]
医用画像解析のトレーニングモデルは通常、ラベル付きデータの高価で時間を要する。
我々は最近の300以上の論文を網羅的に調査し、MIAにおけるラベル効率学習戦略の進捗状況を概観した。
具体的には、標準半教師付き、自己監督型、マルチインスタンス学習スキームだけでなく、最近出現したアクティブかつアノテーション効率の学習戦略についても詳細に調査する。
論文 参考訳(メタデータ) (2023-03-22T11:51:49Z) - Knowledge-augmented Deep Learning and Its Applications: A Survey [60.221292040710885]
知識強化ディープラーニング(KADL)は、ドメイン知識を特定し、それをデータ効率、一般化可能、解釈可能なディープラーニングのためのディープモデルに統合することを目的としている。
本調査は,既存の研究成果を補足し,知識強化深層学習の一般分野における鳥眼研究の展望を提供する。
論文 参考訳(メタデータ) (2022-11-30T03:44:15Z) - Long-tailed Recognition by Learning from Latent Categories [70.6272114218549]
本稿ではLatent Categories based long-tail Recognition (LCReg)法を提案する。
具体的には、頭と尾のクラス間で共有されるクラスに依存しない潜在機能群を学習する。
次に、潜在機能に意味データ拡張を適用することで、トレーニングサンプルの多様性を暗黙的に強化する。
論文 参考訳(メタデータ) (2022-06-02T12:19:51Z) - A Survey on Long-Tailed Visual Recognition [13.138929184395423]
我々は、長い尾を持つデータ分布に起因する問題に焦点をあて、代表的な長い尾を持つ視覚認識データセットを整理し、いくつかの主流の長い尾を持つ研究を要約する。
Gini係数に基づいて、過去10年間に提案された20の広範に利用されている大規模ビジュアルデータセットを定量的に研究する。
論文 参考訳(メタデータ) (2022-05-27T06:22:55Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Personalized Education in the AI Era: What to Expect Next? [76.37000521334585]
パーソナライズ学習の目的は、学習者の強みに合致する効果的な知識獲得トラックをデザインし、目標を達成するために弱みをバイパスすることである。
近年、人工知能(AI)と機械学習(ML)の隆盛は、パーソナライズされた教育を強化するための新しい視点を広げています。
論文 参考訳(メタデータ) (2021-01-19T12:23:32Z) - An Overview of Deep Semi-Supervised Learning [8.894935073145252]
半教師付き学習とそのディープニューラルネットワークへの応用に対する研究の関心が高まっている。
本稿では,本分野の紹介から始まる深層半教師あり学習の概要について概説する。
論文 参考訳(メタデータ) (2020-06-09T14:08:03Z) - A Survey on Deep Learning Techniques for Stereo-based Depth Estimation [30.330599857204344]
RGB画像から深度を推定することは、長年続く不適切な問題である。
ステレオベースの深度推定のためのディープラーニングは、コミュニティから関心を集めている。
この新世代の手法は、性能の大きな飛躍を見せている。
論文 参考訳(メタデータ) (2020-06-01T13:09:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。