論文の概要: A Survey on Long-Tailed Visual Recognition
- arxiv url: http://arxiv.org/abs/2205.13775v1
- Date: Fri, 27 May 2022 06:22:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-30 14:57:32.557742
- Title: A Survey on Long-Tailed Visual Recognition
- Title(参考訳): 長手型視覚認識に関する調査
- Authors: Lu Yang, He Jiang, Qing Song, Jun Guo
- Abstract要約: 我々は、長い尾を持つデータ分布に起因する問題に焦点をあて、代表的な長い尾を持つ視覚認識データセットを整理し、いくつかの主流の長い尾を持つ研究を要約する。
Gini係数に基づいて、過去10年間に提案された20の広範に利用されている大規模ビジュアルデータセットを定量的に研究する。
- 参考スコア(独自算出の注目度): 13.138929184395423
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The heavy reliance on data is one of the major reasons that currently limit
the development of deep learning. Data quality directly dominates the effect of
deep learning models, and the long-tailed distribution is one of the factors
affecting data quality. The long-tailed phenomenon is prevalent due to the
prevalence of power law in nature. In this case, the performance of deep
learning models is often dominated by the head classes while the learning of
the tail classes is severely underdeveloped. In order to learn adequately for
all classes, many researchers have studied and preliminarily addressed the
long-tailed problem. In this survey, we focus on the problems caused by
long-tailed data distribution, sort out the representative long-tailed visual
recognition datasets and summarize some mainstream long-tailed studies.
Specifically, we summarize these studies into ten categories from the
perspective of representation learning, and outline the highlights and
limitations of each category. Besides, we have studied four quantitative
metrics for evaluating the imbalance, and suggest using the Gini coefficient to
evaluate the long-tailedness of a dataset. Based on the Gini coefficient, we
quantitatively study 20 widely-used and large-scale visual datasets proposed in
the last decade, and find that the long-tailed phenomenon is widespread and has
not been fully studied. Finally, we provide several future directions for the
development of long-tailed learning to provide more ideas for readers.
- Abstract(参考訳): データへの強い依存は、現在ディープラーニングの開発を制限している大きな理由の1つです。
データ品質はディープラーニングモデルの影響を直接的に支配し,データ品質に影響を与える要因の1つである。
長い尾を持つ現象は、自然界における権力法則の出現によるものである。
この場合、ディープラーニングモデルの性能は、しばしばヘッドクラスに支配されるが、テールクラスの学習は著しく過小評価されている。
すべてのクラスを適切に学習するために、多くの研究者がロングテール問題を研究し、事前に取り組んだ。
本稿では,長期データ分布に起因する問題に着目し,代表的な長期画像認識データセットを整理し,主流の長期研究を要約する。
具体的には,これらの研究を表現学習の観点から10のカテゴリに分け,各カテゴリのハイライトと限界を概説する。
さらに,不均衡を評価するための4つの定量的指標について検討し,Gini係数を用いてデータセットの長期性を評価することを提案する。
Gini係数に基づいて、過去10年間に提案された20の広義および大規模視覚データセットを定量的に検討し、長い尾の現象が広く、十分に研究されていないことを発見した。
最後に,さらに多くのアイデアを読者に提供するために,ロングテール学習の開発に向けて,いくつかの今後の方向性を示す。
関連論文リスト
- Granularity Matters in Long-Tail Learning [62.30734737735273]
より粒度の細かいデータセットは、データの不均衡の影響を受けにくい傾向があります。
既存のクラスと視覚的に類似したオープンセット補助クラスを導入し、頭と尾の両方の表現学習を強化することを目的とした。
補助授業の圧倒的な存在がトレーニングを混乱させるのを防ぐために,近隣のサイレンシング障害を導入する。
論文 参考訳(メタデータ) (2024-10-21T13:06:21Z) - A Systematic Review on Long-Tailed Learning [12.122327726952946]
長い尾の学習は、長い尾の分布を持つデータセット上で高性能なモデルを構築することを目的としている。
本研究では,8つの異なる次元からなる長期学習のための新しい分類法を提案する。
本稿では,長期学習手法の体系的レビューを行い,それらの共通点と整合性の違いについて論じる。
論文 参考訳(メタデータ) (2024-08-01T11:39:45Z) - LCReg: Long-Tailed Image Classification with Latent Categories based
Recognition [81.5551335554507]
本稿では,Lar-tail Recognition(LCReg)法を提案する。
我々の仮説は、頭と尾のクラスで共有される一般的な潜伏的特徴は、特徴表現を改善するために使用できるというものである。
具体的には、頭と尾の両方で共有されるクラス非依存の潜伏特徴の集合を学習し、潜伏特徴のセマンティックデータ拡張を用いてトレーニングサンプルの多様性を暗黙的に増加させる。
論文 参考訳(メタデータ) (2023-09-13T02:03:17Z) - Feature-Balanced Loss for Long-Tailed Visual Recognition [36.974139534723825]
深層ニューラルネットワークは、トレーニングデータが長期化されている場合、しばしばパフォーマンス劣化に悩まされる。
本稿では,特徴空間から長鎖問題に対処し,特徴バランス損失を提案する。
複数の人気のあるロングテール認識ベンチマークの実験は、特徴バランスの取れた損失が最先端の手法と比較して優れた性能向上を達成することを示した。
論文 参考訳(メタデータ) (2023-05-18T07:30:22Z) - Propheter: Prophetic Teacher Guided Long-Tailed Distribution Learning [44.947984354108094]
本稿では,より深いネットワークの学習を外部の事前知識で導くことによってボトルネックを突破する,革新的なロングテール学習パラダイムを提案する。
提案された予言的パラダイムは、長い尾のデータセットにおける限られたクラス知識の挑戦に対する有望な解決策として機能する。
論文 参考訳(メタデータ) (2023-04-09T02:02:19Z) - Long-tailed Recognition by Learning from Latent Categories [70.6272114218549]
本稿ではLatent Categories based long-tail Recognition (LCReg)法を提案する。
具体的には、頭と尾のクラス間で共有されるクラスに依存しない潜在機能群を学習する。
次に、潜在機能に意味データ拡張を適用することで、トレーニングサンプルの多様性を暗黙的に強化する。
論文 参考訳(メタデータ) (2022-06-02T12:19:51Z) - Causal Reasoning Meets Visual Representation Learning: A Prospective
Study [117.08431221482638]
解釈可能性の欠如、堅牢性、分布外一般化が、既存の視覚モデルの課題となっている。
人間レベルのエージェントの強い推論能力にインスパイアされた近年では、因果推論パラダイムの開発に多大な努力が注がれている。
本稿では,この新興分野を包括的に概観し,注目し,議論を奨励し,新たな因果推論手法の開発の急激さを先導することを目的とする。
論文 参考訳(メタデータ) (2022-04-26T02:22:28Z) - Deep Long-Tailed Learning: A Survey [163.16874896812885]
ディープ・ロングテール・ラーニング(Deep Long-tailed Learning)は、長いテールのクラス分布に追従する多数の画像から、優れたパフォーマンスのディープモデルをトレーニングすることを目的としている。
長い尾を持つクラス不均衡は、現実的な視覚認識タスクにおいて一般的な問題である。
本稿では,近年の長期学習の進歩を包括的に調査する。
論文 参考訳(メタデータ) (2021-10-09T15:25:22Z) - Relational Subsets Knowledge Distillation for Long-tailed Retinal
Diseases Recognition [65.77962788209103]
本研究では,長尾データを知識に基づいて複数のクラスサブセットに分割し,クラスサブセット学習を提案する。
モデルがサブセット固有の知識の学習に集中するように強制する。
提案手法は長期網膜疾患認識タスクに有効であることが判明した。
論文 参考訳(メタデータ) (2021-04-22T13:39:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。