論文の概要: FocalCount: Towards Class-Count Imbalance in Class-Agnostic Counting
- arxiv url: http://arxiv.org/abs/2502.10677v1
- Date: Sat, 15 Feb 2025 05:24:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-18 14:11:37.390378
- Title: FocalCount: Towards Class-Count Imbalance in Class-Agnostic Counting
- Title(参考訳): FocalCount: クラス非依存カウントにおけるクラス非バランスを目指して
- Authors: Huilin Zhu, Jingling Yuan, Zhengwei Yang, Yu Guo, Xian Zhong, Shengfeng He,
- Abstract要約: クラスに依存しないオブジェクトカウントにおいて、ゴールは、特定のカテゴリを区別することなく、画像内のオブジェクトインスタンスの総数を推定することである。
提案手法は,特定のクラスと一般カウントを区別するモデルの能力を大幅に向上させる。
- 参考スコア(独自算出の注目度): 34.25988613929425
- License:
- Abstract: In class-agnostic object counting, the goal is to estimate the total number of object instances in an image without distinguishing between specific categories. Existing methods often predict this count without considering class-specific outputs, leading to inaccuracies when such outputs are required. These inaccuracies stem from two key challenges: 1) the prevalence of single-category images in datasets, which leads models to generalize specific categories as representative of all objects, and 2) the use of mean squared error loss during training, which applies uniform penalization. This uniform penalty disregards errors in less frequent categories, particularly when these errors contribute minimally to the overall loss. To address these issues, we propose {FocalCount}, a novel approach that leverages diverse feature attributes to estimate the number of object categories in an image. This estimate serves as a weighted factor to correct class-count imbalances. Additionally, we introduce {Focal-MSE}, a new loss function that integrates binary cross-entropy to generate stronger error gradients, enhancing the model's sensitivity to errors in underrepresented categories. Our approach significantly improves the model's ability to distinguish between specific classes and general counts, demonstrating superior performance and scalability in both few-shot and zero-shot scenarios across three object counting datasets. The code will be released soon.
- Abstract(参考訳): クラスに依存しないオブジェクトカウントにおいて、ゴールは、特定のカテゴリを区別することなく、画像内のオブジェクトインスタンスの総数を推定することである。
既存の方法はクラス固有の出力を考慮せずにこのカウントを予測し、そのような出力が必要なときに不正確になる。
これらの不正確さは2つの主要な課題に起因している。
1 データセットにおける単一カテゴリ画像の出現率から、特定のカテゴリを全オブジェクトの代表として一般化するモデルが導かれる。
2)訓練中の平均二乗誤差損失は,一様罰則を適用した。
この均一な刑罰は、特にこれらのエラーが全体の損失に最小限に寄与する場合に、少ない頻度のカテゴリでのエラーを無視する。
これらの問題に対処するために,多様な特徴属性を活用して画像内の対象カテゴリ数を推定する新しいアプローチである {FocalCount} を提案する。
この推定は、クラス数の不均衡を補正する重み付け要因として機能する。
さらに、二項交叉エントロピーを統合した新たな損失関数 {Focal-MSE} を導入し、より強いエラー勾配を発生させ、未表現のカテゴリにおけるエラーに対するモデルの感度を高める。
提案手法は,3つのオブジェクトカウントデータセットにまたがる少数ショットシナリオとゼロショットシナリオの両方において,優れたパフォーマンスとスケーラビリティを示すことによって,特定のクラスと一般カウントを区別するモデルの能力を大幅に向上させる。
コードはまもなくリリースされる。
関連論文リスト
- Understanding the Detrimental Class-level Effects of Data Augmentation [63.1733767714073]
最適な平均精度を達成するには、ImageNetで最大20%の個々のクラスの精度を著しく損なうコストがかかる。
本稿では,DAがクラスレベルの学習力学とどのように相互作用するかを理解するためのフレームワークを提案する。
そこで本研究では, クラス条件拡張戦略により, 負の影響を受けるクラスの性能が向上することを示す。
論文 参考訳(メタデータ) (2023-12-07T18:37:43Z) - Deep Imbalanced Regression via Hierarchical Classification Adjustment [50.19438850112964]
コンピュータビジョンにおける回帰タスクは、しばしば、対象空間をクラスに定量化することで分類される。
トレーニングサンプルの大多数は目標値の先頭にあるが、少数のサンプルは通常より広い尾幅に分布する。
不均衡回帰タスクを解くために階層型分類器を構築することを提案する。
不均衡回帰のための新しい階層型分類調整(HCA)は,3つのタスクにおいて優れた結果を示す。
論文 参考訳(メタデータ) (2023-10-26T04:54:39Z) - No One Left Behind: Improving the Worst Categories in Long-Tailed
Learning [29.89394406438639]
このような評価設定の下では、いくつかのカテゴリは必然的に犠牲にされます。
多様な手法に適用可能な簡易なプラグイン法を提案する。
論文 参考訳(メタデータ) (2023-03-07T03:24:54Z) - Generalization Bounds for Few-Shot Transfer Learning with Pretrained
Classifiers [26.844410679685424]
本研究では,新しいクラスに移動可能な分類の表現を基礎モデルで学習する能力について検討する。
クラス-機能-変数の崩壊の場合,新しいクラスで学習した特徴マップのわずかな誤差が小さいことを示す。
論文 参考訳(メタデータ) (2022-12-23T18:46:05Z) - Learning Debiased and Disentangled Representations for Semantic
Segmentation [52.35766945827972]
セマンティックセグメンテーションのためのモデルに依存しない訓練手法を提案する。
各トレーニングイテレーションで特定のクラス情報をランダムに除去することにより、クラス間の機能依存を効果的に削減する。
提案手法で訓練したモデルは,複数のセマンティックセグメンテーションベンチマークにおいて強い結果を示す。
論文 参考訳(メタデータ) (2021-10-31T16:15:09Z) - On Clustering Categories of Categorical Predictors in Generalized Linear
Models [0.0]
本稿では,分類予測器の存在下での一般化線形モデルの複雑性を低減する手法を提案する。
各カテゴリがダミー変数で表される従来のワンホット符号化は、無駄で解釈が難しく、過度に適合する傾向がある。
本稿では,カテゴリをクラスタリングすることでカテゴリ予測器の表現を小さくすることで,これらの課題に対処する。
論文 参考訳(メタデータ) (2021-10-19T15:36:35Z) - Redesigning the classification layer by randomizing the class
representation vectors [12.953517767147998]
分類層の設計選択が学習力学にどのように影響するかを分析する。
標準的なクロスエントロピートレーニングは,異なるクラス間の視覚的類似性を暗黙的に捉えていることを示す。
そこで本研究では,クラスベクトルをランダムに描画し,トレーニング中にそれらを固定した上で,これらのベクトルに符号化された視覚的類似性を無効にすることを提案する。
論文 参考訳(メタデータ) (2020-11-16T13:45:23Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。