論文の概要: Compositional Attribute Imbalance in Vision Datasets
- arxiv url: http://arxiv.org/abs/2506.14418v1
- Date: Tue, 17 Jun 2025 11:28:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-18 17:34:59.442439
- Title: Compositional Attribute Imbalance in Vision Datasets
- Title(参考訳): 視覚データセットにおける構成属性の不均衡
- Authors: Jiayi Chen, Yanbiao Ma, Andi Zhang, Weidong Tang, Wei Dai, Bowei Liu,
- Abstract要約: 視覚属性辞書を構築するためのCLIPベースのフレームワークを導入し,画像属性の自動評価を可能にする。
単属性不均衡と構成属性不均衡の両方を解析することにより,属性の希少性がモデル性能に与える影響を明らかにする。
本研究は,視覚属性分布のモデル化の重要性を強調し,ロングテール画像分類タスクにスケーラブルなソリューションを提供する。
- 参考スコア(独自算出の注目度): 7.018788111043557
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Visual attribute imbalance is a common yet underexplored issue in image classification, significantly impacting model performance and generalization. In this work, we first define the first-level and second-level attributes of images and then introduce a CLIP-based framework to construct a visual attribute dictionary, enabling automatic evaluation of image attributes. By systematically analyzing both single-attribute imbalance and compositional attribute imbalance, we reveal how the rarity of attributes affects model performance. To tackle these challenges, we propose adjusting the sampling probability of samples based on the rarity of their compositional attributes. This strategy is further integrated with various data augmentation techniques (such as CutMix, Fmix, and SaliencyMix) to enhance the model's ability to represent rare attributes. Extensive experiments on benchmark datasets demonstrate that our method effectively mitigates attribute imbalance, thereby improving the robustness and fairness of deep neural networks. Our research highlights the importance of modeling visual attribute distributions and provides a scalable solution for long-tail image classification tasks.
- Abstract(参考訳): 視覚属性の不均衡は、画像分類において一般的だが未解明の課題であり、モデルの性能と一般化に大きな影響を及ぼす。
本研究ではまず,まず画像の第一レベル属性と第二レベル属性を定義し,次に視覚属性辞書を構築するためのCLIPベースのフレームワークを導入し,画像属性の自動評価を可能にする。
単一属性不均衡と構成属性不均衡の両方を系統的に解析することにより,属性の希少性がモデル性能に与える影響を明らかにする。
これらの課題に対処するため,本研究では,それらの組成特性の希少性に基づいてサンプルのサンプリング確率を調整することを提案する。
この戦略は、まれな属性を表現するモデルの能力を高めるために、さまざまなデータ拡張テクニック(CutMix、Fmix、SaliencyMixなど)とさらに統合されている。
ベンチマークデータセットの大規模な実験により,提案手法は属性の不均衡を効果的に軽減し,ディープニューラルネットワークのロバスト性と公平性を向上することを示した。
本研究は,視覚属性分布のモデル化の重要性を強調し,ロングテール画像分類タスクにスケーラブルなソリューションを提供する。
関連論文リスト
- Predicting Scores of Various Aesthetic Attribute Sets by Learning from
Overall Score Labels [54.63611854474985]
本稿では,画像属性ラベルを特徴抽出器に置き換えることを提案する。
異なるタスクのネットワークを使用して、F2Sモデルに属性機能を提供します。
本手法は, 各種の美的属性セットに対して, 総合的な美的スコアのみを用いて有意な属性スコアを学習できるようにする。
論文 参考訳(メタデータ) (2023-12-06T01:41:49Z) - Attribute-Aware Deep Hashing with Self-Consistency for Large-Scale
Fine-Grained Image Retrieval [65.43522019468976]
本稿では属性認識ハッシュコードを生成するための自己整合性を持つ属性認識ハッシュネットワークを提案する。
本研究では,高レベル属性固有ベクトルを教師なしで蒸留する再構成タスクのエンコーダ・デコーダ構造ネットワークを開発する。
我々のモデルは,これらの属性ベクトルに特徴デコリレーション制約を設けて,それらの代表的能力を強化する。
論文 参考訳(メタデータ) (2023-11-21T08:20:38Z) - Hierarchical Visual Primitive Experts for Compositional Zero-Shot
Learning [52.506434446439776]
合成ゼロショット学習(CZSL)は、既知のプリミティブ(属性とオブジェクト)の事前知識で構成を認識することを目的としている。
このような問題に対処するために,コンポジショントランスフォーマー(CoT)と呼ばれるシンプルでスケーラブルなフレームワークを提案する。
提案手法は,MIT-States,C-GQA,VAW-CZSLなど,いくつかのベンチマークでSoTA性能を実現する。
論文 参考訳(メタデータ) (2023-08-08T03:24:21Z) - Attribute-Centric Compositional Text-to-Image Generation [45.12516226662346]
ACTIGは属性中心のコンポジションテキスト・ツー・イメージ生成フレームワークである。
属性中心の特徴強化と,新しい画像のないトレーニング手法を提案する。
CelebA-HQおよびCUBデータセット上で、我々のフレームワークを検証する。
論文 参考訳(メタデータ) (2023-01-04T03:03:08Z) - CAT: Controllable Attribute Translation for Fair Facial Attribute
Classification [14.191129493685212]
顔属性分類では、データセットバイアスは保護属性レベルと顔属性レベルの両方から生じる。
所望の顔属性を持つ高品質で十分な顔画像を生成するための効果的なパイプラインを提案する。
提案手法は,データセットのバイアスに対処するため,再サンプリングとバランスの取れたデータセット構築の両方に優れる。
論文 参考訳(メタデータ) (2022-09-14T18:04:20Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Learning to Infer Unseen Attribute-Object Compositions [55.58107964602103]
単一属性と多属性オブジェクトの両方を柔軟に認識できるグラフベースモデルを提案する。
我々は116,099の画像と8,030の合成カテゴリを持つ大規模マルチ属性データセットを構築した。
論文 参考訳(メタデータ) (2020-10-27T14:57:35Z) - Attribute Mix: Semantic Data Augmentation for Fine Grained Recognition [102.45926816660665]
本研究では属性レベルのデータ拡張戦略であるAttribute Mixを提案する。
その原則は、属性の特徴が細粒度のサブカテゴリ間で共有され、画像間でシームレスに転送可能であることである。
論文 参考訳(メタデータ) (2020-04-06T14:06:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。