論文の概要: Multimodal Deep Generative Model for Semi-Supervised Learning under Class Imbalance
- arxiv url: http://arxiv.org/abs/2605.06289v1
- Date: Thu, 07 May 2026 13:56:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-08 22:27:11.868727
- Title: Multimodal Deep Generative Model for Semi-Supervised Learning under Class Imbalance
- Title(参考訳): クラス不均衡下での半教師付き学習のためのマルチモーダル深層生成モデル
- Authors: Heegeon Yoon, Heeyoung Kim,
- Abstract要約: クラス不均衡下での半教師付き学習のための多モード深層生成モデルを提案する。
提案手法では,各モダリティに対して別個のエンコーダを用い,各モダリティ間で潜伏変数を共有するとともに,積オブエキスパート法による連成後続計算を簡略化する。
ラベル付きデータとラベルなしデータの両方で、$$$-powerの分散を用いて提案モデルをトレーニングするための新しい目的関数を導出する。
- 参考スコア(独自算出の注目度): 9.797319790710711
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: When modeling class-imbalanced data, it is crucial to address the imbalance, as models trained on such data tend to be biased towards the majority classes. This problem is amplified under partial supervision, where pseudo-labels for unlabeled data are predicted based on imbalanced labeled data, propagating the bias. While recent semi-supervised models address class imbalance, they typically assume single-modal input data. However, with the growing availability of multimodal data, it is essential to leverage complementary modalities. In this article, we propose a multimodal deep generative model for semi-supervised learning under class imbalance. Our approach uses separate encoders for each modality, sharing latent variables across modalities, and simplifies joint posterior computation with a product-of-experts method. To further address class imbalance, we replace typical Gaussian distributions with Student's t-distributions for the prior, encoder, and decoder, better capturing the heavy-tailed latent distributions in imbalanced data. We derive a new objective function for training the proposed model on both labeled and unlabeled data using $γ$-power divergence. Empirical results on benchmark and real-world datasets demonstrate that our model outperforms baseline methods in generalization, achieving superior classification performance for partially labeled multimodal data with imbalanced class distributions.
- Abstract(参考訳): クラス不均衡データをモデル化する場合、そのようなデータで訓練されたモデルは多数派に偏りがちであるため、不均衡に対処することが不可欠である。
この問題は部分的な監督の下で増幅され、不均衡なラベル付きデータに基づいてラベルなしデータの擬似ラベルが予測され、バイアスが伝播する。
最近の半教師付きモデルはクラス不均衡に対処するが、通常は単一モードの入力データを仮定する。
しかし、マルチモーダルデータの可用性が高まるにつれて、相補的なモダリティを活用することが不可欠である。
本稿では,クラス不均衡下での半教師付き学習のためのマルチモーダル深層生成モデルを提案する。
提案手法では,各モダリティに対して別個のエンコーダを用い,各モダリティ間で潜伏変数を共有するとともに,積オブエキスパート法による連成後続計算を簡略化する。
さらに、クラス不均衡に対処するため、従来のガウス分布を前者、エンコーダ、デコーダの生徒のt分布に置き換え、不均衡データにおける重み付き潜在分布をよりよくキャプチャする。
ラベル付きデータとラベルなしデータの両方で、$γ$-power divergenceを用いて提案モデルをトレーニングするための新しい目的関数を導出する。
ベンチマークおよび実世界のデータセットを用いた実験結果から,本モデルは一般化におけるベースライン法よりも優れ,不均衡なクラス分布を持つ部分ラベル付きマルチモーダルデータに対して,優れた分類性能が得られることが示された。
関連論文リスト
- Heterogeneous Self-Supervised Acoustic Pre-Training with Local Constraints [64.15709757611369]
異種データを扱うための自己教師付き事前学習手法を提案する。
提案手法は、下流の教師付き微調整タスクに対する自己教師付き事前訓練モデルの適応性を大幅に向上させることができる。
論文 参考訳(メタデータ) (2025-08-27T15:48:50Z) - Synthetic Tabular Data Generation for Imbalanced Classification: The Surprising Effectiveness of an Overlap Class [20.606333546028516]
最先端の深部生成モデルでは, 多数例よりも極めて低品質な少数例が得られている。
本稿では,少数分布と多数分布が重複する領域のクラスを導入することで,二進分類ラベルを三進分類ラベルに変換する新しい手法を提案する。
論文 参考訳(メタデータ) (2024-12-20T08:15:20Z) - Fair GANs through model rebalancing for extremely imbalanced class
distributions [5.463417677777276]
本稿では,既存のバイアス付きGANからGAN(unbiased generative adversarial Network)を構築するためのアプローチを提案する。
Flickr Faces High Quality (FFHQ) データセットを用いて、人種的公平性をトレーニングしながら、StyleGAN2モデルの結果を示す。
また,不均衡なCIFAR10データセットに適用することで,我々のアプローチをさらに検証する。
論文 参考訳(メタデータ) (2023-08-16T19:20:06Z) - Class-Balancing Diffusion Models [57.38599989220613]
クラスバランシング拡散モデル(CBDM)は、分散調整正規化器をソリューションとして訓練する。
提案手法は,CIFAR100/CIFAR100LTデータセットで生成結果をベンチマークし,下流認識タスクにおいて優れた性能を示す。
論文 参考訳(メタデータ) (2023-04-30T20:00:14Z) - Integrating Local Real Data with Global Gradient Prototypes for
Classifier Re-Balancing in Federated Long-Tailed Learning [60.41501515192088]
フェデレートラーニング(FL)は、グローバルモデルを協調的にトレーニングする複数のクライアントを含む、人気のある分散ラーニングパラダイムになっています。
データサンプルは通常、現実世界の長い尾の分布に従っており、分散化された長い尾のデータのFLは、貧弱なグローバルモデルをもたらす。
本研究では、局所的な実データとグローバルな勾配のプロトタイプを統合し、局所的なバランスの取れたデータセットを形成する。
論文 参考訳(メタデータ) (2023-01-25T03:18:10Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。