論文の概要: A Scalable Curiosity-Driven Game-Theoretic Framework for Long-Tail Multi-Label Learning in Data Mining
- arxiv url: http://arxiv.org/abs/2602.15330v1
- Date: Tue, 17 Feb 2026 03:33:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-18 16:03:17.970476
- Title: A Scalable Curiosity-Driven Game-Theoretic Framework for Long-Tail Multi-Label Learning in Data Mining
- Title(参考訳): データマイニングにおけるマルチラベル学習のためのスケーラブルな好奇心駆動型ゲーム理論フレームワーク
- Authors: Jing Yang, Keze Wang,
- Abstract要約: 本稿では,長期学習をマルチプレイヤーゲームとして再放送する,スケーラブルな協調型フレームワークを提案する。
Wiki10-31Kでは,CD-GTMLLが最先端の手法を一貫して上回り,最大1.6%のP@3が得られた。
ゲーム理論と好奇心のメカニズムを統合することで、CD-GTMLLはリソース制約のある環境でより適応的な学習の道を開く。
- 参考スコア(独自算出の注目度): 15.919487566503923
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The long-tail distribution, where a few head labels dominate while rare tail labels abound, poses a persistent challenge for large-scale Multi-Label Classification (MLC) in real-world data mining applications. Existing resampling and reweighting strategies often disrupt inter-label dependencies or require brittle hyperparameter tuning, especially as the label space expands to tens of thousands of labels. To address this issue, we propose Curiosity-Driven Game-Theoretic Multi-Label Learning (CD-GTMLL), a scalable cooperative framework that recasts long-tail MLC as a multi-player game - each sub-predictor ("player") specializes in a partition of the label space, collaborating to maximize global accuracy while pursuing intrinsic curiosity rewards based on tail label rarity and inter-player disagreement. This mechanism adaptively injects learning signals into under-represented tail labels without manual balancing or tuning. We further provide a theoretical analysis showing that our CD-GTMLL converges to a tail-aware equilibrium and formally links the optimization dynamics to improvements in the Rare-F1 metric. Extensive experiments across 7 benchmarks, including extreme multi-label classification datasets with 30,000+ labels, demonstrate that CD-GTMLL consistently surpasses state-of-the-art methods, with gains up to +1.6% P@3 on Wiki10-31K. Ablation studies further confirm the contributions of both game-theoretic cooperation and curiosity-driven exploration to robust tail performance. By integrating game theory with curiosity mechanisms, CD-GTMLL not only enhances model efficiency in resource-constrained environments but also paves the way for more adaptive learning in imbalanced data scenarios across industries like e-commerce and healthcare.
- Abstract(参考訳): いくつかのヘッドラベルが支配的であり、レアテールラベルが多数存在するロングテール分布は、実世界のデータマイニングアプリケーションにおける大規模マルチラベル分類(MLC)において、永続的な課題となっている。
既存の再サンプリングと再重み付け戦略は、ラベル間の依存関係を妨害したり、特にラベル空間が数万のラベルに拡大するにつれて、不安定なハイパーパラメータチューニングを必要とすることが多い。
この問題を解決するために,我々は,多人数ゲームとしてロングテールLCCを再キャストするスケーラブルな協調フレームワークであるCuriosity-Driven Game-Theoretic Multi-Label Learning (CD-GTMLL)を提案する。
このメカニズムは、手動のバランスやチューニングなしに、学習信号を未表現のテールラベルに適応的に注入する。
さらに、我々は、我々のCD-GTMLLがテール・アウェア平衡に収束し、最適化力学をレア・F1メートル法の改良に正式にリンクすることを示す理論的解析を行った。
CD-GTMLLは最先端の手法を一貫して上回り、Wiki10-31Kでは最大1.6%のP@3を得る。
アブレーション研究は、ゲーム理論の協力と好奇心を駆使した探索の双方が堅牢な尾のパフォーマンスに寄与していることをさらに確認した。
ゲーム理論と好奇心のメカニズムを統合することで、CD-GTMLLはリソース制約のある環境におけるモデルの効率を高めるだけでなく、電子商取引や医療といった業界における不均衡なデータシナリオにおいて、より適応的な学習の道を開く。
関連論文リスト
- Causal Invariance and Counterfactual Learning Driven Cooperative Game for Multi-Label Classification [12.67288560758937]
マルチラベル分類(MLC)は、ラベルの不均衡、スプリアス相関、分布シフトに弱いままである。
本稿では,MLCを協調的マルチプレイヤーインタラクションとして概念化するCausal Cooperative Game (CCG) フレームワークを紹介する。
論文 参考訳(メタデータ) (2025-11-30T09:39:43Z) - Curiosity Meets Cooperation: A Game-Theoretic Approach to Long-Tail Multi-Label Learning [7.787238560440755]
長い尾の不均衡は多ラベル学習に固有である。
私たちはそのタスクを協力的な潜在的なゲームとみなした。
我々は,CD-GTMLLがマルチラベル予測において,長距離ロバスト性に対する原則的かつスケーラブルな経路を提供することを示す。
論文 参考訳(メタデータ) (2025-10-20T13:21:07Z) - Label Distribution Learning with Biased Annotations by Learning Multi-Label Representation [120.97262070068224]
マルチラベル学習(MLL)は,実世界のデータ表現能力に注目されている。
ラベル分布学習(LDL)は正確なラベル分布の収集において課題に直面している。
論文 参考訳(メタデータ) (2025-02-03T09:04:03Z) - Cross-Modality Clustering-based Self-Labeling for Multimodal Data Classification [2.666791490663749]
CMCSL(Cross-Modality Clustering-based Self-Labeling)
CMCSLは、深い特徴空間の各モードに属するインスタンスをグループ化し、その結果のクラスタ内で既知のラベルを伝搬する。
MM-IMDbデータセットから抽出した20個のデータセットに対する実験的検討
論文 参考訳(メタデータ) (2024-08-05T15:43:56Z) - Is margin all you need? An extensive empirical study of active learning
on tabular data [66.18464006872345]
我々は,OpenML-CC18ベンチマークを用いて,69の実世界のデータセット上での各種能動学習アルゴリズムの性能を解析した。
意外なことに、古典的なマージンサンプリング技術は、現在の最先端技術を含む、他のすべてのものよりも優れている。
論文 参考訳(メタデータ) (2022-10-07T21:18:24Z) - One Positive Label is Sufficient: Single-Positive Multi-Label Learning
with Label Enhancement [71.9401831465908]
本研究では,SPMLL (Single- positive multi-label learning) について検討した。
ラベルエンハンスメントを用いた単陽性MultIラベル学習という新しい手法を提案する。
ベンチマークデータセットの実験により,提案手法の有効性が検証された。
論文 参考訳(メタデータ) (2022-06-01T14:26:30Z) - Extreme Zero-Shot Learning for Extreme Text Classification [80.95271050744624]
極端ゼロショットXMC (EZ-XMC) とフーショットXMC (FS-XMC) について検討した。
自己教師付きコントラスト損失のあるトランスフォーマーベースのエンコーダの事前訓練を提案する。
我々は,多スケール適応クラスタリング,ラベル正規化,擬陽性ペアによる自己学習などの手法を用いて,生テキストを徹底的に活用する事前学習手法MACLRを開発した。
論文 参考訳(メタデータ) (2021-12-16T06:06:42Z) - Gaussian Mixture Variational Autoencoder with Contrastive Learning for
Multi-Label Classification [27.043136219527767]
本稿では,新しいコントラスト学習促進型マルチラベル予測モデルを提案する。
教師付き環境でのコントラスト学習を用いることで,ラベル情報を効果的に活用することができる。
学習した埋め込みがラベルとラベルの相互作用の解釈に洞察を与えることを示す。
論文 参考訳(メタデータ) (2021-12-02T04:23:34Z) - Improving Contrastive Learning on Imbalanced Seed Data via Open-World
Sampling [96.8742582581744]
我々は、Model-Aware K-center (MAK)と呼ばれるオープンワールドなラベルなしデータサンプリングフレームワークを提案する。
MAKは、尾性、近接性、多様性の3つの単純な原則に従う。
我々はMAKが学習した機能の全体的な表現品質とクラスバランス性の両方を継続的に改善できることを実証した。
論文 参考訳(メタデータ) (2021-11-01T15:09:41Z) - HOT-VAE: Learning High-Order Label Correlation for Multi-Label
Classification via Attention-Based Variational Autoencoders [8.376771467488458]
High-order Tie-in Variational Autoencoder (HOT-VAE) 形式ごとの適応的高階ラベル相関学習。
本モデルが鳥の分布データセット上で既存の最先端のアプローチを上回ることを実験的に検証した。
論文 参考訳(メタデータ) (2021-03-09T04:30:28Z) - Self-Tuning for Data-Efficient Deep Learning [75.34320911480008]
セルフチューニングは、データ効率のよいディープラーニングを可能にする新しいアプローチである。
ラベル付きおよびラベルなしデータの探索と事前訓練されたモデルの転送を統一する。
SSLとTLの5つのタスクをシャープなマージンで上回ります。
論文 参考訳(メタデータ) (2021-02-25T14:56:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。