論文の概要: Online hierarchical partitioning of the output space in extreme multi-label data stream
- arxiv url: http://arxiv.org/abs/2507.20894v1
- Date: Mon, 28 Jul 2025 14:47:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-29 16:23:58.168663
- Title: Online hierarchical partitioning of the output space in extreme multi-label data stream
- Title(参考訳): 極多ラベルデータストリームにおける出力空間のオンライン階層分割
- Authors: Lara Neves, Afonso Lourenço, Alberto Cano, Goreti Marreiros,
- Abstract要約: この研究は、ラベル空間を非結合クラスタに分割するオンラインマルチラベル学習フレームワークであるiHOMERを導入し、事前定義された階層に依存することなく相関する。
23の実世界のデータセットを対象とした実験では、MLHAT、MLHT、Pruned Sets、iSOUPTといった最先端のグローバルベースラインを23%、kNN、EFDT、ARF、ADWINのバイナリ関連変換など12のローカルベースラインを32%上回り、オンラインマルチラベル分類の堅牢性を確立している。
- 参考スコア(独自算出の注目度): 2.474908349649168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Mining data streams with multi-label outputs poses significant challenges due to evolving distributions, high-dimensional label spaces, sparse label occurrences, and complex label dependencies. Moreover, concept drift affects not only input distributions but also label correlations and imbalance ratios over time, complicating model adaptation. To address these challenges, structured learners are categorized into local and global methods. Local methods break down the task into simpler components, while global methods adapt the algorithm to the full output space, potentially yielding better predictions by exploiting label correlations. This work introduces iHOMER (Incremental Hierarchy Of Multi-label Classifiers), an online multi-label learning framework that incrementally partitions the label space into disjoint, correlated clusters without relying on predefined hierarchies. iHOMER leverages online divisive-agglomerative clustering based on \textit{Jaccard} similarity and a global tree-based learner driven by a multivariate \textit{Bernoulli} process to guide instance partitioning. To address non-stationarity, it integrates drift detection mechanisms at both global and local levels, enabling dynamic restructuring of label partitions and subtrees. Experiments across 23 real-world datasets show iHOMER outperforms 5 state-of-the-art global baselines, such as MLHAT, MLHT of Pruned Sets and iSOUPT, by 23\%, and 12 local baselines, such as binary relevance transformations of kNN, EFDT, ARF, and ADWIN bagging/boosting ensembles, by 32\%, establishing its robustness for online multi-label classification.
- Abstract(参考訳): マルチラベル出力によるデータストリームのマイニングは、分散の進化、高次元ラベル空間、スパースラベルの発生、複雑なラベル依存性など、大きな課題を生んでいる。
さらに、概念ドリフトは入力分布だけでなく、時間とともにラベル相関や不均衡比にも影響し、モデル適応を複雑にする。
これらの課題に対処するために、構造化学習者は、局所的およびグローバルな方法に分類される。
ローカルメソッドはタスクを単純なコンポーネントに分解し、グローバルメソッドはアルゴリズムを完全な出力空間に適応させ、ラベル相関を利用してより良い予測をもたらす可能性がある。
iHOMER(Incremental Hierarchy of Multi-label Classifiers)は、ラベル空間を予め定義された階層に依存することなく、段階的に非結合な相関クラスタに分割するオンラインマルチラベル学習フレームワークである。
iHOMER は \textit{Jaccard} の類似性と多変量 \textit{Bernoulli} プロセスによって駆動されるグローバルツリーベースの学習者に基づいて,オンラインディバイシブ・アグロマリティブクラスタリングを活用して,インスタンスパーティショニングをガイドする。
非定常性に対処するため、グローバルレベルとローカルレベルの両方でドリフト検出機構を統合し、ラベルパーティションとサブツリーの動的再構成を可能にする。
23の実世界のデータセットでの実験では、iHOMERはMLHAT、MLHT、Pruned Sets、iSOUPTといった最先端のグローバルベースラインを23倍、kNN、EFDT、ARF、ADWINのバイナリ関連変換のような12のローカルベースラインを32倍に上回り、オンラインマルチラベル分類の堅牢性を確立している。
関連論文リスト
- Semi-Supervised Multi-Label Feature Selection with Consistent Sparse Graph Learning [13.401566810844368]
既存のマルチラベル手法では、十分なラベル付きサンプルなしでラベル相関を評価できない。
原特徴空間から直接導出される類似性グラフ構造は、多重ラベル問題に対する準最適である。
マルチラベル半教師付き特徴選択のための一貫したスパースグラフ学習法を提案する。
論文 参考訳(メタデータ) (2025-05-23T13:25:41Z) - Label Cluster Chains for Multi-Label Classification [2.072831155509228]
マルチラベル分類は、複数のラベルをインスタンスに同時に割り当てることができる教師付き機械学習の一種である。
そこで本稿では,ラベル空間に分割法を適用して得られた解離相関ラベルクラスタをチェーンする手法を提案する。
提案手法は,学習と連鎖が相関するラベルクラスタをよりよく探索し,ラベル相関を学習できることを示唆する。
論文 参考訳(メタデータ) (2024-11-01T11:16:37Z) - Inaccurate Label Distribution Learning with Dependency Noise [52.08553913094809]
本稿では,依存雑音に基づく不正確なラベル分布学習(DN-ILDL)フレームワークを導入し,ラベル分布学習におけるノイズによる課題に対処する。
本稿では,DN-ILDLがILDL問題に効果的に対処し,既存のLCL法より優れていることを示す。
論文 参考訳(メタデータ) (2024-05-26T07:58:07Z) - Scalable Label Distribution Learning for Multi-Label Classification [43.52928088881866]
マルチラベル分類(MLC、Multi-label classification)とは、あるインスタンスに関連ラベルのセットをタグ付けする問題を指す。
既存のMLC法の多くは、ラベルペア内の2つのラベルの相関が対称であるという仮定に基づいている。
既存のほとんどの手法はラベル数に関連する学習プロセスを設計しており、大規模な出力空間にスケールアップする際の計算複雑性をボトルネックにしている。
論文 参考訳(メタデータ) (2023-11-28T06:52:53Z) - Disambiguated Attention Embedding for Multi-Instance Partial-Label
Learning [68.56193228008466]
多くの実世界のタスクでは、関連するオブジェクトは、候補ラベルセットに関連付けられたマルチインスタンスバッグとして表現することができる。
既存のMIPLアプローチは、各インスタンスに拡張候補ラベルセットを割り当て、インスタンスレベルのラベルからバッグレベルのラベルを集約することで、インスタンス空間のパラダイムに従っている。
本稿では,DEMIPLという直感的なアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-05-26T13:25:17Z) - FedNoiL: A Simple Two-Level Sampling Method for Federated Learning with
Noisy Labels [49.47228898303909]
フェデレートラーニング(FL)は、トレーニングデータが収集され、ローカルデバイスに配置されている間、サーバ側のグローバルモデルをトレーニングすることを目的としている。
ノイズラベルの局所的なトレーニングは、集約を通じてグローバルモデルに破壊的な破壊的な、ノイズラベルへの過度な適合をもたらす可能性がある。
サーバ上でよりロバストなグローバルアグリゲーションを実現するため,クライアントを選択するための単純な2レベルサンプリング手法「FedNoiL」を開発した。
論文 参考訳(メタデータ) (2022-05-20T12:06:39Z) - Evolving Multi-Label Fuzzy Classifier [5.53329677986653]
マルチラベル分類は、同時に複数のクラスに1つのサンプルを割り当てるという問題に対処するために、機械学習コミュニティで多くの注目を集めている。
本稿では,新たなマルチラベルサンプルをインクリメンタルかつシングルパスで自己適応・自己展開可能な多ラベルファジィ分類器(EFC-ML)を提案する。
論文 参考訳(メタデータ) (2022-03-29T08:01:03Z) - Dual-Refinement: Joint Label and Feature Refinement for Unsupervised
Domain Adaptive Person Re-Identification [51.98150752331922]
Unsupervised Domain Adaptive (UDA) Person Re-identification (再ID) は、ターゲットドメインデータのラベルが欠落しているため、難しい作業です。
オフラインクラスタリングフェーズにおける擬似ラベルとオンライントレーニングフェーズにおける特徴を共同で改良する,デュアルリファインメントと呼ばれる新しいアプローチを提案する。
本手法は最先端手法を大きなマージンで上回っている。
論文 参考訳(メタデータ) (2020-12-26T07:35:35Z) - Instance-Aware Graph Convolutional Network for Multi-Label
Classification [55.131166957803345]
グラフ畳み込みニューラルネットワーク(GCN)は、マルチラベル画像認識タスクを効果的に強化した。
マルチラベル分類のための事例対応グラフ畳み込みニューラルネットワーク(IA-GCN)フレームワークを提案する。
論文 参考訳(メタデータ) (2020-08-19T12:49:28Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。