論文の概要: Enhancing Text-Based Hierarchical Multilabel Classification for Mobile Applications via Contrastive Learning
- arxiv url: http://arxiv.org/abs/2507.04413v1
- Date: Sun, 06 Jul 2025 15:04:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-08 15:46:35.169853
- Title: Enhancing Text-Based Hierarchical Multilabel Classification for Mobile Applications via Contrastive Learning
- Title(参考訳): コントラスト学習によるモバイルアプリケーションのためのテキストベース階層型マルチラベル分類の強化
- Authors: Jiawei Guo, Yang Xiao, Weipeng Huang, Guangyuan Piao,
- Abstract要約: モバイルアプリケーション(アプリケーション)向けの階層的なラベリングシステムは、独自のユーザデータとラベリングを統合する幅広いダウンストリームビジネスに恩恵をもたらす。
我々は、名前や記述などのテキスト情報を用いて、アプリケーションの階層的マルチラベル分類の問題に対処する。
当社のアプローチはTencentで展開されており、アプリのマルチラベル分類アウトプットは、ダウンストリームタスク — ユーザのリスク管理 — のパフォーマンスを10.70%向上させました。
- 参考スコア(独自算出の注目度): 3.8920014348892225
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A hierarchical labeling system for mobile applications (apps) benefits a wide range of downstream businesses that integrate the labeling with their proprietary user data, to improve user modeling. Such a label hierarchy can define more granular labels that capture detailed app features beyond the limitations of traditional broad app categories. In this paper, we address the problem of hierarchical multilabel classification for apps by using their textual information such as names and descriptions. We present: 1) HMCN (Hierarchical Multilabel Classification Network) for handling the classification from two perspectives: the first focuses on a multilabel classification without hierarchical constraints, while the second predicts labels sequentially at each hierarchical level considering such constraints; 2) HMCL (Hierarchical Multilabel Contrastive Learning), a scheme that is capable of learning more distinguishable app representations to enhance the performance of HMCN. Empirical results on our Tencent App Store dataset and two public datasets demonstrate that our approach performs well compared with state-of-the-art methods. The approach has been deployed at Tencent and the multilabel classification outputs for apps have helped a downstream task--credit risk management of user--improve its performance by 10.70% with regard to the Kolmogorov-Smirnov metric, for over one year.
- Abstract(参考訳): モバイルアプリケーション(アプリケーション)向けの階層的なラベリングシステムは、ユーザモデリングを改善するために、そのラベリングを独自のユーザデータと統合する幅広いダウンストリームビジネスに恩恵をもたらす。
このようなラベル階層は、より粒度の細かいラベルを定義して、従来のワイドアプリカテゴリの制限を超えて詳細なアプリ機能をキャプチャすることができる。
本稿では、名前や記述などのテキスト情報を用いて、アプリケーションの階層的マルチラベル分類の問題に対処する。
以下を提示する。
1) HMCN (Hierarchical Multilabel Classification Network) は2つの観点から分類を扱い、第1は階層的制約のないマルチラベル分類に焦点を当て、第2は階層的制約を考慮した各階層レベルでラベルを逐次予測する。
2) HMCL(階層型多言語コントラスト学習)は,HMCNの性能を高めるために,より区別可能なアプリケーション表現を学習できるスキームである。
Tencent App Storeのデータセットと2つの公開データセットに関する実証的な結果は、私たちのアプローチが最先端の手法とよく比較されていることを示している。
Tencentではこのアプローチが展開され、アプリのマルチラベル分類アウトプットがダウンストリームタスクのリスク管理に役立っている。Kolmogorov-Smirnovメトリックに関して1年以上にわたって、そのパフォーマンスを10.70%向上させた。
関連論文リスト
- Hierarchical Multi-Label Generation with Probabilistic Level-Constraint [3.1427813443719868]
階層的極端多ラベル分類は、従来の多ラベル分類よりも困難である。
我々は,確率的レベル制約(PLC)を用いた生成フレームワークを用いて,特定の分類体系内で階層的なラベルを生成する。
提案手法は,HMGタスクにおいて新たなSOTA性能を実現するが,従来の研究結果よりもモデル出力の制約に優れた性能が得られる。
論文 参考訳(メタデータ) (2025-04-30T07:56:53Z) - SEAL: Simultaneous Label Hierarchy Exploration And Learning [9.701914280306118]
本稿では,従来の階層構造に従う潜在ラベルでラベルを増大させることにより,ラベル階層を探索する新しいフレームワークを提案する。
本手法では,木間距離空間上の1-ワッサーシュタイン計量を客観的関数として用いて,データ駆動型ラベル階層を同時に学習し,半教師付き学習を行う。
論文 参考訳(メタデータ) (2023-04-26T08:31:59Z) - Open Vocabulary Multi-Label Classification with Dual-Modal Decoder on
Aligned Visual-Textual Features [14.334304670606633]
本稿では,視覚的特徴とテキスト的特徴の整合性を備えた2次元デコーダ (DM-decoder) を含む新しいアルゴリズム,Aligned Dual MoDality ClaSsifier (ADDS) を提案する。
NUS-WIDE, ImageNet-1k, ImageNet-21k, MS-COCO など,いくつかの標準ベンチマークで実施された大規模な実験により,提案手法が従来の手法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2022-08-19T22:45:07Z) - Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - MATCH: Metadata-Aware Text Classification in A Large Hierarchy [60.59183151617578]
MATCHはメタデータと階層情報の両方を利用するエンドツーエンドのフレームワークである。
親による各子ラベルのパラメータと出力確率を正規化するさまざまな方法を提案します。
大規模なラベル階層を持つ2つの大規模なテキストデータセットの実験は、MATCHの有効性を示しています。
論文 参考訳(メタデータ) (2021-02-15T05:23:08Z) - Joint Learning of Hyperbolic Label Embeddings for Hierarchical
Multi-label Classification [9.996804039553858]
ラベルが階層内に存在するマルチラベル分類の問題を検討する。
共同学習のための新しい定式化を提案し,その効果を実証的に評価する。
論文 参考訳(メタデータ) (2021-01-13T10:58:54Z) - An Empirical Study on Large-Scale Multi-Label Text Classification
Including Few and Zero-Shot Labels [49.036212158261215]
大規模なMulti-label Text Classification (LMTC) は、幅広い自然言語処理 (NLP) アプリケーションを持つ。
Label-Wise Attention Networks (LWANs) を用いた最新のLMTCモデル
確率的ラベル木(PLT)に基づく階層的手法がLWANより優れていることを示す。
BERTとLWANを組み合わせた最先端手法を提案する。
論文 参考訳(メタデータ) (2020-10-04T18:55:47Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Interaction Matching for Long-Tail Multi-Label Classification [57.262792333593644]
既存のマルチラベル分類モデルにおいて,制約に対処するためのエレガントで効果的なアプローチを提案する。
ソフトなn-gram相互作用マッチングを実行することで、ラベルと自然言語記述をマッチングする。
論文 参考訳(メタデータ) (2020-05-18T15:27:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。