論文の概要: Hierarchical Query Classification in E-commerce Search
- arxiv url: http://arxiv.org/abs/2403.06021v1
- Date: Sat, 9 Mar 2024 21:55:55 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 09:11:22.536749
- Title: Hierarchical Query Classification in E-commerce Search
- Title(参考訳): Eコマース検索における階層的クエリ分類
- Authors: Bing He, Sreyashi Nag, Limeng Cui, Suhang Wang, Zheng Li, Rahul
Goutam, Zhen Li, Haiyang Zhang
- Abstract要約: 電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
階層的問合せ分類の本質的な複雑さは,(1)支配的カテゴリに傾倒する顕著なクラス不均衡,(2)正確な分類を妨げる検索クエリの本質的簡潔さとあいまいさの2つの課題によって複雑化されている。
- 参考スコア(独自算出の注目度): 38.67034103433015
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: E-commerce platforms typically store and structure product information and
search data in a hierarchy. Efficiently categorizing user search queries into a
similar hierarchical structure is paramount in enhancing user experience on
e-commerce platforms as well as news curation and academic research. The
significance of this task is amplified when dealing with sensitive query
categorization or critical information dissemination, where inaccuracies can
lead to considerable negative impacts. The inherent complexity of hierarchical
query classification is compounded by two primary challenges: (1) the
pronounced class imbalance that skews towards dominant categories, and (2) the
inherent brevity and ambiguity of search queries that hinder accurate
classification.
To address these challenges, we introduce a novel framework that leverages
hierarchical information through (i) enhanced representation learning that
utilizes the contrastive loss to discern fine-grained instance relationships
within the hierarchy, called ''instance hierarchy'', and (ii) a nuanced
hierarchical classification loss that attends to the intrinsic label taxonomy,
named ''label hierarchy''. Additionally, based on our observation that certain
unlabeled queries share typographical similarities with labeled queries, we
propose a neighborhood-aware sampling technique to intelligently select these
unlabeled queries to boost the classification performance. Extensive
experiments demonstrate that our proposed method is better than
state-of-the-art (SOTA) on the proprietary Amazon dataset, and comparable to
SOTA on the public datasets of Web of Science and RCV1-V2. These results
underscore the efficacy of our proposed solution, and pave the path toward the
next generation of hierarchy-aware query classification systems.
- Abstract(参考訳): 電子商取引プラットフォームは通常、製品情報と検索データを階層構造に保存し、構造化する。
ユーザ検索クエリを同様の階層構造に効果的に分類することは,eコマースプラットフォーム上でのユーザエクスペリエンスの向上,ニュースキュレーションや学術研究において最重要である。
このタスクの重要性は、機密性の高いクエリ分類や重要な情報の拡散を扱う場合に増幅され、不正確さがかなりの悪影響をもたらす可能性がある。
階層的問合せ分類の固有の複雑さは,(1)支配的カテゴリに偏る発音クラス不均衡,(2)正確な分類を妨げる検索クエリの固有簡潔性と曖昧性,の2つの主な課題によって複雑化している。
これらの課題に対処するために,階層的情報を活用した新しい枠組みを提案する。
(i)'instance hierarchy'という、階層内のきめ細かいインスタンス関係を識別するために対照的な損失を利用する強化表現学習
(ii)「ラベル階層」という,内在的なラベル分類に付随するニュアンス的階層分類の損失
さらに,ラベル付きクエリがラベル付きクエリとタイポグラフィ的類似性を共有していることから,ラベル付きクエリをインテリジェントに選択し,分類性能を高める手法を提案する。
大規模な実験により,提案手法はAmazonのプロプライエタリなデータセット上での最先端(SOTA)よりも優れており,Web of ScienceとRCV1-V2の公開データセット上でのSOTAに匹敵することがわかった。
これらの結果は,提案手法の有効性を実証し,次世代の階層型クエリ分類システムへの道を開くものである。
関連論文リスト
- Use All The Labels: A Hierarchical Multi-Label Contrastive Learning
Framework [75.79736930414715]
本稿では,すべての利用可能なラベルを活用でき,クラス間の階層的関係を維持できる階層型多言語表現学習フレームワークを提案する。
比較損失に階層的ペナルティを併用し,その階層的制約を強制する。
論文 参考訳(メタデータ) (2022-04-27T21:41:44Z) - The Overlooked Classifier in Human-Object Interaction Recognition [82.20671129356037]
クラス間の意味的相関を分類ヘッドにエンコードし,重みをHOIの言語埋め込みで初期化する。
我々は,LSE-Sign という新しい損失を,長い尾を持つデータセット上でのマルチラベル学習を強化するために提案する。
我々は,物体検出と人間のポーズを明確なマージンで求める最先端技術よりも優れた,検出不要なHOI分類を可能にする。
論文 参考訳(メタデータ) (2022-03-10T23:35:00Z) - Label Hierarchy Transition: Delving into Class Hierarchies to Enhance
Deep Classifiers [40.993137740456014]
本稿では,階層型分類の課題に対処するために,ディープラーニングに基づく統一確率的フレームワークを提案する。
提案するフレームワークは、わずかに修正するだけで、既存のディープネットワークに容易に適応できる。
提案するLHTフレームワークを皮膚病変診断タスクに拡張し,コンピュータ支援診断におけるその大きな可能性を検証した。
論文 参考訳(メタデータ) (2021-12-04T14:58:36Z) - Out-of-Category Document Identification Using Target-Category Names as
Weak Supervision [64.671654559798]
Out-of-category Detection は、文書が不適格(またはターゲット)カテゴリと意味的関連性に応じて区別することを目的としている。
対象のカテゴリの1つに属する文書の信頼性を効果的に測定する,カテゴリ外検出フレームワークを提案する。
論文 参考訳(メタデータ) (2021-11-24T21:01:25Z) - QUEACO: Borrowing Treasures from Weakly-labeled Behavior Data for Query
Attribute Value Extraction [57.56700153507383]
本稿では,QUEACOというEコマース検索におけるクエリ属性値の統一抽出システムを提案する。
NER フェーズでは、QUEACO は教師-学生ネットワークを採用し、強くラベル付けされたデータに基づいてトレーニングされた教師ネットワークが擬似ラベルを生成する。
AVN フェーズでは、弱いラベル付けされたクエリ・ツー・アトリビュート・ビヘイビア・データを利用して、クエリーから表層属性値の正規化を行い、製品から標準形式へと変換する。
論文 参考訳(メタデータ) (2021-08-19T03:24:23Z) - Inducing a hierarchy for multi-class classification problems [11.58041597483471]
分類的ラベルが自然な階層に従ったアプリケーションでは、ラベル構造を利用する分類方法は、そうでないものをしばしば上回る。
本稿では,フラット分類器に対する分類性能を向上できる階層構造を誘導する手法のクラスについて検討する。
原理シミュレーションと3つの実データアプリケーションにおいて、潜入階層の発見と精度向上のためのメソッドのクラスの有効性を実証する。
論文 参考訳(メタデータ) (2021-02-20T05:40:42Z) - Pitfalls of Assessing Extracted Hierarchies for Multi-Class
Classification [4.89253144446913]
私たちは、実践者がメソッドについて誤解を招くような結論を下すかもしれない、一般的な落とし穴を特定します。
階層の質が実験的な設定によってどう無関係になるかを示す。
その結果,多くのクラスを持つデータセットは,これらのクラスが相互に関係する複雑な構造を持つことが明らかとなった。
論文 参考訳(メタデータ) (2021-01-26T21:50:57Z) - Joint Learning of Hyperbolic Label Embeddings for Hierarchical
Multi-label Classification [9.996804039553858]
ラベルが階層内に存在するマルチラベル分類の問題を検討する。
共同学習のための新しい定式化を提案し,その効果を実証的に評価する。
論文 参考訳(メタデータ) (2021-01-13T10:58:54Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Generating Categories for Sets of Entities [34.32017697099142]
カテゴリーシステムは知識ベースの中心的な構成要素であり、意味論的に関連する概念と実体の階層的なグループ化を提供する。
本稿では,ニューラルネットワークの抽象的要約モデルを用いて,エンティティの集合のカテゴリを生成する手法を提案する。
ウィキペディアのカテゴリに基づいたテストコレクションを開発し,提案手法の有効性を実証する。
論文 参考訳(メタデータ) (2020-08-19T13:31:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。