論文の概要: Learning What You Need from What You Did: Product Taxonomy Expansion
with User Behaviors Supervision
- arxiv url: http://arxiv.org/abs/2203.14921v1
- Date: Mon, 28 Mar 2022 17:17:50 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 16:37:10.985029
- Title: Learning What You Need from What You Did: Product Taxonomy Expansion
with User Behaviors Supervision
- Title(参考訳): あなたが何をしたかを学ぶ: ユーザー行動監督による製品分類学の拡張
- Authors: Sijie Cheng, Zhouhong Gu, Bang Liu, Rui Xie, Wei Wu and Yanghua Xiao
- Abstract要約: 我々は,既存の分類学に新たな概念を付加するための,自己監督的かつユーザ行動指向の製品拡張フレームワークを提案する。
本フレームワークは,ユーザの意図や認識に合致した偽名関係を抽出する。
本手法は実世界の製品のサイズを88%のセマンティック精度で39,263から94,698に拡大する。
- 参考スコア(独自算出の注目度): 21.649258076884927
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Taxonomies have been widely used in various domains to underpin numerous
applications. Specially, product taxonomies serve an essential role in the
e-commerce domain for the recommendation, browsing, and query understanding.
However, taxonomies need to constantly capture the newly emerged terms or
concepts in e-commerce platforms to keep up-to-date, which is expensive and
labor-intensive if it relies on manual maintenance and updates. Therefore, we
target the taxonomy expansion task to attach new concepts to existing
taxonomies automatically. In this paper, we present a self-supervised and user
behavior-oriented product taxonomy expansion framework to append new concepts
into existing taxonomies. Our framework extracts hyponymy relations that
conform to users' intentions and cognition. Specifically, i) to fully exploit
user behavioral information, we extract candidate hyponymy relations that match
user interests from query-click concepts; ii) to enhance the semantic
information of new concepts and better detect hyponymy relations, we model
concepts and relations through both user-generated content and structural
information in existing taxonomies and user click logs, by leveraging
Pre-trained Language Models and Graph Neural Network combined with Contrastive
Learning; iii) to reduce the cost of dataset construction and overcome data
skews, we construct a high-quality and balanced training dataset from existing
taxonomy with no supervision. Extensive experiments on real-world product
taxonomies in Meituan Platform, a leading Chinese vertical e-commerce platform
to order take-out with more than 70 million daily active users, demonstrate the
superiority of our proposed framework over state-of-the-art methods. Notably,
our method enlarges the size of real-world product taxonomies from 39,263 to
94,698 relations with 88% precision.
- Abstract(参考訳): 分類学は様々な領域で広く使われており、多くの応用がなされている。
特に、商品分類は、レコメンデーション、ブラウジング、クエリ理解のためのeコマースドメインにおいて重要な役割を果たす。
しかし、タコノミクスは、手動のメンテナンスや更新に依存する場合、高価で労働集約的なEコマースプラットフォームにおいて、新しく登場した用語や概念を常に把握する必要がある。
そこで,既存の分類群に新しい概念を自動的に付加する分類展開タスクを目標とした。
本稿では,既存の分類体系に新たな概念を付加するための,自己監督型およびユーザ行動指向の製品分類拡張フレームワークを提案する。
本フレームワークは,ユーザの意図や認知に適合した偽善関係を抽出する。
具体的には
一 ユーザーの行動情報を十分に活用するために、クエリークリックの概念からユーザーの興味に合致する候補の偽善関係を抽出する。
二 新しい概念のセマンティック情報を強化し、偽名関係をよりよく検出するために、事前学習言語モデルとグラフニューラルネットワークとコントラスト学習を併用することにより、既存の分類とユーザクリックログにおけるユーザ生成コンテンツと構造情報の両方を通して概念と関係をモデル化する。
三 データセット構築のコストを削減し、データスキューを克服するために、既存の分類学からの高品質でバランスの取れたトレーニングデータセットを監督なしで構築する。
毎日7000万人以上のアクティブユーザーとテイクアウトを注文する中国の垂直eコマースプラットフォームであるMeituan Platformにおける実世界の製品分類に関する大規模な実験は、最先端の手法よりも提案するフレームワークの優位性を実証している。
特に,実世界の製品分類を39,263から94,698まで88%の精度で拡張した。
関連論文リスト
- CodeTaxo: Enhancing Taxonomy Expansion with Limited Examples via Code Language Prompts [40.52605902842168]
textscCodeTaxoは、コード言語プロンプトを通じて大きな言語モデルを活用する新しいアプローチである。
異なるドメインの5つの実世界のベンチマークの実験では、textscCodeTaxoはすべての評価指標に対して一貫して優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-08-17T02:15:07Z) - Using Zero-shot Prompting in the Automatic Creation and Expansion of
Topic Taxonomies for Tagging Retail Banking Transactions [0.0]
本研究は、命令ベース微調整LDMを用いたトピックの構築と拡張のための教師なし手法を提案する(大規模言語モデル)。
既存の分類を新しい用語で拡張するために、ゼロショットプロンプトを使用して、新しいノードを追加する場所を見つける。
得られたタグを使って、小売銀行のデータセットから商人を特徴づけるタグを割り当てます。
論文 参考訳(メタデータ) (2024-01-08T00:27:16Z) - TMT-VIS: Taxonomy-aware Multi-dataset Joint Training for Video Instance Segmentation [48.75470418596875]
大規模データセットのトレーニングは、ビデオインスタンスセグメンテーションのパフォーマンスを高めることができるが、VISのデータセットは労働コストが高いためスケールアップが難しい。
私たちが持っているものは、多数の独立した提出された特定のデータセットであり、データ量と多様性を高めるためにデータセットの集合をまたいだモデルを共同でトレーニングすることが魅力です。
我々は、YouTube-VIS 2019、YouTube-VIS 2021、OVIS、UVOの4つの人気で挑戦的なベンチマークで、広範囲に評価を行っている。
本モデルでは,ベースラインソリューションよりも大幅に改善され,すべてのベンチマークで新たな最先端レコードが設定される。
論文 参考訳(メタデータ) (2023-12-11T18:50:09Z) - Towards Visual Taxonomy Expansion [50.462998483087915]
本稿では,分類拡張タスクに視覚的特徴を導入し,VTE(Visual Taxonomy Expansion)を提案する。
テキストと視覚のセマンティクスをクラスタリングするためのテキストハイパーネミー学習タスクとビジュアルプロトタイプ学習タスクを提案する。
提案手法を2つのデータセットで評価し,有意な結果を得た。
論文 参考訳(メタデータ) (2023-09-12T10:17:28Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - STEAM: Self-Supervised Taxonomy Expansion with Mini-Paths [53.45704816829921]
本稿では,STEAMという自己管理型分類拡張モデルを提案する。
STEAMは自然の自己超越信号を生成し、ノードアタッチメント予測タスクを定式化する。
実験の結果、STEAMは11.6%の精度と7.0%の相反ランクで、最先端の分類法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-18T00:32:53Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。