論文の概要: Theoretical Understandings of Product Embedding for E-commerce Machine
Learning
- arxiv url: http://arxiv.org/abs/2102.12029v1
- Date: Wed, 24 Feb 2021 02:29:15 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-25 13:24:50.014236
- Title: Theoretical Understandings of Product Embedding for E-commerce Machine
Learning
- Title(参考訳): Eコマース機械学習におけるプロダクト埋め込みの理論的理解
- Authors: Da Xu, Chuanwei Ruan, Evren Korpeoglu, Sushant Kumar, Kannan Achan
- Abstract要約: 我々は,製品埋め込みのeコマース指向の視点を捉え,表現学習と学習理論の両面から完全に理論的視点を明らかにする。
広く採用されているスキップグラムネガティブサンプリングアルゴリズムによって訓練された製品埋め込みは、重要な製品関連測定に関する十分な寸法減少であることが証明されています。
下流機械学習タスクにおける一般化性能は、埋め込みと製品関連度尺度とのアライメントによって制御される。
- 参考スコア(独自算出の注目度): 18.204325860752768
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Product embeddings have been heavily investigated in the past few years,
serving as the cornerstone for a broad range of machine learning applications
in e-commerce. Despite the empirical success of product embeddings, little is
known on how and why they work from the theoretical standpoint. Analogous
results from the natural language processing (NLP) often rely on
domain-specific properties that are not transferable to the e-commerce setting,
and the downstream tasks often focus on different aspects of the embeddings. We
take an e-commerce-oriented view of the product embeddings and reveal a
complete theoretical view from both the representation learning and the
learning theory perspective. We prove that product embeddings trained by the
widely-adopted skip-gram negative sampling algorithm and its variants are
sufficient dimension reduction regarding a critical product relatedness
measure. The generalization performance in the downstream machine learning task
is controlled by the alignment between the embeddings and the product
relatedness measure. Following the theoretical discoveries, we conduct
exploratory experiments that supports our theoretical insights for the product
embeddings.
- Abstract(参考訳): 製品埋め込みはここ数年で大きく研究され、eコマースにおける幅広い機械学習アプリケーションの基礎となっている。
製品埋め込みの実証的な成功にもかかわらず、どのように、なぜそれらが理論的な観点から働くのかは、ほとんど分かっていない。
自然言語処理(NLP)によるアナログな結果はしばしば、eコマース環境に転送できないドメイン固有のプロパティに依存し、下流のタスクは埋め込みの異なる側面にフォーカスすることが多い。
我々は,製品埋め込みのeコマース指向の視点を捉え,表現学習と学習理論の両面から完全に理論的視点を明らかにする。
私たちは、広く採用されているスキップグラムネガティブサンプリングアルゴリズムとそのバリエーションによって訓練された製品埋め込みが、重要な製品関連測定に関する十分な寸法減少であることを証明します。
下流機械学習タスクにおける一般化性能は、埋め込みと製品関連度尺度とのアライメントによって制御される。
理論的発見に続いて,製品埋め込みに関する理論的洞察を支援する探索実験を行う。
関連論文リスト
- A Catalog of Fairness-Aware Practices in Machine Learning Engineering [13.012624574172863]
機械学習は意思決定プロセスに広く採用されているため、公平性に対する懸念が高まる。
マシンラーニングライフサイクル全体を通じて、エンジニアリングフェアネスに関するプラクティスの理解と分類には、依然としてギャップがあります。
本稿では,体系的マッピング研究から得られた機械学習における公平性に対処するための新しいプラクティスカタログを提案する。
論文 参考訳(メタデータ) (2024-08-29T16:28:43Z) - Coding for Intelligence from the Perspective of Category [66.14012258680992]
符号化の対象はデータの圧縮と再構成、インテリジェンスである。
最近の傾向は、これらの2つの分野の潜在的均一性を示している。
本稿では,カテゴリ理論の観点から,インテリジェンスのためのコーディングの新たな問題を提案する。
論文 参考訳(メタデータ) (2024-07-01T07:05:44Z) - MinT: Boosting Generalization in Mathematical Reasoning via Multi-View
Fine-Tuning [53.90744622542961]
数学領域における推論は、小言語モデル(LM)にとって重要な課題である。
多様なアノテーションスタイルで既存の数学的問題データセットを利用する新しい手法を提案する。
実験結果から,LLaMA-7Bモデルが先行手法より優れていることが示された。
論文 参考訳(メタデータ) (2023-07-16T05:41:53Z) - Knowledge Graph Completion Models are Few-shot Learners: An Empirical
Study of Relation Labeling in E-commerce with LLMs [16.700089674927348]
大規模言語モデル(LLM)は多くの自然言語処理タスクにおいて驚くべき結果を示している。
本稿では,自然言語における強力な学習能力とラベル付きデータを用いた製品タイプ間の関係予測の有効性について検討する。
以上の結果から,LLMは電子商取引KGのリレーショナルラベリングにおいて既存のKG完成モデルよりも大幅に優れており,人間のラベリングに取って代わるほど高い性能を示した。
論文 参考訳(メタデータ) (2023-05-17T00:08:36Z) - Pretrained Embeddings for E-commerce Machine Learning: When it Fails and
Why? [18.192733659176806]
電子商取引アプリケーションにおける事前学習型埋め込みの利用について検討する。
事前にトレーニングされた埋め込みがどのように動作するのか、十分に理解されていないことが分かりました。
我々はカーネル解析のレンズを通して事前学習した埋め込みの原理的視点を確立する。
論文 参考訳(メタデータ) (2023-04-09T23:55:47Z) - Scalable PAC-Bayesian Meta-Learning via the PAC-Optimal Hyper-Posterior:
From Theory to Practice [54.03076395748459]
メタラーニング文学の中心的な疑問は、目に見えないタスクへの一般化を保証するために、いかに正規化するかである。
本稿では,Rothfussらによって最初に導かれたメタラーニングの一般化について述べる。
PAC-Bayesian per-task 学習境界におけるメタラーニングの条件と程度について,理論的解析および実証事例研究を行った。
論文 参考訳(メタデータ) (2022-11-14T08:51:04Z) - A Free Lunch from the Noise: Provable and Practical Exploration for
Representation Learning [55.048010996144036]
ある雑音仮定の下では、対応するマルコフ遷移作用素の線型スペクトル特性を自由な閉形式で得られることを示す。
本稿では,スペクトルダイナミクス埋め込み(SPEDE)を提案する。これはトレードオフを破り,雑音の構造を利用して表現学習のための楽観的な探索を完遂する。
論文 参考訳(メタデータ) (2021-11-22T19:24:57Z) - Panoramic Learning with A Standardized Machine Learning Formalism [116.34627789412102]
本稿では,多様なMLアルゴリズムの統一的な理解を提供する学習目的の標準化された方程式を提案する。
また、新しいMLソリューションのメカニック設計のガイダンスも提供し、すべての経験を持つパノラマ学習に向けた有望な手段として機能する。
論文 参考訳(メタデータ) (2021-08-17T17:44:38Z) - K-PLUG: Knowledge-injected Pre-trained Language Model for Natural
Language Understanding and Generation in E-Commerce [38.9878151656255]
K-PLUGは、エンコーダデコーダトランスフォーマーに基づく知識インジェクション型プリトレーニング言語モデルです。
ドメイン特化知識の学習を定式化する5つの自己指導型事前学習目標を提案する。
論文 参考訳(メタデータ) (2021-04-14T16:37:31Z) - Scalable bundling via dense product embeddings [1.933681537640272]
バンドルとは,2つ以上の製品をディスカウントで共同販売するプラクティスである。
我々は,大規模なクロスカテゴリ小売環境でバンドルを設計するための,機械学習による新しい手法を開発した。
埋め込みベースの製品は、バンドルの成功の強力な予測要因であり、製品全体にわたって堅牢であり、小売業者全体の構成によく当てはまります。
論文 参考訳(メタデータ) (2020-01-31T23:34:56Z) - Rethinking Generalization of Neural Models: A Named Entity Recognition
Case Study [81.11161697133095]
NERタスクをテストベッドとして、異なる視点から既存モデルの一般化挙動を分析する。
詳細な分析による実験は、既存のニューラルNERモデルのボトルネックを診断する。
本論文の副産物として,最近のNER論文の包括的要約を含むプロジェクトをオープンソース化した。
論文 参考訳(メタデータ) (2020-01-12T04:33:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。