論文の概要: Producing Usable Taxonomies Cheaply and Rapidly at Pinterest Using
Discovered Dynamic $\mu$-Topics
- arxiv url: http://arxiv.org/abs/2301.12520v1
- Date: Sun, 29 Jan 2023 19:27:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 16:40:22.568722
- Title: Producing Usable Taxonomies Cheaply and Rapidly at Pinterest Using
Discovered Dynamic $\mu$-Topics
- Title(参考訳): Pinterestで動的$\mu$-topicsを使って使用可能なタコノミを迅速かつ迅速に生成する
- Authors: Abhijit Mahabal, Jiyun Luo, Rui Huang, Michael Ellsworth, Rui Li
- Abstract要約: 我々は、ピインセプションを用いた興味の分類を作成するための新しいアプローチを提案する。
発見プロセス自体は、これらの$mu$-topicsを、関連するクエリ、ピン、ユーザと動的に接続する。
ピンセプトは、ユーザーの興味のすべての領域をカバーし、ユーザーの興味の特異性を自動的に調整し、様々な種類の分類学を作成するのに適している。
- 参考スコア(独自算出の注目度): 7.937868672569834
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Creating a taxonomy of interests is expensive and human-effort intensive: not
only do we need to identify nodes and interconnect them, in order to use the
taxonomy, we must also connect the nodes to relevant entities such as users,
pins, and queries. Connecting to entities is challenging because of ambiguities
inherent to language but also because individual interests are dynamic and
evolve. Here, we offer an alternative approach that begins with bottom-up
discovery of $\mu$-topics called pincepts. The discovery process itself
connects these $\mu$-topics dynamically with relevant queries, pins, and users
at high precision, automatically adapting to shifting interests. Pincepts cover
all areas of user interest and automatically adjust to the specificity of user
interests and are thus suitable for the creation of various kinds of
taxonomies. Human experts associate taxonomy nodes with $\mu$-topics (on
average, 3 $\mu$-topics per node), and the $\mu$-topics offer a high-level data
layer that allows quick definition, immediate inspection, and easy
modification. Even more powerfully, $\mu$-topics allow easy exploration of
nearby semantic space, enabling curators to spot and fill gaps. Curators'
domain knowledge is heavily leveraged and we thus don't need untrained
mechanical Turks, allowing further cost reduction. These $\mu$-topics thus
offer a satisfactory "symbolic" stratum over which to define taxonomies. We
have successfully applied this technique for very rapidly iterating on and
launching the home decor and fashion styles taxonomy for style-based
personalization, prominently featured at the top of Pinterest search results,
at 94% precision, improving search success rate by 34.8% as well as boosting
long clicks and pin saves.
- Abstract(参考訳): ノードを特定してそれらを相互接続する必要があるだけでなく、その分類を使用するには、ノードをユーザ、ピン、クエリなどの関連エンティティに接続する必要があります。
エンティティへの接続は言語固有のあいまいさだけでなく、個々の関心が動的で進化しているため、難しい。
ここでは、Pinceptsと呼ばれる$\mu$-topicsのボトムアップ発見から始まる別のアプローチを提示します。
発見プロセス自体は、これらの$\mu$トピックと関連するクエリ、ピン、ユーザを高精度で動的に接続し、興味のシフトに自動的に適応する。
ピンセプトはユーザ関心のあらゆる領域をカバーし、ユーザ関心の特異性を自動的に調整するので、様々な分類学の作成に適している。
人間の専門家は分類ノードを$\mu$-topics(平均で3$\mu$-topics)に関連付け、$\mu$-topicsは、迅速な定義、即時検査、簡単な修正を可能にするハイレベルなデータ層を提供する。
さらに強力なのは、$\mu$-topicsによって、近くのセマンティックスペースを簡単に探索できることだ。
キュレーターのドメイン知識は大いに活用されており、未訓練の機械トルクは必要とせず、さらなるコスト削減を可能にしている。
これらの$\mu$-topicsは、分類論を定義するのに十分な「象徴的」層を提供する。
pinterestの検索結果のトップの94%の精度で、検索成功率を34.8%向上させ、長いクリックとピンセーブを増加させた、スタイルベースのパーソナライゼーションのためのホームデコーとファッションスタイルの分類法を、非常に迅速に繰り返してローンチするために、このテクニックをうまく適用しました。
関連論文リスト
- Using Zero-shot Prompting in the Automatic Creation and Expansion of
Topic Taxonomies for Tagging Retail Banking Transactions [0.0]
本研究は、命令ベース微調整LDMを用いたトピックの構築と拡張のための教師なし手法を提案する(大規模言語モデル)。
既存の分類を新しい用語で拡張するために、ゼロショットプロンプトを使用して、新しいノードを追加する場所を見つける。
得られたタグを使って、小売銀行のデータセットから商人を特徴づけるタグを割り当てます。
論文 参考訳(メタデータ) (2024-01-08T00:27:16Z) - Towards Visual Taxonomy Expansion [50.462998483087915]
本稿では,分類拡張タスクに視覚的特徴を導入し,VTE(Visual Taxonomy Expansion)を提案する。
テキストと視覚のセマンティクスをクラスタリングするためのテキストハイパーネミー学習タスクとビジュアルプロトタイプ学習タスクを提案する。
提案手法を2つのデータセットで評価し,有意な結果を得た。
論文 参考訳(メタデータ) (2023-09-12T10:17:28Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - TaxoCom: Topic Taxonomy Completion with Hierarchical Discovery of Novel
Topic Clusters [57.59286394188025]
我々はTaxoComというトピック分類の完成のための新しい枠組みを提案する。
TaxoComは、用語と文書の新たなサブトピッククラスタを発見する。
2つの実世界のデータセットに関する包括的実験により、TaxoComは、用語の一貫性とトピックカバレッジの観点から、高品質なトピック分類を生成するだけでなく、高品質なトピック分類を生成することを実証した。
論文 参考訳(メタデータ) (2022-01-18T07:07:38Z) - Who Should Go First? A Self-Supervised Concept Sorting Model for
Improving Taxonomy Expansion [50.794640012673064]
データとビジネスの範囲が実際のアプリケーションで拡大するにつれ、既存の概念を組み込むために拡張する必要がある。
分類学の拡張に関する以前の研究は、新しい概念を独立して同時に処理し、それらの間の潜在的な関係と操作を挿入する適切な順序を無視します。
本稿では,新しい概念の中で局所ハイパーニム・ハイプニム構造を同時に発見し,挿入順序を決定する新しい自己教師付きフレームワークであるtaxoorderを提案する。
論文 参考訳(メタデータ) (2021-04-08T11:00:43Z) - Taxonomy Completion via Triplet Matching Network [18.37146040410778]
我々は,クエリのハイパーニム概念とハイポニム概念の両方を発見することで,新しいタスクである「タキソノミー補完」を定式化する。
与えられたクエリの概念に対して適切なハイパーニム, hyponym> ペアを見つけるために,Triplet Matching Network (TMN) を提案する。
TMNは、既存の方法よりも優れた、分類完了タスクと以前の分類拡張タスクの両方で最高のパフォーマンスを実現します。
論文 参考訳(メタデータ) (2021-01-06T07:19:55Z) - CoRel: Seed-Guided Topical Taxonomy Construction by Concept Learning and
Relation Transferring [37.1330815281983]
本稿では,概念名によって記述された種子分類を入力としてコーパスと種分類を取り入れた種誘導型地域分類構築法を提案する。
関係伝達モジュールは、複数の経路に沿ってユーザの興味ある関係を学習し、転送し、種分類構造を幅と深さで拡張する。
概念学習モジュールは、分類学を共同で埋め込むことで、各概念ノードのセマンティクスを豊かにする。
論文 参考訳(メタデータ) (2020-10-13T22:00:31Z) - Octet: Online Catalog Taxonomy Enrichment with Self-Supervision [67.26804972901952]
オンラインカタログエンリッチメンTのための自己教師型エンドツーエンドフレームワークOctopを提案する。
本稿では,用語抽出のためのシーケンスラベリングモデルをトレーニングし,分類構造を捉えるためにグラフニューラルネットワーク(GNN)を用いることを提案する。
Octetは、オンラインカタログを、オープンワールド評価の2倍に強化する。
論文 参考訳(メタデータ) (2020-06-18T04:53:07Z) - TaxoExpan: Self-supervised Taxonomy Expansion with Position-Enhanced
Graph Neural Network [62.12557274257303]
分類学は機械解釈可能な意味論から成り、多くのウェブアプリケーションに貴重な知識を提供する。
そこで我々は,既存の分類学から,クエリの集合を自動生成するTaxoExpanという,新しい自己教師型フレームワークを提案する。
本研究では,(1)既存の分類学におけるアンカー概念の局所構造を符号化する位置強調グラフニューラルネットワーク,(2)学習モデルが自己超越データにおけるラベルノイズに敏感になるようなノイズローバスト学習の2つの手法を開発する。
論文 参考訳(メタデータ) (2020-01-26T21:30:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。