Fugu-MT 論文翻訳(概要): Text-Based Product Matching -- Semi-Supervised Clustering Approach

論文の概要: Text-Based Product Matching -- Semi-Supervised Clustering Approach

arxiv url: http://arxiv.org/abs/2402.10091v1
Date: Thu, 1 Feb 2024 18:52:26 GMT
ステータス: 翻訳完了
システム内更新日: 2024-02-18 12:39:35.076583
Title: Text-Based Product Matching -- Semi-Supervised Clustering Approach
Title（参考訳）: テキストベースの製品マッチング-半スーパービジョンクラスタリングアプローチ
Authors: Alicja Martinek, Szymon {\L}ukasik, Amir H. Gandomi
Abstract要約: 本稿では,半教師付きクラスタリング手法を用いた製品マッチングの新しい哲学を提案する。実世界のデータセット上でIDECアルゴリズムを実験することにより,本手法の特性について検討する。
参考スコア（独自算出の注目度）: 9.748519919202986
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Matching identical products present in multiple product feeds constitutes a crucial element of many tasks of e-commerce, such as comparing product offerings, dynamic price optimization, and selecting the assortment personalized for the client. It corresponds to the well-known machine learning task of entity matching, with its own specificity, like omnipresent unstructured data or inaccurate and inconsistent product descriptions. This paper aims to present a new philosophy to product matching utilizing a semi-supervised clustering approach. We study the properties of this method by experimenting with the IDEC algorithm on the real-world dataset using predominantly textual features and fuzzy string matching, with more standard approaches as a point of reference. Encouraging results show that unsupervised matching, enriched with a small annotated sample of product links, could be a possible alternative to the dominant supervised strategy, requiring extensive manual data labeling.
Abstract（参考訳）: 複数の製品フィードに存在する同一製品とのマッチングは、製品の比較、動的価格最適化、クライアント向けにパーソナライズされた選択肢の選択など、eコマースにおける多くのタスクの重要な要素である。これは、エンティティマッチングのよく知られた機械学習タスクに対応しており、非構造化データや不正確で一貫性のない製品記述など、独自の特異性を備えている。本稿では,半教師付きクラスタリングアプローチを用いた製品マッチングの新しい哲学を提案する。本稿では,本手法の特性を,主にテキストの特徴とファジィ文字列マッチングを用いて実世界のデータセット上でのIDECアルゴリズムを用いて実験し,基準点としてより標準的なアプローチを用いて検討する。アントラクタマッチングは,少量のアノテートされた製品リンクに富んだもので,広範囲な手動データラベリングを必要とする支配的な管理戦略の代替となる可能性が示唆された。

関連論文リスト

Personalized Product Search Ranking: A Multi-Task Learning Approach with Tabular and Non-Tabular Data [5.361964008135103]
マルチタスク学習フレームワークを用いて、パーソナライズされた製品検索ランキングを最適化するための新しいモデルアーキテクチャを提案する。本稿では,クリックスルー率,クリック位置,意味的類似度に基づくスケーラブルなレバレンスラベリング機構を提案する。実験結果から,マルチタスク学習のパラダイムにおいて,非語彙データと高度な埋め込み技術を組み合わせることで,モデル性能が著しく向上することが示唆された。
論文参考訳（メタデータ） (2025-08-13T09:15:08Z)
Pre-training Generative Recommender with Multi-Identifier Item Tokenization [78.87007819266957]
本稿では, MTGRecを用いて, 生成Recommender事前学習のためのトークンシーケンスデータを拡張する手法を提案する。このアプローチには、マルチアイデンティティーアイテムトークン化とカリキュラムレコメンデータ事前トレーニングという、2つの重要なイノベーションがあります。 3つの公開ベンチマークデータセットに対する大規模な実験は、MTGRecが従来の推奨基準と生成推奨基準の両方を大きく上回っていることを示している。
論文参考訳（メタデータ） (2025-04-06T08:03:03Z)
Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval [12.705202836685189]
本稿では,GRAM(Generative Retrieval and Alignment Model)という新しいeコマース検索パラダイムを紹介する。 GRAMは、クエリと製品の両方からのテキスト情報を共同でトレーニングして、共有テキストコードを生成する。 GRAMは従来のモデルと最新の生成的検索モデルを大きく上回っている。
論文参考訳（メタデータ） (2025-04-02T06:40:09Z)
Multimodal semantic retrieval for product search [6.185573921868495]
商品の純粋テキスト表現とは対照的に,eコマース検索における商品項目のマルチモーダル表現を構築した。商品のマルチモーダル表現スキームは,セマンティック検索における購入リコールや関連精度の向上を示すことができることを示す。
論文参考訳（メタデータ） (2025-01-13T14:34:26Z)
Exploring Fine-grained Retail Product Discrimination with Zero-shot Object Classification Using Vision-Language Models [50.370043676415875]
スマートリテールアプリケーションでは、多数の製品とその頻繁なターンオーバーは信頼性の高いゼロショットオブジェクト分類方法を必要とする。我々は28の異なる製品カテゴリからなるMIMEXデータセットを紹介した。我々は、提案したMIMEXデータセット上で、最先端ビジョン言語モデル(VLM)のゼロショットオブジェクト分類性能をベンチマークする。
論文参考訳（メタデータ） (2024-09-23T12:28:40Z)
STORE: Streamlining Semantic Tokenization and Generative Recommendation with A Single LLM [59.08493154172207]
本稿では,意味的トークン化と生成的レコメンデーションプロセスを合理化する統合フレームワークを提案する。我々は,意味的トークン化をテキスト・ツー・ケントタスクとして定式化し,生成的推薦をトークン・ツー・ケントタスクとして,トークン・ツー・ケント・コンストラクションタスクとテキスト・ツー・ケント補助タスクで補足する。これらのタスクはすべて生成的な方法でフレーム化され、単一の大規模言語モデル(LLM)バックボーンを使用してトレーニングされる。
論文参考訳（メタデータ） (2024-09-11T13:49:48Z)
CART: A Generative Cross-Modal Retrieval Framework with Coarse-To-Fine Semantic Modeling [53.97609687516371]
クロスモーダル検索は、異なるモーダルデータの相互作用を通じて、クエリと意味的に関連するインスタンスを検索することを目的としている。従来のソリューションでは、クエリと候補の間のスコアを明示的に計算するために、シングルトウワーまたはデュアルトウワーのフレームワークを使用している。粗大なセマンティックモデリングに基づく生成的クロスモーダル検索フレームワーク(CART)を提案する。
論文参考訳（メタデータ） (2024-06-25T12:47:04Z)
MMGRec: Multimodal Generative Recommendation with Transformer Model [81.61896141495144]
MMGRecは、マルチモーダルレコメンデーションに生成パラダイムを導入することを目指している。まず,階層的な量子化手法であるGraph CF-RQVAEを考案し,各項目にRec-IDを割り当てる。次に、Transformerベースのレコメンデータをトレーニングし、過去のインタラクションシーケンスに基づいて、ユーザが推奨するアイテムのRec-IDを生成する。
論文参考訳（メタデータ） (2024-04-25T12:11:27Z)
Enhanced E-Commerce Attribute Extraction: Innovating with Decorative Relation Correction and LLAMA 2.0-Based Annotation [4.81846973621209]
本稿では,分類のためのBERT,属性値抽出のための条件付きランダムフィールド(CRF)層,データアノテーションのための大規模言語モデル(LLM)を統合した先駆的フレームワークを提案する。提案手法は, CRFのシーケンス復号技術と相乗化したBERTの頑健な表現学習を利用して, 属性値の同定と抽出を行う。私たちの方法論は、Walmart、BestBuyのEコマースNERデータセット、CoNLLデータセットなど、さまざまなデータセットで厳格に検証されています。
論文参考訳（メタデータ） (2023-12-09T08:26:30Z)
A Unified Generative Approach to Product Attribute-Value Identification [6.752749933406399]
本稿では,製品属性値識別(PAVI)タスクに対する生成的アプローチについて検討する。我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。提案手法が既存の抽出法や分類法よりも優れていることを示す実験結果を得た。
論文参考訳（メタデータ） (2023-06-09T00:33:30Z)
Exploiting Diversity of Unlabeled Data for Label-Efficient Semi-Supervised Active Learning [57.436224561482966]
アクティブラーニング(英: Active Learning)は、ラベリングのための最も重要なサンプルを選択することで、高価なラベリングの問題に対処する研究分野である。アクティブな学習環境における初期ラベル付けのための最も情報性の高いサンプル群を選択するために,多様性に基づく新しい初期データセット選択アルゴリズムを提案する。また、一貫性に基づく埋め込みの多様性に基づくサンプリングを用いた、新しいアクティブな学習クエリ戦略を提案する。
論文参考訳（メタデータ） (2022-07-25T16:11:55Z)
Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文参考訳（メタデータ） (2022-06-17T15:40:45Z)
Interpretable Methods for Identifying Product Variants [0.2589904091148018]
製品の種類を識別する新しい手法を提案する。制約付きクラスタリングと調整されたNLP技術を組み合わせている。精度の高い要求を満たすなど、特定のビジネス基準を満たすアルゴリズムを設計します。
論文参考訳（メタデータ） (2021-04-12T14:37:16Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)
A Hybrid Approach to Enhance Pure Collaborative Filtering based on Content Feature Relationship [0.17188280334580192]
本稿では,自然言語処理領域であるWord2Vecから,コンテンツ特徴間の暗黙的な関係を抽出する手法を提案する。次に、関連性を利用してアイテムのベクトル表現を決定する新しいコンテンツベースレコメンデーションシステムを提案する。評価結果から,ユーザが選択した項目の選好を,純粋に協調的なフィルタリングと同等に予測できることが示唆された。
論文参考訳（メタデータ） (2020-05-17T02:20:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。