Fugu-MT 論文翻訳(概要): TPDR: A Novel Two-Step Transformer-based Product and Class Description Match and Retrieval Method

論文の概要: TPDR: A Novel Two-Step Transformer-based Product and Class Description Match and Retrieval Method

arxiv url: http://arxiv.org/abs/2310.03491v1
Date: Thu, 5 Oct 2023 12:02:51 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-06 16:25:04.309732
Title: TPDR: A Novel Two-Step Transformer-based Product and Class Description Match and Retrieval Method
Title（参考訳）: tpdr:新しい2段階変圧器に基づく製品とクラス記述マッチングおよび検索方法
Authors: Washington Cunha, Celso Fran\c{c}a, Leonardo Rocha, Marcos Andr\'e Gon\c{c}alves
Abstract要約: 本稿では,2段階のトランスフォーマーベース製品とクラス記述検索手法を提案する。 TPDRは注意機構とコントラスト学習を利用して、ISとSD間の意味的対応を探索する。 71%の症例において, 正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正
参考スコア（独自算出の注目度）: 5.388982643630806
License: http://creativecommons.org/licenses/by/4.0/
Abstract: There is a niche of companies responsible for intermediating the purchase of large batches of varied products for other companies, for which the main challenge is to perform product description standardization, i.e., matching an item described by a client with a product described in a catalog. The problem is complex since the client's product description may be: (1) potentially noisy; (2) short and uninformative (e.g., missing information about model and size); and (3) cross-language. In this paper, we formalize this problem as a ranking task: given an initial client product specification (query), return the most appropriate standardized descriptions (response). In this paper, we propose TPDR, a two-step Transformer-based Product and Class Description Retrieval method that is able to explore the semantic correspondence between IS and SD, by exploiting attention mechanisms and contrastive learning. First, TPDR employs the transformers as two encoders sharing the embedding vector space: one for encoding the IS and another for the SD, in which corresponding pairs (IS, SD) must be close in the vector space. Closeness is further enforced by a contrastive learning mechanism leveraging a specialized loss function. TPDR also exploits a (second) re-ranking step based on syntactic features that are very important for the exact matching (model, dimension) of certain products that may have been neglected by the transformers. To evaluate our proposal, we consider 11 datasets from a real company, covering different application contexts. Our solution was able to retrieve the correct standardized product before the 5th ranking position in 71% of the cases and its correct category in the first position in 80% of the situations. Moreover, the effectiveness gains over purely syntactic or semantic baselines reach up to 3.7 times, solving cases that none of the approaches in isolation can do by themselves.
Abstract（参考訳）: 他社向けの多種多様な製品の大量購入を仲介するニッチな企業が多く、その主な課題は、顧客によって記述された商品とカタログに記載された商品とをマッチングする製品記述標準化を行うことである。クライアントの製品記述は、(1)潜在的に騒がしい、(2)短くて不規則な(例えば、モデルやサイズに関する情報の欠如)、(3)言語横断、などである。本稿では,この問題をランク付けタスクとして定式化する。初期クライアント製品仕様(クエリ)を与えられた場合,最も適切な標準記述(応答)を返す。本稿では,IS と SD のセマンティック対応を,注意機構とコントラスト学習を利用して探索できる2段階の変換器ベース製品とクラス記述検索手法である TPDR を提案する。まず、TPDRは、埋め込みベクトル空間を共有する2つのエンコーダとして変換器を使用し、1つはISを符号化し、もう1つはSDを符号化し、対応するペア(IS, SD)はベクトル空間に近接しなければならない。さらに、特殊損失関数を利用したコントラスト学習機構により、クローズネスをさらに強化する。 TPDRはまた、変換器によって無視されたかもしれない特定の製品の正確なマッチング(モデル、次元)において非常に重要な構文的特徴に基づく(第2の)再ランクのステップを利用する。提案を評価するために,実企業からの11のデータセットを検討し,異なるアプリケーションコンテキストをカバーする。提案手法では,71%のケースにおいて第5位の前に正しい商品を,80%の状況で第1位で正しいカテゴリを検索することができた。さらに、純粋に構文的あるいは意味的ベースラインよりも有効性が3.7倍に向上し、分離されたアプローチが単独ではできないようなケースが解決される。

関連論文リスト

Question-to-Knowledge: Multi-Agent Generation of Inspectable Facts for Product Mapping [5.875132592813433]
ルールベースとキーワードの類似性は、しばしばブランド、仕様、バンドル構成の微妙な区別を見落とし、商品を誤分類する。本稿では,Large Language Models (LLMs) を利用したSKUマッピングのためのマルチエージェントフレームワークであるQ2Kを提案する。実世界の消費者商品データセットの実験によると、Q2Kは強力なベースラインを超え、難しいシナリオにおいて高い精度と堅牢性を達成する。
論文参考訳（メタデータ） (2025-09-01T07:07:19Z)
NEAR$^2$: A Nested Embedding Approach to Efficient Product Retrieval and Ranking [14.008264174074487]
NEAR$2$と呼ばれる製品検索とランキングに対するNested Embedding Approachを提案する。提案手法は,既存のモデルと比較して,より小さな埋め込み次元よりも優れた性能を実現する。
論文参考訳（メタデータ） (2025-06-24T16:02:02Z)
Revisiting LRP: Positional Attribution as the Missing Ingredient for Transformer Explainability [53.21677928601684]
階層的関連性伝播は、ディープラーニングにおける説明可能性に対する最も有望なアプローチの1つである。そこで我々は,様々な位置符号化手法にまたがる属性の伝播を目的とした,理論的なLRP規則を提案する。本手法は,視力とNLP説明可能性の両面において,最先端の課題を著しく上回っている。
論文参考訳（メタデータ） (2025-06-02T18:07:55Z)
PaTH Attention: Position Encoding via Accumulating Householder Transformations [56.32365080761523]
PaTHは、ハウステリア変換の累積積に基づいて、フレキシブルなデータ依存位置符号化方式である。家庭用行列の積をコンパクトに表現することで,効率的な並列学習アルゴリズムを導出する。
論文参考訳（メタデータ） (2025-05-22T08:36:09Z)
Learning variant product relationship and variation attributes from e-commerce website structures [5.273938705774915]
我々は,電子商取引カタログにおける変種商品のペアを特定するために,変種関係マッチング戦略であるVARMを導入する。我々はRAG誘導生成LDMを用いて変異産物群間の変異と共通属性を抽出する。
論文参考訳（メタデータ） (2024-09-17T18:24:27Z)
CROSS-JEM: Accurate and Efficient Cross-encoders for Short-text Ranking Tasks [12.045202648316678]
トランスフォーマーベースのランキングモデルは、そのようなタスクに対する最先端のアプローチである。 CROSS-JEM(Joint Efficient Modeling)を用いたクロスエンコーダを提案する。 CROSS-JEMは、トランスフォーマーベースのモデルでクエリの複数の項目を共同でスコアすることを可能にする。最先端の精度を実現し、標準のクロスエンコーダよりも4倍低いランクのレイテンシを実現している。
論文参考訳（メタデータ） (2024-09-15T17:05:35Z)
JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文参考訳（メタデータ） (2023-11-07T18:36:16Z)
Multi-Modal Representation Learning with Self-Adaptive Thresholds for Commodity Verification [0.0]
電子商取引のシナリオでは、商品は通常、画像とテキストの両方で記述される。定義上、同一の商品は同一のキー属性を持ち、認知的に消費者と同一である。本稿では,自己適応しきい値に基づくエンドツーエンドの同一商品検証手法を提案する。
論文参考訳（メタデータ） (2022-08-23T16:14:59Z)
Learning to Diversify for Product Question Generation [68.69526529887607]
本稿では,T5の事前学習型トランスフォーマー・デコーダモデルについて述べる。本稿では,トランスフォーマーモデルによって学習された言語を豊かにするための,新たな学習・多様化(LTD)手法を提案する。
論文参考訳（メタデータ） (2022-07-06T09:26:41Z)
Entity-Graph Enhanced Cross-Modal Pretraining for Instance-level Product Retrieval [152.3504607706575]
本研究の目的は, 細粒度製品カテゴリを対象とした, 弱制御型マルチモーダル・インスタンスレベルの製品検索である。まず、Product1Mデータセットをコントリビュートし、2つの実際のインスタンスレベルの検索タスクを定義します。我々は、マルチモーダルデータから重要な概念情報を組み込むことができるより効果的なクロスモーダルモデルを訓練するために活用する。
論文参考訳（メタデータ） (2022-06-17T15:40:45Z)
Label Distributionally Robust Losses for Multi-class Classification: Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文参考訳（メタデータ） (2021-12-30T00:27:30Z)
Product1M: Towards Weakly Supervised Instance-Level Product Retrieval via Cross-modal Pretraining [108.86502855439774]
弱教師付きマルチモーダル・インスタンスレベルの製品検索を目的とした,より現実的な設定について検討する。実世界のインスタンスレベルの検索において,最も大規模なマルチモーダル化粧品データセットであるProduct1Mをコントリビュートする。ケースレベルの予測検索(CAPTURE)のためのクロスモーダル・コントラサシブ・プロダクト・トランスフォーマーという新しいモデルを提案する。
論文参考訳（メタデータ） (2021-07-30T12:11:24Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)
Online Similarity Learning with Feedback for Invoice Line Item Matching [3.0803859277148535]
大企業におけるP2P(Properure to Pay Process)は、企業運営のための製品やサービスの調達を扱う。 P2Pプロセスを編成するエージェントは、請求書内の製品やサービス記述と購入順に一致する問題に遭遇することが多い。本稿では, 各種エージェントのフィードバックデータを用いて, この問題を解決するための2つの方法を提案する。
論文参考訳（メタデータ） (2020-01-02T01:28:56Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。