論文の概要: Question-to-Knowledge: Multi-Agent Generation of Inspectable Facts for Product Mapping
- arxiv url: http://arxiv.org/abs/2509.01182v1
- Date: Mon, 01 Sep 2025 07:07:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-04 15:17:03.56965
- Title: Question-to-Knowledge: Multi-Agent Generation of Inspectable Facts for Product Mapping
- Title(参考訳): Question-to-Knowledge: プロダクトマッピングのためのインスペクタブルファクトのマルチエージェント生成
- Authors: Wonduk Seo, Taesub Shin, Hyunjin An, Dokyun Kim, Seunghyun Lee,
- Abstract要約: ルールベースとキーワードの類似性は、しばしばブランド、仕様、バンドル構成の微妙な区別を見落とし、商品を誤分類する。
本稿では,Large Language Models (LLMs) を利用したSKUマッピングのためのマルチエージェントフレームワークであるQ2Kを提案する。
実世界の消費者商品データセットの実験によると、Q2Kは強力なベースラインを超え、難しいシナリオにおいて高い精度と堅牢性を達成する。
- 参考スコア(独自算出の注目度): 5.875132592813433
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Identifying whether two product listings refer to the same Stock Keeping Unit (SKU) is a persistent challenge in ecommerce, especially when explicit identifiers are missing and product names vary widely across platforms. Rule based heuristics and keyword similarity often misclassify products by overlooking subtle distinctions in brand, specification, or bundle configuration. To overcome these limitations, we propose Question to Knowledge (Q2K), a multi agent framework that leverages Large Language Models (LLMs) for reliable SKU mapping. Q2K integrates: (1) a Reasoning Agent that generates targeted disambiguation questions, (2) a Knowledge Agent that resolves them via focused web searches, and (3) a Deduplication Agent that reuses validated reasoning traces to reduce redundancy and ensure consistency. A human in the loop mechanism further refines uncertain cases. Experiments on real world consumer goods datasets show that Q2K surpasses strong baselines, achieving higher accuracy and robustness in difficult scenarios such as bundle identification and brand origin disambiguation. By reusing retrieved reasoning instead of issuing repeated searches, Q2K balances accuracy with efficiency, offering a scalable and interpretable solution for product integration.
- Abstract(参考訳): 2つの製品リストが同じストックキーピングユニット(SKU)を指すかどうかを特定することは、特に明示的な識別子が欠落し、製品名がプラットフォーム間で広く異なる場合、eコマースにおいて永続的な課題である。
ルールベースのヒューリスティックスとキーワードの類似性は、しばしばブランド、仕様、バンドル構成の微妙な区別を見落とし、商品を誤分類する。
これらの制約を克服するため,我々は,Large Language Models (LLM) を信頼度の高いSKUマッピングに用いるマルチエージェントフレームワークであるQ2Kを提案する。
Q2K は,(1) 対象の曖昧な質問を生成する推論エージェント,(2) 焦点を絞った Web 検索を通じて解決する知識エージェント,(3) 検証された推論トレースを再利用して冗長性を低減し一貫性を確保する重複エージェントを統合した。
ループ機構の人間は、不確実なケースをさらに洗練する。
実世界の消費者商品データセットの実験では、Q2Kは強力なベースラインを超え、バンドル識別やブランド起源の曖昧さといった困難なシナリオにおいて、より高い精度と堅牢性を達成することが示されている。
繰り返し検索する代わりに検索された推論を再利用することにより、Q2Kは精度と効率のバランスを保ち、製品統合のためのスケーラブルで解釈可能なソリューションを提供する。
関連論文リスト
- CompassVerifier: A Unified and Robust Verifier for LLMs Evaluation and Outcome Reward [50.97588334916863]
評価と結果報酬のための正確で堅牢な軽量検証モデルであるCompassVerifierを開発した。
数学、知識、多種多様な推論タスクにまたがる多分野の能力を示し、様々な答えの型を処理する能力を示す。
我々は,複数のデータソースから収集したモデル出力からなるVerifierBenchベンチマークを導入し,メタエラーパターンを手動で解析してCompassVerifierを強化する。
論文 参考訳(メタデータ) (2025-08-05T17:55:24Z) - DS-Det: Single-Query Paradigm and Attention Disentangled Learning for Flexible Object Detection [39.56089737473775]
画像中のフレキシブルな数の物体を検出できるより効率的な変換器検出器DS-Detを提案する。
具体的には、デコーダモデリングのための新しい統合シングルクエリパラダイムを再構成し、導入する。
また,注意障害学習による簡易デコーダフレームワークを提案する。
論文 参考訳(メタデータ) (2025-07-26T05:40:04Z) - Generative Retrieval and Alignment Model: A New Paradigm for E-commerce Retrieval [12.318142818707317]
本稿では,GRAM(Generative Retrieval and Alignment Model)という新しいeコマース検索パラダイムを紹介する。
GRAMは、クエリと製品の両方からのテキスト情報を共同でトレーニングして、共有テキストコードを生成する。
GRAMは従来のモデルと最新の生成的検索モデルを大きく上回っている。
論文 参考訳(メタデータ) (2025-04-02T06:40:09Z) - Memory-Aware and Uncertainty-Guided Retrieval for Multi-Hop Question Answering [11.756344944226495]
マルチホップ質問応答には、複数の証拠を検索し、推論するモデルが必要である。
既存の手法は、しばしば2つの重要な制限に悩まされる: 固定的または過剰に頻繁な検索ステップと、以前検索された知識の非効率な使用である。
i) 推論関連要素を識別するためのプロンプトベースのエンティティ抽出,(ii) トークンレベルのエントロピーとアテンション信号に基づく動的検索トリガ,(iii) メモリ認識フィルタリング。
論文 参考訳(メタデータ) (2025-03-29T14:27:02Z) - Order-agnostic Identifier for Large Language Model-based Generative Recommendation [94.37662915542603]
アイテムは、ユーザ履歴をエンコードし、次のアイテムを生成するために、LLM(Large Language Models)の識別子に割り当てられる。
既存のアプローチでは、トークンシーケンス識別子を使用して、アイテムを個別のトークンシーケンスとして表現するか、IDまたはセマンティック埋め込みを使用して単一トークン識別子を使用する。
本稿では,セマンティック・トークンライザを利用するSETRecを提案する。
論文 参考訳(メタデータ) (2025-02-15T15:25:38Z) - Disentangling Memory and Reasoning Ability in Large Language Models [97.26827060106581]
本稿では、複雑な推論プロセスを2つの異なる明確なアクションに分解する新しい推論パラダイムを提案する。
実験の結果, この分解によりモデル性能が向上し, 推論プロセスの解釈可能性も向上することがわかった。
論文 参考訳(メタデータ) (2024-11-20T17:55:38Z) - TPDR: A Novel Two-Step Transformer-based Product and Class Description
Match and Retrieval Method [5.388982643630806]
本稿では,2段階のトランスフォーマーベース製品とクラス記述検索手法を提案する。
TPDRは注意機構とコントラスト学習を利用して、ISとSD間の意味的対応を探索する。
71%の症例において, 正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正正
論文 参考訳(メタデータ) (2023-10-05T12:02:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。