Fugu-MT 論文翻訳(概要): Rethinking E-Commerce Search

論文の概要: Rethinking E-Commerce Search

arxiv url: http://arxiv.org/abs/2312.03217v1
Date: Wed, 6 Dec 2023 01:15:40 GMT
ステータス: 翻訳完了
システム内更新日: 2023-12-07 16:14:57.131011
Title: Rethinking E-Commerce Search
Title（参考訳）: 電子商取引検索の再考
Authors: Haixun Wang, Taesik Na
Abstract要約: 電子商取引の検索とレコメンデーションは、通常、製品カタログやカタログのような構造化されたデータを扱う。我々は、非構造化データ(Webページ、顧客レビューなど)を構造化データに変換する代わりに、構造化データをテキストデータに変換するソリューションを構想する。
参考スコア（独自算出の注目度）: 5.343349451149467
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: E-commerce search and recommendation usually operate on structured data such as product catalogs and taxonomies. However, creating better search and recommendation systems often requires a large variety of unstructured data including customer reviews and articles on the web. Traditionally, the solution has always been converting unstructured data into structured data through information extraction, and conducting search over the structured data. However, this is a costly approach that often has low quality. In this paper, we envision a solution that does entirely the opposite. Instead of converting unstructured data (web pages, customer reviews, etc) to structured data, we instead convert structured data (product inventory, catalogs, taxonomies, etc) into textual data, which can be easily integrated into the text corpus that trains LLMs. Then, search and recommendation can be performed through a Q/A mechanism through an LLM instead of using traditional information retrieval methods over structured data.
Abstract（参考訳）: eコマース検索とレコメンデーションは通常、製品カタログや分類法などの構造化データに基づいて行われる。しかし、より良い検索とレコメンデーションシステムを作成するには、web上の顧客レビューや記事を含む、多くの非構造化データが必要である。従来、このソリューションは、非構造化データを情報抽出を通じて構造化データに変換し、構造化データの検索を実行してきた。しかし、これはしばしば品質が低いコストのかかるアプローチです。本稿では,正反対の解を想定する。非構造化データ(webページ、顧客レビューなど)を構造化データに変換する代わりに、構造化データ(製品インベントリ、カタログ、分類学など)をテキストデータに変換することで、llmをトレーニングするテキストコーパスに容易に統合することができます。そして、構造化データ上の従来の情報検索手法の代わりに、LLMを介してQ/A機構を介して検索と推薦を行う。

関連論文リスト

LLM-based Semantic Search for Conversational Queries in E-commerce [1.3645712130536118]
会話クエリからユーザ意図をキャプチャするLLMベースのセマンティック検索フレームワークを提案する。本フレームワークは,実世界のデータセットのベースラインアプローチと比較して,様々な設定において高い精度とリコールを実現する。
論文参考訳（メタデータ） (2026-01-23T06:35:28Z)
SEAL: Structure and Element Aware Learning to Improve Long Structured Document Retrieval [30.699899976704135]
現在の手法では、構造的特徴や要素レベルのセマンティクスを効果的に活用できない。我々は,新しいコントラスト学習フレームワークを提案する。構造認識学習を活用して、セマンティック階層とマスクされた要素アライメントを保存し、きめ細かいセマンティック識別を行う。
論文参考訳（メタデータ） (2025-08-28T13:34:42Z)
Large Language Models are Good Relational Learners [55.40941576497973]
本稿では,グラフニューラルネットワーク(GNN)に基づくエンコーダを用いて,大規模言語モデル(LLM)のための構造化リレーショナルプロンプトを生成する新しいアーキテクチャであるRel-LLMを紹介する。従来のテキストベースのシリアライズ手法とは異なり,本手法はデータベース固有の関係構造を保ちながら,LLMが複雑なエンティティ関係を処理・推論することを可能にする。
論文参考訳（メタデータ） (2025-06-06T04:07:55Z)
Better Think with Tables: Tabular Structures Enhance LLM Comprehension for Data-Analytics Requests [33.471112091886894]
大規模言語モデル(LLM)は、情報検索やデータ操作に関連するデータ分析要求に悩まされることが多い。我々は、データ分析要求のために表構造をLCMに注入するThinking with Tablesを紹介した。テーブルを提供すると平均的なパフォーマンスが40.29パーセント向上し、操作性やトークン効率が向上することを示す。
論文参考訳（メタデータ） (2024-12-22T23:31:03Z)
Enhancing Structured-Data Retrieval with GraphRAG: Soccer Data Case Study [4.742245127121496]
Structured-GraphRAGは自然言語クエリにおける構造化データセット間の情報検索を強化するために設計された汎用フレームワークである。その結果,Structured-GraphRAGはクエリ処理効率を大幅に改善し,応答時間を短縮することがわかった。
論文参考訳（メタデータ） (2024-09-26T06:53:29Z)
UQE: A Query Engine for Unstructured Databases [71.49289088592842]
構造化されていないデータ分析を可能にするために,大規模言語モデルの可能性を検討する。本稿では,非構造化データ収集からの洞察を直接問合せ,抽出するUniversal Query Engine (UQE)を提案する。
論文参考訳（メタデータ） (2024-06-23T06:58:55Z)
STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストと知識ベースを用いた大規模半構造検索ベンチマークSTARKを開発した。本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野について検討した。多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文参考訳（メタデータ） (2024-04-19T22:54:54Z)
Beyond Extraction: Contextualising Tabular Data for Efficient Summarisation by Language Models [0.0]
Retrieval-Augmented Generation アーキテクチャの従来の利用は、様々な文書から情報を取得するのに有効であることが証明されている。本研究では,RAGに基づくシステムにおいて,複雑なテーブルクエリの精度を高めるための革新的なアプローチを提案する。
論文参考訳（メタデータ） (2024-01-04T16:16:14Z)
dIR -- Discrete Information Retrieval: Conversational Search over Unstructured (and Structured) Data with Large Language Models [0.16060477887377675]
本稿では,自由テキストと構造化知識の両方を問う統一インターフェースとして,dIR,disrete Information Retrievalを提案する。我々は、独自の質問/回答データセットを用いて、我々のアプローチを検証し、dIRがフリーテキスト上で全く新しいクエリーのクラスを作成できると結論付けた。
論文参考訳（メタデータ） (2023-12-20T18:41:44Z)
PDFTriage: Question Answering over Long, Structured Documents [60.96667912964659]
構造化文書をプレーンテキストとして表現することは、これらの文書をリッチな構造でユーザ精神モデルと矛盾する。本稿では,構造や内容に基づいて,モデルがコンテキストを検索できるPDFTriageを提案する。ベンチマークデータセットは,80以上の構造化文書に900以上の人間が生成した質問からなる。
論文参考訳（メタデータ） (2023-09-16T04:29:05Z)
SPM: Structured Pretraining and Matching Architectures for Relevance Modeling in Meituan Search [12.244685291395093]
eコマース検索では、クエリとドキュメントの関連性は、ユーザエクスペリエンスを満たす上で必須の要件である。本稿では,リッチな構造化文書に適合する2段階の事前学習およびマッチングアーキテクチャを提案する。このモデルは、すでにオンラインで展開されており、Meituanの検索トラフィックを1年以上にわたって提供している。
論文参考訳（メタデータ） (2023-08-15T11:45:34Z)
Cross Modal Data Discovery over Structured and Unstructured Data Lakes [5.270224494298927]
組織はデータ駆動意思決定のために、ますます大量のデータを集めています。これらのデータは、数千の構造化データセットと非構造化データセットからなる集中型リポジトリにダンプされることが多い。逆に、そのようなデータセットの混合は、ユーザのクエリや分析タスクに関連する要素を発見することを非常に困難にしている。
論文参考訳（メタデータ） (2023-06-01T17:34:42Z)
StructGPT: A General Framework for Large Language Model to Reason over Structured Data [117.13986738340027]
我々は,構造化データに基づく質問応答タスクの解法として,emphIterative Reading-then-Reasoning(IRR)アプローチを開発した。提案手法はChatGPTの性能を大幅に向上させ,全データの教師付きベースラインに対して同等のパフォーマンスを実現する。
論文参考訳（メタデータ） (2023-05-16T17:45:23Z)
Automated Extraction of Fine-Grained Standardized Product Information from Unstructured Multilingual Web Data [66.21317300595483]
機械学習の最近の進歩と最近発表された多言語データセットが組み合わさって、堅牢な製品属性抽出を可能にしていることを示す。私たちのモデルは、オンラインショップや言語、あるいはその両方で、確実に製品属性を予測できます。
論文参考訳（メタデータ） (2023-02-23T16:26:11Z)
A Graph Representation of Semi-structured Data for Web Question Answering [96.46484690047491]
本稿では、半構造化データとそれらの関係の構成要素の体系的分類に基づいて、Webテーブルとリストのグラフ表現を提案する。本手法は,最先端のベースラインに対してF1スコアを3.90ポイント向上させる。
論文参考訳（メタデータ） (2020-10-14T04:01:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。