Fugu-MT 論文翻訳(概要): SAGE: Structured Attribute Value Generation for Billion-Scale Product Catalogs

論文の概要: SAGE: Structured Attribute Value Generation for Billion-Scale Product Catalogs

arxiv url: http://arxiv.org/abs/2309.05920v1
Date: Tue, 12 Sep 2023 02:24:16 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-13 14:41:04.342928
Title: SAGE: Structured Attribute Value Generation for Billion-Scale Product Catalogs
Title（参考訳）: SAGE: 数十億ドル規模の製品カタログのための構造化属性価値生成
Authors: Athanasios N. Nikolakopoulos, Swati Kaul, Siva Karthik Gade, Bella Dubrov, Umit Batur, Suleiman Ali Khan
Abstract要約: SAGEは、世界規模のeコマースカタログにまたがる商品の属性値を推測するためのジェネレーティブLLMである。本稿では,属性値予測問題をSeq2Seq要約タスクとして新たに定式化する。 SAGEは、eコマースカタログの実践的な設定で生じる属性値予測タスクのすべての側面に取り組むことができる最初の方法である。
参考スコア（独自算出の注目度）: 1.1184789007828977
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We introduce SAGE; a Generative LLM for inferring attribute values for products across world-wide e-Commerce catalogs. We introduce a novel formulation of the attribute-value prediction problem as a Seq2Seq summarization task, across languages, product types and target attributes. Our novel modeling approach lifts the restriction of predicting attribute values within a pre-specified set of choices, as well as, the requirement that the sought attribute values need to be explicitly mentioned in the text. SAGE can infer attribute values even when such values are mentioned implicitly using periphrastic language, or not-at-all-as is the case for common-sense defaults. Additionally, SAGE is capable of predicting whether an attribute is inapplicable for the product at hand, or non-obtainable from the available information. SAGE is the first method able to tackle all aspects of the attribute-value-prediction task as they arise in practical settings in e-Commerce catalogs. A comprehensive set of experiments demonstrates the effectiveness of the proposed approach, as well as, its superiority against state-of-the-art competing alternatives. Moreover, our experiments highlight SAGE's ability to tackle the task of predicting attribute values in zero-shot setting; thereby, opening up opportunities for significantly reducing the overall number of labeled examples required for training.
Abstract（参考訳）: 我々は,世界規模のeコマースカタログにまたがって商品の属性値を推定するジェネレーティブLLMであるSAGEを紹介する。本稿では,Seq2Seq要約タスクとして,言語,製品タイプ,対象属性にまたがる属性値予測問題を新たに定式化する。提案手法は,属性値の予測の制約を,事前に指定した選択セット内で解除するだけでなく,要求される属性値をテキスト内で明示的に記述する必要があるという制約を緩和するものである。 SAGEは、周辺言語を使って暗黙的にそのような値が言及されている場合でも、属性値を推論することができる。さらに、SAGEは、手元にある製品に属性が適用できないか、または利用可能な情報から利用できないかを予測できる。 SAGEは、eコマースカタログの実践的な設定で生じる属性値予測タスクのすべての側面に取り組むことができる最初の方法である。包括的な実験は、提案手法の有効性と、最先端の競合する代替案に対する優位性を示す。さらに,本実験では,ゼロショット設定における属性値の予測タスクにSAGEが取り組む能力を強調し,学習に必要なラベル付きサンプルの総数を大幅に削減する機会を開放した。

関連論文リスト

Multi-Value-Product Retrieval-Augmented Generation for Industrial Product Attribute Value Identification [12.167857724257239]
MVP-RAG(Multi-Value-Product Retrieval-Augmented Generation)を紹介する。 MVP-RAGはPAVIを検索生成タスクと定義している。まず、同じカテゴリと候補属性値の類似した製品を取得し、次に標準化された属性値を生成する。
論文参考訳（メタデータ） (2025-09-28T13:29:20Z)
LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [63.07563443280147]
本稿では,AG-ReID のための新しいフレームワーク LATex を提案する。属性ベースのテキスト知識を活用するために、プロンプトチューニング戦略を採用する。我々のフレームワークは、AG-ReIDを改善するために属性ベースのテキスト知識を完全に活用できる。
論文参考訳（メタデータ） (2025-03-31T04:47:05Z)
Self-Refinement Strategies for LLM-based Product Attribute Value Extraction [51.45146101802871]
本稿では,製品属性値抽出タスクに2つの自己補充手法を適用した。実験の結果, 2つの自己補充技術は, 処理コストを大幅に増大させながら, 抽出性能を著しく向上させることができないことがわかった。開発データを持つシナリオでは、ファインチューニングが最もパフォーマンスが高いのに対して、ファインチューニングの上昇コストは製品記述の量が増加するにつれてバランスがとれる。
論文参考訳（メタデータ） (2025-01-02T12:55:27Z)
CASA: Class-Agnostic Shared Attributes in Vision-Language Models for Efficient Incremental Object Detection [30.46562066023117]
本稿では,視覚言語基礎モデルの属性をインクリメンタルオブジェクト検出に活用する手法を提案する。本手法は,クラス非依存の共有属性ベース(CASA)を構築し,インクリメンタルクラス間の共通意味情報をキャプチャする。提案手法はパラメータ効率の微調整によりパラメータ記憶に0.7%しか加えず,拡張性と適応性を大幅に向上させる。
論文参考訳（メタデータ） (2024-10-08T08:36:12Z)
EIVEN: Efficient Implicit Attribute Value Extraction using Multimodal LLM [52.016009472409166]
EIVENは暗黙的な属性値抽出のためのデータおよびパラメータ効率の良い生成フレームワークである。本稿では,モデル混同を減らすための新しい学習・比較手法を提案する。実験の結果,EIVENは暗黙的属性値の抽出において既存の手法よりも有意に優れていることがわかった。
論文参考訳（メタデータ） (2024-04-13T03:15:56Z)
Enhancing User Intent Capture in Session-Based Recommendation with Attribute Patterns [77.19390850643944]
周波数属性パターン拡張変換器(FAPAT)を提案する。 FAPATは属性遷移グラフと一致する属性パターンを構築することで、ユーザの意図を特徴づける。 FAPATは、様々な評価指標に対して平均4.5%の最先端手法を一貫して上回っていることを実証する。
論文参考訳（メタデータ） (2023-12-23T03:28:18Z)
JPAVE: A Generation and Classification-based Model for Joint Product Attribute Prediction and Value Extraction [59.94977231327573]
JPAVEと呼ばれる値生成/分類と属性予測を備えたマルチタスク学習モデルを提案する。我々のモデルの2つの変種は、オープンワールドとクローズドワールドのシナリオのために設計されている。公開データセットにおける実験結果は,強いベースラインと比較して,我々のモデルが優れていることを示す。
論文参考訳（メタデータ） (2023-11-07T18:36:16Z)
ExtractGPT: Exploring the Potential of Large Language Models for Product Attribute Value Extraction [52.14681890859275]
電子商取引プラットフォームは、属性と値のペアという形で構造化された製品データを必要とする。 BERTベースの抽出法では,タスク固有の大量のトレーニングデータを必要とする。本稿では,大規模言語モデル (LLM) を,より訓練的かつ堅牢な代替手段として活用することを検討する。
論文参考訳（メタデータ） (2023-10-19T07:39:00Z)
AE-smnsMLC: Multi-Label Classification with Semantic Matching and Negative Label Sampling for Product Attribute Value Extraction [42.79022954630978]
商品属性値抽出は、製品検索やレコメンデーションなどのeコマースにおける多くの現実世界アプリケーションにおいて重要な役割を果たす。以前の方法では、製品テキスト内の値の位置にもっとアノテーションを必要とするシーケンスラベリングタスクとして扱われていた。属性値抽出のためのセマンティックマッチングと負ラベルサンプリングを用いた分類モデルを提案する。
論文参考訳（メタデータ） (2023-10-11T02:22:28Z)
A Unified Generative Approach to Product Attribute-Value Identification [6.752749933406399]
本稿では,製品属性値識別(PAVI)タスクに対する生成的アプローチについて検討する。我々は、予め訓練された生成モデルT5を微調整し、与えられた製品テキストから属性値対のセットをターゲットシーケンスとしてデコードする。提案手法が既存の抽出法や分類法よりも優れていることを示す実験結果を得た。
論文参考訳（メタデータ） (2023-06-09T00:33:30Z)
OA-Mine: Open-World Attribute Mining for E-Commerce Products with Weak Supervision [93.26737878221073]
オープンワールド環境における属性マイニングの問題点を考察し,新しい属性とその値の抽出を行う。本稿では、まず属性値候補を生成し、次にそれらを属性のクラスタにグループ化する、原則化されたフレームワークを提案する。我々のモデルは強いベースラインをはるかに上回り、目に見えない属性や製品タイプに一般化することができる。
論文参考訳（メタデータ） (2022-04-29T04:16:04Z)
Automatic Validation of Textual Attribute Values in E-commerce Catalog by Learning with Limited Labeled Data [61.789797281676606]
そこで我々はMetaBridgeと呼ばれる新しいメタ学習潜伏変数アプローチを提案する。限られたラベル付きデータを持つカテゴリのサブセットから、転送可能な知識を学ぶことができる。ラベルのないデータで、目に見えないカテゴリの不確実性を捉えることができる。
論文参考訳（メタデータ） (2020-06-15T21:31:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。