論文の概要: IPL: Leveraging Multimodal Large Language Models for Intelligent Product Listing
- arxiv url: http://arxiv.org/abs/2410.16977v1
- Date: Tue, 22 Oct 2024 12:56:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:25:43.057555
- Title: IPL: Leveraging Multimodal Large Language Models for Intelligent Product Listing
- Title(参考訳): IPL: インテリジェントプロダクトリスティングのためのマルチモーダル大言語モデルの活用
- Authors: Kang Chen, Qingheng Zhang, Chengbao Lian, Yixin Ji, Xuwei Liu, Shuguang Han, Guoqiang Wu, Fei Huang, Jufeng Chen,
- Abstract要約: IPLは知的製品リスト作成ツールであり,様々な製品属性を用いて記述を生成するのに適したツールである。
IPLは実運用システムで成功しており、ユーザの72%が生成したコンテンツに基づいて製品リストを公開しています。
これらの製品リストは、AIアシストのないものよりも品質スコアが5.6%高いことが示されている。
- 参考スコア(独自算出の注目度): 26.930588075458008
- License:
- Abstract: Unlike professional Business-to-Consumer (B2C) e-commerce platforms (e.g., Amazon), Consumer-to-Consumer (C2C) platforms (e.g., Facebook marketplace) are mainly targeting individual sellers who usually lack sufficient experience in e-commerce. Individual sellers often struggle to compose proper descriptions for selling products. With the recent advancement of Multimodal Large Language Models (MLLMs), we attempt to integrate such state-of-the-art generative AI technologies into the product listing process. To this end, we develop IPL, an Intelligent Product Listing tool tailored to generate descriptions using various product attributes such as category, brand, color, condition, etc. IPL enables users to compose product descriptions by merely uploading photos of the selling product. More importantly, it can imitate the content style of our C2C platform Xianyu. This is achieved by employing domain-specific instruction tuning on MLLMs and adopting the multi-modal Retrieval-Augmented Generation (RAG) process. A comprehensive empirical evaluation demonstrates that the underlying model of IPL significantly outperforms the base model in domain-specific tasks while producing less hallucination. IPL has been successfully deployed in our production system, where 72% of users have their published product listings based on the generated content, and those product listings are shown to have a quality score 5.6% higher than those without AI assistance.
- Abstract(参考訳): プロフェッショナルのBusiness-to-Consumer(B2C)のeコマースプラットフォーム(Amazonなど)とは異なり、Consumer-to-Consumer(C2C)のプラットフォーム(Facebookマーケットプレースなど)は主に、eコマースの経験が十分でない個人販売者をターゲットにしている。
個々の売り手は、製品を売るための適切な記述を作成するのに苦労することが多い。
近年のMLLM(Multimodal Large Language Models)の進歩により,このような最先端のAI技術を製品リストに組み込もうとしている。
この目的のために我々は,カテゴリ,ブランド,色,条件など,さまざまな製品属性を用いて記述を生成するインテリジェントプロダクトリスティングツールであるIPLを開発した。
IPLでは、販売製品の写真を単にアップロードするだけで、製品記述を作成できる。
さらに重要なのは、私たちのC2CプラットフォームXianyuのコンテンツスタイルを模倣できることです。
これは、MLLMにドメイン固有の命令チューニングを導入し、マルチモーダルなRetrieval-Augmented Generation(RAG)プロセスを採用することで実現される。
包括的経験的評価は、IPLの基盤となるモデルが、幻覚を少なくしながら、ドメイン固有のタスクにおいてベースモデルを大幅に上回っていることを示している。
IPLは実運用システムで成功しており、ユーザの72%が生成したコンテンツに基づいて製品リストを公開しており、それらの製品リストはAIアシストのないものよりも品質スコアが5.6%高いことが示されている。
関連論文リスト
- Auditing the Grid-Based Placement of Private Label Products on E-commerce Search Result Pages [7.351845767369621]
インドで運営されている2大eコマースプラットフォーム、Amazon.inとAmazon.inのeコマース検索結果におけるプライベートラベル(PL)製品プロモーションの規模を定量化する。
どちらのプラットフォームもPL製品を宣伝するために異なる戦略を採用している。
両プラットフォームの製品配置戦略は,文献に提案されている既存のユーザ注意戦略に適合していることがわかった。
論文 参考訳(メタデータ) (2024-07-19T20:01:30Z) - MIND: Multimodal Shopping Intention Distillation from Large Vision-language Models for E-commerce Purchase Understanding [67.26334044239161]
MINDは、マルチモーダル製品メタデータから購入意図を推測し、人間中心のものを優先するフレームワークである。
Amazon Reviewのデータを使用して、1,264,441万の意図を含むマルチモーダルな意図的知識ベースを作成します。
得られた意図は2つの意図的理解タスクにおいて大きな言語モデルを大幅に向上させる。
論文 参考訳(メタデータ) (2024-06-15T17:56:09Z) - A Multimodal In-Context Tuning Approach for E-Commerce Product
Description Generation [47.70824723223262]
マーケティングキーワードを付加した画像から製品記述を生成するための新しい設定を提案する。
本稿では, ModICT という, シンプルで効果的なマルチモーダル・インコンテキスト・チューニング手法を提案する。
実験の結果、ModICTは従来の方法と比較して精度(ルージュ-Lでは最大3.3%)と多様性(D-5では最大9.4%)を著しく改善することが示された。
論文 参考訳(メタデータ) (2024-02-21T07:38:29Z) - Leveraging Large Language Models for Enhanced Product Descriptions in
eCommerce [6.318353155416729]
本稿では,LAMA 2.0 7B言語モデルを用いた製品記述生成の自動化手法を提案する。
私たちはこのモデルを、最大のeコマースプラットフォームの1つであるWalmartの真正な製品記述のデータセットでトレーニングします。
以上の結果から,システムはスケーラブルであるだけでなく,製品記述作成に関わる人的負担を大幅に削減することが明らかとなった。
論文 参考訳(メタデータ) (2023-10-24T00:55:14Z) - MMAPS: End-to-End Multi-Grained Multi-Modal Attribute-Aware Product
Summarization [93.5217515566437]
マルチモーダル製品要約(MPS: Multi-modal Product Summarization)は、商品の特徴を強調して顧客の購入意欲を高めることを目的としている。
既存のMPS手法は有望な結果をもたらすが、それでもエンドツーエンドの製品要約は欠如している。
本稿では,eコマースにおける高品質な製品要約を生成するために,エンド・ツー・エンドのマルチモーダル属性対応製品要約手法(MMAPS)を提案する。
論文 参考訳(メタデータ) (2023-08-22T11:00:09Z) - Automatic Controllable Product Copywriting for E-Commerce [58.97059802658354]
我々は、JD.comのeコマースレコメンデーションプラットフォームに、Eコマースのプレフィックスベースのコントロール可能なコピーライティング生成をデプロイする。
提案するECCCGの有効性を検証する実験を行った。
本稿では,リアルタイムのJD.com電子商取引レコメンデーションプラットフォームに,ECCCGと連携するデプロイアーキテクチャを導入する。
論文 参考訳(メタデータ) (2022-06-21T04:18:52Z) - Scenario-based Multi-product Advertising Copywriting Generation for
E-Commerce [46.29638014067242]
本稿では,Eコマース用自動シナリオベースマルチプロダクト広告複写生成システム(SMPACG)を提案する。
SMPACGは当社のeコマースレコメンデーションシステムに直接機能する目的で開発されており、また商人のリアルタイム書き込み支援ツールとしても利用されている。
論文 参考訳(メタデータ) (2022-05-21T07:45:53Z) - Product1M: Towards Weakly Supervised Instance-Level Product Retrieval
via Cross-modal Pretraining [108.86502855439774]
弱教師付きマルチモーダル・インスタンスレベルの製品検索を目的とした,より現実的な設定について検討する。
実世界のインスタンスレベルの検索において,最も大規模なマルチモーダル化粧品データセットであるProduct1Mをコントリビュートする。
ケースレベルの予測検索(CAPTURE)のためのクロスモーダル・コントラサシブ・プロダクト・トランスフォーマーという新しいモデルを提案する。
論文 参考訳(メタデータ) (2021-07-30T12:11:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。