論文の概要: PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery
- arxiv url: http://arxiv.org/abs/2503.00619v1
- Date: Sat, 01 Mar 2025 20:55:28 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-05 19:25:39.054378
- Title: PinLanding: Content-First Keyword Landing Page Generation via Multi-Modal AI for Web-Scale Discovery
- Title(参考訳): PinLanding: Webスケール発見のためのマルチモーダルAIによるコンテンツファーストのキーワードランディングページ生成
- Authors: Faye Zhang, Jasmine Wan, Qianyu Cheng, Jinfeng Rao,
- Abstract要約: 我々はPinLandingを紹介します。PinLandingは、プラットフォームがトピックコレクションを作成する方法を変える、コンテンツファーストアーキテクチャです。
本システムでは,属性抽出のための視覚言語モデル(VLM)とトピック生成のための大規模言語モデル(LLM)と,正確なコンテンツマッチングのためのCLIPベースのデュアルエンコーダアーキテクチャを用いる。
- 参考スコア(独自算出の注目度): 7.842599502996326
- License:
- Abstract: Online platforms like Pinterest hosting vast content collections traditionally rely on manual curation or user-generated search logs to create keyword landing pages (KLPs) -- topic-centered collection pages that serve as entry points for content discovery. While manual curation ensures quality, it doesn't scale to millions of collections, and search log approaches result in limited topic coverage and imprecise content matching. In this paper, we present PinLanding, a novel content-first architecture that transforms the way platforms create topical collections. Instead of deriving topics from user behavior, our system employs a multi-stage pipeline combining vision-language model (VLM) for attribute extraction, large language model (LLM) for topic generation, and a CLIP-based dual-encoder architecture for precise content matching. Our model achieves 99.7% Recall@10 on Fashion200K benchmark, demonstrating strong attribute understanding capabilities. In production deployment for search engine optimization with 4.2 million shopping landing pages, the system achieves a 4X increase in topic coverage and 14.29% improvement in collection attribute precision over the traditional search log-based approach via human evaluation. The architecture can be generalized beyond search traffic to power various user experiences, including content discovery and recommendations, providing a scalable solution to transform unstructured content into curated topical collections across any content domain.
- Abstract(参考訳): Pinterestのようなオンラインプラットフォームは、伝統的に手作業によるキュレーションやユーザ生成した検索ログを使ってキーワードランディングページ(KLP)を作成する。
手作業によるキュレーションによって品質が保証されるが、数百万のコレクションにスケールアップされず、検索ログアプローチによってトピックのカバレッジが制限され、コンテンツマッチングが不正確になる。
本稿では、プラットフォームがトピックコレクションを作成する方法を変える新しいコンテンツファーストアーキテクチャであるPinLandingを紹介する。
ユーザの行動からトピックを抽出する代わりに、属性抽出に視覚言語モデル(VLM)、トピック生成に大規模言語モデル(LLM)、正確なコンテンツマッチングにCLIPベースのデュアルエンコーダアーキテクチャを組み合わせた多段階パイプラインを用いる。
我々のモデルはFashion200Kベンチマークで99.7%のRecall@10を達成する。
本システムは,420万ページのショッピングランディングページを用いた検索エンジン最適化の製品展開において,従来の検索ログに基づくアプローチに比べて,トピックカバレッジが4倍に向上し,コレクション属性の精度が14.29%向上した。
このアーキテクチャは、検索トラフィックを超えて一般化され、コンテンツ発見やレコメンデーションなど、さまざまなユーザエクスペリエンスを駆動し、構造化されていないコンテンツを任意のコンテンツドメインにわたるキュレートされたトピックコレクションに変換するスケーラブルなソリューションを提供する。
関連論文リスト
- Iterative NLP Query Refinement for Enhancing Domain-Specific Information Retrieval: A Case Study in Career Services [0.13980986259786224]
ニッチドメインにおける意味的関連文書の検索は、TF-IDFベースのシステムにとって大きな課題となる。
本稿では,Humber CollegeのキャリアサービスWebページに合わせて,反復的かつ半自動的なクエリリファインメント手法を提案する。
論文 参考訳(メタデータ) (2024-12-22T15:57:35Z) - Knowledge-Aware Query Expansion with Large Language Models for Textual and Relational Retrieval [49.42043077545341]
知識グラフ(KG)から構造化文書関係を付加したLLMを拡張した知識対応クエリ拡張フレームワークを提案する。
文書テキストをリッチなKGノード表現として活用し、KAR(Knowledge-Aware Retrieval)のための文書ベースの関係フィルタリングを利用する。
論文 参考訳(メタデータ) (2024-10-17T17:03:23Z) - Multi-view Content-aware Indexing for Long Document Retrieval [19.74258792456242]
Long Document Question answering (DocQA) は、10kワード以上の長いドキュメントからの質問に答えることを目的としている。
より効果的な長いDocQAのためのMulti-view Content-Aware Indexing (MC-indexing)を提案する。
MCインデクシングによりリコール率は42.8%、30.0%、23.9%、トップk=1.5、3、5、10で16.3%増加した。
論文 参考訳(メタデータ) (2024-04-23T14:55:32Z) - End-to-end Knowledge Retrieval with Multi-modal Queries [50.01264794081951]
ReMuQは、テキストと画像のクエリからコンテンツを統合することで、大規模なコーパスから知識を取得するシステムを必要とする。
本稿では,入力テキストや画像を直接処理し,関連する知識をエンドツーエンドで検索する検索モデルReViz'を提案する。
ゼロショット設定下での2つのデータセットの検索において,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-01T08:04:12Z) - How Does Generative Retrieval Scale to Millions of Passages? [68.98628807288972]
各種コーパス尺度における生成的検索手法の実証的研究を行った。
我々は8.8Mパスのコーパスで数百万のパスに生成検索をスケールし、モデルサイズを最大11Bパラメータまで評価する。
生成的検索は、小さなコーパス上の最先端のデュアルエンコーダと競合するが、数百万のパスへのスケーリングは依然として重要で未解決の課題である。
論文 参考訳(メタデータ) (2023-05-19T17:33:38Z) - DAMO-NLP at SemEval-2023 Task 2: A Unified Retrieval-augmented System
for Multilingual Named Entity Recognition [94.90258603217008]
MultiCoNER RNum2共有タスクは、細粒度でノイズの多いシナリオにおいて、多言語の名前付きエンティティ認識(NER)に取り組むことを目的としている。
MultiCoNER RNum1の以前のトップシステムは、ナレッジベースまたはガゼッタを組み込んでいる。
細粒度多言語NERのための統一検索拡張システム(U-RaNER)を提案する。
論文 参考訳(メタデータ) (2023-05-05T16:59:26Z) - Multi-Content Time-Series Popularity Prediction with Multiple-Model
Transformers in MEC Networks [34.44384973176474]
モバイルエッジキャッシング(MEC)におけるコーディング/アンコードされたコンテンツ配置は、グローバルなモバイルデータトラフィックの大幅な増加に対応するために進化してきた。
既存のデータ駆動の人気予測モデルは、コード化/アンコードされたコンテンツ配置フレームワークには適していない。
一般化能力の高いマルチモデル(ハイブリッド)トランスフォーマーベースエッジキャッシング(MTEC)フレームワークを開発した。
論文 参考訳(メタデータ) (2022-10-12T02:24:49Z) - Semantic Parsing of Interpage Relations [0.0]
本稿では,ページ間関係のセマンティック解析としてタスクを形式化し,ページ間の依存関係抽出のためのエンドツーエンドアプローチを提案する。
また、ページ依存のセグメンテーション、分類、解析に使用されるページ埋め込みを協調的に最適化するマルチタスクトレーニング手法を設計する。
実験の結果,提案手法は,意味解析の点数41ポイント,ページストリームセグメンテーションの点数33ポイント,ナイーブベースライン上のページ分類の点数45ポイントに向上した。
論文 参考訳(メタデータ) (2022-05-26T17:50:43Z) - One-shot Key Information Extraction from Document with Deep Partial
Graph Matching [60.48651298832829]
ドキュメントからキー情報抽出(KIE)は、多くの産業シナリオにおいて効率、生産性、セキュリティを改善する。
KIEタスクのための既存の教師付き学習手法は、多数のラベル付きサンプルを供給し、異なる種類の文書の別々のモデルを学ぶ必要がある。
部分グラフマッチングを用いたワンショットKIEのためのディープエンド・ツー・エンド・トレーニング可能なネットワークを提案する。
論文 参考訳(メタデータ) (2021-09-26T07:45:53Z) - Structural Textile Pattern Recognition and Processing Based on
Hypergraphs [2.4963790083110426]
織物アーカイブの構造に基づく類似の織物パターンを認識するアプローチを紹介します。
まず,ハイパーグラフを用いて織物構造を表現し,これらのグラフから織物パターンを記述するk-neighbourhoodの多重集合を抽出する。
結果の多重集合は、様々な距離測度と様々なクラスタリングアルゴリズムを用いてクラスタ化される。
論文 参考訳(メタデータ) (2021-03-21T00:44:40Z) - AutoSTR: Efficient Backbone Search for Scene Text Recognition [80.7290173000068]
テキストインスタンスの多様性とシーンの複雑さのため、シーンテキスト認識(STR)は非常に難しい。
テキスト認識性能を向上させるために,データ依存のバックボーンを検索するための自動STR(AutoSTR)を提案する。
実験によると、データ依存のバックボーンを検索することで、AutoSTRは標準ベンチマークにおける最先端のアプローチより優れている。
論文 参考訳(メタデータ) (2020-03-14T06:51:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。