Fugu-MT 論文翻訳(概要): InteraRec: Screenshot Based Recommendations Using Multimodal Large Language Models

論文の概要: InteraRec: Screenshot Based Recommendations Using Multimodal Large Language Models

arxiv url: http://arxiv.org/abs/2403.00822v2
Date: Sun, 16 Jun 2024 00:40:15 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-19 05:36:50.891167
Title: InteraRec: Screenshot Based Recommendations Using Multimodal Large Language Models
Title（参考訳）: InteraRec: マルチモーダル大言語モデルを用いたスクリーンショットベースのレコメンデーション
Authors: Saketh Reddy Karra, Theja Tulabandhula,
Abstract要約: InteraRecと呼ばれる洗練されたインタラクティブなレコメンデーションフレームワークを紹介します。 InteraRecは、ユーザがWebサイトをナビゲートするときに、Webページの高周波スクリーンショットをキャプチャする。ユーザに対して価値あるパーソナライズされたオファリングを提供する上で、InteraRecの有効性を実証する。
参考スコア（独自算出の注目度）: 0.6926105253992517
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Weblogs, comprised of records detailing user activities on any website, offer valuable insights into user preferences, behavior, and interests. Numerous recommendation algorithms, employing strategies such as collaborative filtering, content-based filtering, and hybrid methods, leverage the data mined through these weblogs to provide personalized recommendations to users. Despite the abundance of information available in these weblogs, identifying and extracting pertinent information and key features from them necessitate extensive engineering endeavors. The intricate nature of the data also poses a challenge for interpretation, especially for non-experts. In this study, we introduce a sophisticated and interactive recommendation framework denoted as InteraRec, which diverges from conventional approaches that exclusively depend on weblogs for recommendation generation. InteraRec framework captures high-frequency screenshots of web pages as users navigate through a website. Leveraging state-of-the-art multimodal large language models (MLLMs), it extracts valuable insights into user preferences from these screenshots by generating a textual summary based on predefined keywords. Subsequently, an LLM-integrated optimization setup utilizes this summary to generate tailored recommendations. Through our experiments, we demonstrate the effectiveness of InteraRec in providing users with valuable and personalized offerings. Furthermore, we explore the integration of session-based recommendation systems into the InteraRec framework, aiming to enhance its overall performance. Finally, we curate a new dataset comprising of screenshots from product web pages on the Amazon website for the validation of the InteraRec framework. Detailed experiments demonstrate the efficacy of the InteraRec framework in delivering valuable and personalized recommendations tailored to individual user preferences.
Abstract（参考訳）: Weblogsは、どのWebサイトでもユーザアクティビティを詳細に記述した記録で構成されており、ユーザの好み、行動、関心に関する貴重な洞察を提供する。協調フィルタリング、コンテンツベースのフィルタリング、ハイブリッドメソッドといった戦略を駆使した多数のレコメンデーションアルゴリズムは、これらのWebログを通じて収集されたデータを活用して、ユーザにパーソナライズされたレコメンデーションを提供する。これらのWebログで利用可能な情報が豊富にあるにもかかわらず、関連する情報や重要な特徴を特定し、抽出するには広範なエンジニアリング努力が必要である。データの複雑な性質は、特に非専門家の解釈にも挑戦している。本研究では,InteraRecと表記される高度でインタラクティブなレコメンデーションフレームワークを紹介し,レコメンデーション生成のためのWebログのみに依存する従来のアプローチから逸脱する。 InteraRecフレームワークは、ユーザがWebサイトをナビゲートするときに、Webページの高周波スクリーンショットをキャプチャする。 MLLM(State-of-the-the-the-art multimodal large language model)を利用して、事前に定義されたキーワードに基づいてテキスト要約を生成することにより、これらのスクリーンショットからユーザの好みに対する貴重な洞察を抽出する。その後、LLM統合最適化設定では、この要約を利用してカスタマイズされたレコメンデーションを生成する。実験を通じて、ユーザに対して価値あるパーソナライズされたオファリングを提供する上で、InteraRecの有効性を実証した。さらに、セッションベースのレコメンデーションシステムをInteraRecフレームワークに統合し、全体的なパフォーマンス向上を目指す。最後に、InteraRecフレームワークの検証のために、Amazon Webサイトにある製品Webページからのスクリーンショットからなる新しいデータセットをキュレートする。詳細な実験は、個人の好みに合わせて価値あるパーソナライズされたレコメンデーションを提供するためのInteraRecフレームワークの有効性を実証している。

関連論文リスト

Tree of Preferences for Diversified Recommendation [54.183647833064136]
データバイアスの観点から、多種多様な推薦について検討する。本研究では,世界知識を活用したゼロショット推論における大規模言語モデル(LLM)の卓越した性能に着想を得て,新しいアプローチを提案する。
論文参考訳（メタデータ） (2025-12-24T04:13:17Z)
RecGPT Technical Report [57.84251629878726]
本稿では,レコメンデーションパイプラインの中心にユーザの意図を配置する次世代フレームワークRecGPTを提案する。 RecGPTは、大きな言語モデルをユーザ関心のマイニング、アイテム検索、説明生成のキーステージに統合する。オンライン実験では、RecGPTが利害関係者間で一貫したパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2025-07-30T17:55:06Z)
Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文参考訳（メタデータ） (2025-05-02T04:01:31Z)
Towards Explainable Temporal User Profiling with LLMs [3.719862246745416]
我々は,大規模言語モデル(LLM)を利用して,ユーザのインタラクション履歴の自然言語要約を生成する。我々のフレームワークは、時間的ユーザの好みをモデル化するだけでなく、解釈可能な方法でレコメンデーションを説明するために使える自然言語プロファイルも生成する。
論文参考訳（メタデータ） (2025-05-01T22:02:46Z)
Search-Based Interaction For Conversation Recommendation via Generative Reward Model Based Simulated User [117.82681846559909]
会話レコメンデーションシステム(CRS)は、マルチターンインタラクションを使用してユーザの好みを捉え、パーソナライズされたレコメンデーションを提供する。本稿では,CRSと自動インタラクションを行うための生成報酬モデルに基づくシミュレーションユーザGRSUを提案する。
論文参考訳（メタデータ） (2025-04-29T06:37:30Z)
HistLLM: A Unified Framework for LLM-Based Multimodal Recommendation with User History Encoding and Compression [33.34435467588446]
HistLLMは、ユーザ履歴を通じてテキストと視覚機能を統合する革新的なフレームワークである。モジュール (UHEM) は、ユーザ履歴のインタラクションを単一のトークン表現に圧縮する。提案手法の有効性と有効性を示す実験を行った。
論文参考訳（メタデータ） (2025-04-14T12:01:11Z)
LLM-based User Profile Management for Recommender System [15.854727020186408]
PUREは、ユーザレビューから重要な情報を体系的に抽出し、要約することによって、進化するユーザプロファイルを構築し、維持する。我々は、レビューを時間とともに追加し、予測を漸進的に更新することで、現実のシナリオを反映した連続的なレコメンデーションタスクを導入する。 Amazonデータセットに対する実験結果から、PUREは既存のLCMベースの手法よりも優れていることが示された。
論文参考訳（メタデータ） (2025-02-20T13:20:19Z)
Interactive Visualization Recommendation with Hier-SUCB [52.11209329270573]
本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文参考訳（メタデータ） (2025-02-05T17:14:45Z)
Preference Discerning with LLM-Enhanced Generative Retrieval [28.309905847867178]
我々は、選好識別という新しいパラダイムを提案する。嗜好判断において、我々は、そのコンテキスト内でのユーザの嗜好に対して、生成的シーケンシャルなレコメンデーションシステムを明示的に条件付けする。ユーザレビューと項目固有データに基づいて,Large Language Models (LLMs) を用いてユーザ嗜好を生成する。
論文参考訳（メタデータ） (2024-12-11T18:26:55Z)
Unveiling User Preferences: A Knowledge Graph and LLM-Driven Approach for Conversational Recommendation [55.5687800992432]
本稿では,Large Language Models (LLMs) とKGs (KGs) を相乗化するプラグイン・アンド・プレイフレームワークを提案する。これにより、LLMはKGエンティティを簡潔な自然言語記述に変換することができ、ドメイン固有の知識を理解できるようになる。
論文参考訳（メタデータ） (2024-11-16T11:47:21Z)
UserSumBench: A Benchmark Framework for Evaluating User Summarization Approaches [25.133460380551327]
大規模言語モデル(LLM)は、大量のユーザアクティビティデータからユーザ要約を生成する際、顕著な能力を示している。これらの要約は、好みや興味などの重要なユーザー情報を取り込み、パーソナライズ・アプリケーションには有用である。しかし, 新たな要約手法の開発は, ゼロ・トラストラベルの欠如, ユーザ・サマリー固有の主観性, 人的評価などによって妨げられている。
論文参考訳（メタデータ） (2024-08-30T01:56:57Z)
Personalized Federated Collaborative Filtering: A Variational AutoEncoder Approach [49.63614966954833]
Federated Collaborative Filtering (FedCF)は、プライバシを保護する新しいレコメンデーションフレームワークの開発に焦点を当てた新興分野である。本稿では,ユーザのパーソナライズされた情報を潜在変数とニューラルモデルに同時に保存することで,新たなパーソナライズされたFedCF手法を提案する。提案フレームワークを効果的に学習するために,ユーザインタラクションベクトル再構成と欠落した値予測を統合することで,特殊変分オートエンコーダ(VAE)タスクとして問題をモデル化する。
論文参考訳（メタデータ） (2024-08-16T05:49:14Z)
Let Me Do It For You: Towards LLM Empowered Recommendation via Tool Learning [57.523454568002144]
大きな言語モデル(LLM)は、常識的な推論と外部ツールの活用の能力を示している。ツール学習を通じてLLMを活用したレコメンデーションのためのフレームワークであるToolRecを紹介する。属性の粒度を探索するプロセスとして推薦プロセスを定式化する。属性指向ツールには,ランクツールと検索ツールの2種類がある。
論文参考訳（メタデータ） (2024-05-24T00:06:54Z)
EmbSum: Leveraging the Summarization Capabilities of Large Language Models for Content-Based Recommendations [38.44534579040017]
ユーザと候補項目のオフライン事前計算を可能にするフレームワークであるEmbSumを紹介する。このモデルがユーザ興味の要約を生成する能力は貴重な副産物であり、パーソナライズされたコンテンツレコメンデーションに有用である。
論文参考訳（メタデータ） (2024-05-19T04:31:54Z)
Knowledge Adaptation from Large Language Model to Recommendation for Practical Industrial Application [54.984348122105516]
大規模テキストコーパスで事前訓練されたLarge Language Models (LLMs) は、推奨システムを強化するための有望な道を示す。オープンワールドの知識と協調的な知識を相乗化するLlm-driven knowlEdge Adaptive RecommeNdation (LEARN) フレームワークを提案する。
論文参考訳（メタデータ） (2024-05-07T04:00:30Z)
Enhancing Sequential Recommender with Large Language Models for Joint Video and Comment Recommendation [77.42486522565295]
我々は、パーソナライズされたビデオとコメントのレコメンデーションを共同で行うLSVCRと呼ばれる新しいレコメンデーション手法を提案する。提案手法は,逐次レコメンデーション(SR)モデルと補足型大言語モデル(LLM)レコメンデーションという2つの重要なコンポーネントから構成される。特に、コメント視聴時間の累積増加率は4.13%に達した。
論文参考訳（メタデータ） (2024-03-20T13:14:29Z)
SPAR: Personalized Content-Based Recommendation via Long Engagement Attention [43.04717491985609]
パーソナライズされたコンテンツのレコメンデーションには、ユーザの長いエンゲージメント履歴を活用することが不可欠だ。本稿では,コンテンツベースのレコメンデーションフレームワークであるSPARを導入する。我々のフレームワークは、既存の最先端(SoTA)メソッドよりも優れています。
論文参考訳（メタデータ） (2024-02-16T10:36:38Z)
Reformulating Sequential Recommendation: Learning Dynamic User Interest with Content-enriched Language Modeling [18.297332953450514]
本稿では、事前学習した言語モデルの意味理解機能を活用してパーソナライズされたレコメンデーションを生成するLANCERを提案する。我々のアプローチは、言語モデルとレコメンデーションシステムの間のギャップを埋め、より人間的なレコメンデーションを生み出します。
論文参考訳（メタデータ） (2023-09-19T08:54:47Z)
MISSRec: Pre-training and Transferring Multi-modal Interest-aware Sequence Representation for Recommendation [61.45986275328629]
逐次レコメンデーションのためのマルチモーダル事前学習・転送学習フレームワークであるMISSRecを提案する。ユーザ側ではトランスフォーマーベースのエンコーダデコーダモデルを設計し、コンテキストエンコーダがシーケンスレベルのマルチモーダルユーザ興味を捉えることを学習する。候補項目側では,ユーザ適応項目表現を生成するために動的融合モジュールを採用する。
論文参考訳（メタデータ） (2023-08-22T04:06:56Z)
iFacetSum: Coreference-based Interactive Faceted Summarization for Multi-Document Exploration [63.272359227081836]
iFacetSumは、インタラクティブな要約と顔検索を統合している。微粒なファセットは、クロスドキュメントのコア参照パイプラインに基づいて自動的に生成される。
論文参考訳（メタデータ） (2021-09-23T20:01:11Z)
Reward Constrained Interactive Recommendation with Natural Language Feedback [158.8095688415973]
制約強化強化学習(RL)フレームワークを提案する。具体的には,ユーザの過去の嗜好に反するレコメンデーションを検出するために,識別器を利用する。提案するフレームワークは汎用的であり,制約付きテキスト生成のタスクにさらに拡張されている。
論文参考訳（メタデータ） (2020-05-04T16:23:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。