Fugu-MT 論文翻訳(概要): Legommenders: A Comprehensive Content-Based Recommendation Library with LLM Support

論文の概要: Legommenders: A Comprehensive Content-Based Recommendation Library with LLM Support

arxiv url: http://arxiv.org/abs/2412.15973v1
Date: Fri, 20 Dec 2024 15:18:02 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-23 18:46:09.004731
Title: Legommenders: A Comprehensive Content-Based Recommendation Library with LLM Support
Title（参考訳）: Legommenders: LLMをサポートした総合的なコンテンツベースのレコメンデーションライブラリ
Authors: Qijiong Liu, Lu Fan, Xiao-Ming Wu,
Abstract要約: Legommendersはコンテンツベースのレコメンデーション用に設計されたライブラリである。これにより、コンテンツエンコーダと振る舞いおよびインタラクションモジュールの併用トレーニングが可能になる。
参考スコア（独自算出の注目度）: 9.53742249705781
License: http://creativecommons.org/licenses/by/4.0/
Abstract: We present Legommenders, a unique library designed for content-based recommendation that enables the joint training of content encoders alongside behavior and interaction modules, thereby facilitating the seamless integration of content understanding directly into the recommendation pipeline. Legommenders allows researchers to effortlessly create and analyze over 1,000 distinct models across 15 diverse datasets. Further, it supports the incorporation of contemporary large language models, both as feature encoder and data generator, offering a robust platform for developing state-of-the-art recommendation models and enabling more personalized and effective content delivery.
Abstract（参考訳）: 我々は、コンテンツベースのレコメンデーション用に設計されたユニークなライブラリであるLegommendersを紹介します。これは、コンテンツエンコーダと、振る舞いとインタラクションモジュールの併用トレーニングを可能にし、コンテント理解のシームレスな統合をレコメンデーションパイプラインに直接促進します。 Legommendersは、研究者が15の多様なデータセットにまたがる1000以上の異なるモデルを作成し、分析することを可能にする。さらに、機能エンコーダとデータジェネレータのような現代の大規模言語モデルの組み込みをサポートし、最先端のレコメンデーションモデルを開発するための堅牢なプラットフォームを提供し、よりパーソナライズされ効果的なコンテンツ配信を可能にする。

関連論文リスト

Learning Item Representations Directly from Multimodal Features for Effective Recommendation [51.49251689107541]
マルチモーダルレコメンデータシステムは、主にベイズパーソナライズされたランク付け(BPR)最適化を利用してアイテム表現を学習する。本稿では,マルチモーダルな特徴からアイテム表現を直接学習し,推薦性能を向上する新しいモデル(LIRDRec)を提案する。
論文参考訳（メタデータ） (2025-05-08T05:42:22Z)
Enhancing News Recommendation with Hierarchical LLM Prompting [17.481812986550633]
パーソナライズされたニュースレコメンデーションのための大規模言語モデルのためのPNR-LLMを紹介する。 PNR-LLMはLLMの生成能力を利用してニュースタイトルや要約を充実させる。本稿では,統合されたユーザとニュースの埋め込みを形成する,リッチなセマンティックおよびエンティティレベルのデータを集約するアテンション機構を提案する。
論文参考訳（メタデータ） (2025-04-29T06:02:16Z)
Molar: Multimodal LLMs with Collaborative Filtering Alignment for Enhanced Sequential Recommendation [4.518104756199573]
Molarは、複数のコンテンツモダリティとID情報を統合するシーケンシャルなレコメンデーションフレームワークで、協調的な信号を効果的にキャプチャする。マルチモーダルコンテンツと協調フィルタリングの洞察をシームレスに組み合わせることで、Molarはユーザの関心事とコンテキスト意味論の両方をキャプチャし、より優れた推奨精度をもたらす。
論文参考訳（メタデータ） (2024-12-24T05:23:13Z)
OmniEvalKit: A Modular, Lightweight Toolbox for Evaluating Large Language Model and its Omni-Extensions [58.46747176834132]
我々は,Large Language Models (LLMs) を評価するために設計された,新しいベンチマークツールボックスであるOmniEvalKitを紹介する。単一の側面にフォーカスする既存のベンチマークとは異なり、OmniEvalKitはモジュール化され、軽量で、自動評価システムを提供する。 Static BuilderとDynamic Data Flowで構成されるモジュールアーキテクチャで構成されており、新しいモデルとデータセットのシームレスな統合を促進する。
論文参考訳（メタデータ） (2024-12-09T17:39:43Z)
Tuning Large Multimodal Models for Videos using Reinforcement Learning from AI Feedback [38.708690624594794]
ビデオとテキストのマルチモーダルアライメントは、主にマルチモーダル命令・チューンデータのボリュームと品質が不足しているため、依然として困難である。本稿では,AIフィードバックからの強化学習(Reinforcement Learning from AI Feedback, RLAIF)と呼ばれる,マルチモーダルAIシステムを用いた新たなアライメント戦略を提案する。具体的には、嗜好フィードバックの生成中に、詳細な映像記述を文脈として提供することによって、文脈対応報酬モデルを提案する。
論文参考訳（メタデータ） (2024-02-06T06:27:40Z)
ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models [51.35570730554632]
ESPnet-SPKは、話者埋め込み抽出器を訓練するためのツールキットである。我々は、x-vectorから最近のSKA-TDNNまで、いくつかのモデルを提供している。開発モデルと他のドメインとの橋渡しも目指しています。
論文参考訳（メタデータ） (2024-01-30T18:18:27Z)
Reformulating Vision-Language Foundation Models and Datasets Towards Universal Multimodal Assistants [65.47222691674074]
Muffinフレームワークは、事前訓練された視覚言語モデルを使用して視覚信号のプロバイダとして機能する。 UniMM-Chatデータセットはデータセットの相補性を探求し、高品質で多様なマルチモーダル命令を生成する。
論文参考訳（メタデータ） (2023-10-01T12:35:18Z)
Macaw-LLM: Multi-Modal Language Modeling with Image, Audio, Video, and Text Integration [50.94902442781148]
視覚情報,音声情報,テキスト情報をシームレスに統合する新しい多モード大言語モデル(LLM)を提案する。 Macaw-LLMは、マルチモーダルデータを符号化するモダリティモジュール、事前訓練されたLLMを利用する認知モジュール、多様な表現を調和させるアライメントモジュールの3つの主要コンポーネントから構成される。我々は,69K画像インスタンスと50Kビデオインスタンスを含む,大規模なマルチモーダル・インストラクション・データセットを構築した。
論文参考訳（メタデータ） (2023-06-15T12:45:25Z)
mPLUG-Owl: Modularization Empowers Large Language Models with Multimodality [95.76661165594884]
mPLUG-Owlは、大規模言語モデル(LLM)にマルチモーダル能力を持たせる訓練パラダイムである。トレーニングパラダイムは、LLMの助けを借りて視覚知識を学ぶ、画像とテキストの整列のための2段階の手法を含む。実験の結果,本モデルは既存のマルチモーダルモデルよりも優れていた。
論文参考訳（メタデータ） (2023-04-27T13:27:01Z)
Mining Latent Structures for Multimedia Recommendation [46.70109406399858]
本稿では,マルチモーダル再圧縮のためのLATent sTructureマイニング手法を提案する。各モダリティの項目構造を学び、複数のモダリティを集約して潜在アイテムグラフを得る。学習した潜在グラフに基づいてグラフ畳み込みを行い、アイテム表現に高次項目親和性を明示的に注入する。
論文参考訳（メタデータ） (2021-04-19T03:50:24Z)
Learning the Compositional Visual Coherence for Complementary Recommendations [62.60648815930101]
補完的なレコメンデーションは、ユーザーが獲得したアイテムと補完的で互換性のある製品提案を提供することを目的としている。本研究では,グローバルコンテンツとセマンティックコンテンツの両方に包括的コンポジションコヒーレンスをモデル化する新しいコンテント注意ニューラルネットワーク(CANN)を提案する。
論文参考訳（メタデータ） (2020-06-08T06:57:18Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。