論文の概要: Multi-Agent Video Recommenders: Evolution, Patterns, and Open Challenges
- arxiv url: http://arxiv.org/abs/2604.02211v1
- Date: Thu, 02 Apr 2026 16:04:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-03 14:21:10.908594
- Title: Multi-Agent Video Recommenders: Evolution, Patterns, and Open Challenges
- Title(参考訳): マルチエージェントビデオレコメンダ:進化、パターン、オープンチャレンジ
- Authors: Srivaths Ranganathan, Abhishek Dharmaratnakar, Anushree Sinha, Debanshu Das,
- Abstract要約: ビデオレコメンデータシステムは、AIの最も人気があり、影響力のあるアプリケーションの一つだ。
我々はマルチエージェントビデオレコメンデーションシステム(MAVRS)の進化を辿る。
本稿では,様々なビデオ領域にまたがる協調パターンの分類とコーディネーション機構について述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Video recommender systems are among the most popular and impactful applications of AI, shaping content consumption and influencing culture for billions of users. Traditional single-model recommenders, which optimize static engagement metrics, are increasingly limited in addressing the dynamic requirements of modern platforms. In response, multi-agent architectures are redefining how video recommender systems serve, learn, and adapt to both users and datasets. These agent-based systems coordinate specialized agents responsible for video understanding, reasoning, memory, and feedback, to provide precise, explainable recommendations. In this survey, we trace the evolution of multi-agent video recommendation systems (MAVRS). We combine ideas from multi-agent recommender systems, foundation models, and conversational AI, culminating in the emerging field of large language model (LLM)-powered MAVRS. We present a taxonomy of collaborative patterns and analyze coordination mechanisms across diverse video domains, ranging from short-form clips to educational platforms. We discuss representative frameworks, including early multi-agent reinforcement learning (MARL) systems such as MMRF and recent LLM-driven architectures like MACRec and Agent4Rec, to illustrate these patterns. We also outline open challenges in scalability, multimodal understanding, incentive alignment, and identify research directions such as hybrid reinforcement learning-LLM systems, lifelong personalization and self-improving recommender systems.
- Abstract(参考訳): ビデオレコメンデータシステムは、AIの最も人気があり影響力のあるアプリケーションの一つであり、コンテンツ消費を形作り、何十億ものユーザーにとって文化に影響を与える。
静的エンゲージメントメトリクスを最適化する従来のシングルモデルレコメンデータは、現代のプラットフォームの動的な要件に対処する上で、ますます制限されている。
これに対して、マルチエージェントアーキテクチャは、ビデオレコメンデータシステムがユーザとデータセットの両方に対してどのように機能し、学習し、適応するかを再定義している。
これらのエージェントベースのシステムは、ビデオ理解、推論、記憶、フィードバックに責任を持つ特殊エージェントを調整し、正確で説明可能なレコメンデーションを提供する。
本稿では,マルチエージェントビデオレコメンデーションシステム(MAVRS)の進化を追究する。
我々は,多エージェントレコメンデータシステム,基礎モデル,会話型AIのアイデアを組み合わせて,大規模言語モデル(LLM)を活用したMAVRSの新たな分野を開拓する。
本稿では,ショートフォームクリップから教育プラットフォームまで,さまざまなビデオ領域における協調パターンの分類とコーディネーション機構の解析を行う。
我々は、MMRFのような初期のマルチエージェント強化学習(MARL)システムや、MACRecやAgent4Recといった最近のLLM駆動アーキテクチャなどの代表的フレームワークについて論じ、これらのパターンを説明する。
また、拡張性、マルチモーダル理解、インセンティブアライメント、ハイブリッド強化学習-LLMシステム、生涯のパーソナライゼーション、自己改善レコメンデータシステムといった研究方向性の明確化についても概説する。
関連論文リスト
- Video-LMM Post-Training: A Deep Dive into Video Reasoning with Large Multimodal Models [78.32948112203228]
ビデオ理解はコンピュータビジョンにおける最も困難なフロンティアである。
近年,映像理解タスクにおいて,映像多時間モデルが顕著に出現している。
Surveyは、ビデオ-LMM能力を向上するための統一的なフレームワークを研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-10-06T17:10:44Z) - Mirror Gradient: Towards Robust Multimodal Recommender Systems via
Exploring Flat Local Minima [54.06000767038741]
フラットローカルミニマの新しい視点からマルチモーダルリコメンデータシステムの解析を行う。
我々はミラーグラディエント(MG)と呼ばれる簡潔で効果的な勾配戦略を提案する。
提案したMGは、既存の堅牢なトレーニング手法を補完し、多様な高度なレコメンデーションモデルに容易に拡張できることが判明した。
論文 参考訳(メタデータ) (2024-02-17T12:27:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。