論文の概要: MagicWand: A Universal Agent for Generation and Evaluation Aligned with User Preference
- arxiv url: http://arxiv.org/abs/2511.18352v1
- Date: Sun, 23 Nov 2025 08:59:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-25 18:34:24.79445
- Title: MagicWand: A Universal Agent for Generation and Evaluation Aligned with User Preference
- Title(参考訳): MagicWand: ユーザ嗜好に合わせた生成と評価のためのユニバーサルエージェント
- Authors: Zitong Xu, Dake Shen, Yaosong Du, Kexiang Hao, Jinghan Huang, Xiande Huang,
- Abstract要約: textbfUniPrefer-100Kは,ユーザが好むスタイルを記述した画像,ビデオ,関連テキストのデータセットである。
次に、ユーザの好みに基づいてプロンプトを強化するユニバーサルな生成および評価エージェントであるtextbfMagicWandを提案する。
UniPreferBenchの実験では、MagicWandが一貫してユーザの好みに適合したコンテンツと評価を生成することを示した。
- 参考スコア(独自算出の注目度): 2.271682519456254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advances in AIGC (Artificial Intelligence Generated Content) models have enabled significant progress in image and video generation. However, users still struggle to obtain content that aligns with their preferences due to the difficulty of crafting detailed prompts and the lack of mechanisms to retain their preferences. To address these challenges, we construct \textbf{UniPrefer-100K}, a large-scale dataset comprising images, videos, and associated text that describes the styles users tend to prefer. Based on UniPrefer-100K, we propose \textbf{MagicWand}, a universal generation and evaluation agent that enhances prompts based on user preferences, leverages advanced generation models for high-quality content, and applies preference-aligned evaluation and refinement. In addition, we introduce \textbf{UniPreferBench}, the first large-scale benchmark with over 120K annotations for assessing user preference alignment across diverse AIGC tasks. Experiments on UniPreferBench demonstrate that MagicWand consistently generates content and evaluations that are well aligned with user preferences across a wide range of scenarios.
- Abstract(参考訳): AIGC(Artificial Intelligence Generated Content)モデルの最近の進歩は、画像およびビデオ生成に大きな進歩をもたらした。
しかし、ユーザーは詳細なプロンプトを作成することの難しさや、好みを維持するメカニズムの欠如により、好みに合わせてコンテンツを得るのに苦慮している。
これらの課題に対処するために、画像、ビデオ、およびユーザが好むスタイルを記述する関連テキストからなる大規模なデータセットである \textbf{UniPrefer-100K} を構築した。
UniPrefer-100Kに基づいて、ユーザ好みに基づいたプロンプトを強化し、高品質なコンテンツのための先進世代モデルを活用し、嗜好に整合した評価・改善を行うユニバーサルな生成・評価エージェントである \textbf{MagicWand} を提案する。
さらに,さまざまなAIGCタスク間のユーザの嗜好の整合性を評価するための120Kアノテーションを備えた,最初の大規模ベンチマークである \textbf{UniPreferBench} を導入する。
UniPreferBenchの実験では、MagicWandは、幅広いシナリオにわたるユーザの好みによく適合したコンテンツと評価を一貫して生成している。
関連論文リスト
- Multi-agents based User Values Mining for Recommendation [52.26100802380767]
効率的なユーザ値抽出のためのゼロショットマルチLLM協調フレームワークを提案する。
本研究は,本質的な意味を保ちながら,項目内容のコンデンスにテキスト要約手法を適用した。
幻覚を緩和するために,評価役と監督役の2つの特殊エージェントの役割を導入する。
論文 参考訳(メタデータ) (2025-05-02T04:01:31Z) - LATex: Leveraging Attribute-based Text Knowledge for Aerial-Ground Person Re-Identification [78.73711446918814]
我々は,属性ベースのテキスト知識を活用するために,アクシデントチューニング戦略を採用した,AG-ReIDのためのLATexという新しいフレームワークを提案する。
我々のフレームワークは属性ベースのテキスト知識をフル活用してAGReIDの性能を向上させることができる。
論文 参考訳(メタデータ) (2025-03-31T04:47:05Z) - From 1,000,000 Users to Every User: Scaling Up Personalized Preference for User-level Alignment [41.96246165999026]
大規模言語モデル(LLM)は、伝統的にワンサイズフィットのアプローチによって整列されてきた。
本稿では,LLMのスケーラブルなパーソナライズのための包括的フレームワークを提案する。
論文 参考訳(メタデータ) (2025-03-19T17:41:46Z) - Panoramic Interests: Stylistic-Content Aware Personalized Headline Generation [37.86741955785968]
本稿では,Sticistic-Content Aware Personalized Headline Generation (SCAPE) フレームワークを提案する。
SCAPEは、大きな言語モデル(LLM)コラボレーションの助けを借りて、見出しからコンテンツとスタイルの両方の特徴を抽出する。
それは、対照的な学習に基づく階層的融合ネットワークを通じて、ユーザの長期的および短期的な関心を適応的に統合する。
論文 参考訳(メタデータ) (2025-01-21T05:30:20Z) - ComPO: Community Preferences for Language Model Personalization [122.54846260663922]
ComPOは、言語モデルにおける好みの最適化をパーソナライズする手法である。
ComPRedはRedditからコミュニティレベルの好みを持った質問応答データセットです。
論文 参考訳(メタデータ) (2024-10-21T14:02:40Z) - EvalCrafter: Benchmarking and Evaluating Large Video Generation Models [70.19437817951673]
これらのモデルはしばしば、マルチアスペクト能力を持つ非常に大きなデータセットで訓練されているので、単純な指標から大きな条件生成モデルを判断することは困難である、と我々は主張する。
我々のアプローチは、テキスト・ツー・ビデオ生成のための700のプロンプトの多種多様な包括的リストを作成することである。
そこで我々は、視覚的品質、コンテンツ品質、動作品質、テキスト・ビデオアライメントの観点から、慎重に設計されたベンチマークに基づいて、最先端のビデオ生成モデルを評価する。
論文 参考訳(メタデータ) (2023-10-17T17:50:46Z) - The Stereotyping Problem in Collaboratively Filtered Recommender Systems [77.56225819389773]
行列分解に基づく協調フィルタリングアルゴリズムは,ある種のステレオタイピングを誘導することを示す。
一般のユーザ層では、テキストセットの好みが反相関性がある場合、これらの項目は、ユーザーには推奨されない。
本稿では,各ユーザの多様な利害関係を捉えるために,代替的なモデリング修正を提案する。
論文 参考訳(メタデータ) (2021-06-23T18:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。