論文の概要: Enhancing Zero-shot Personalized Image Aesthetics Assessment with Profile-aware Multimodal LLM
- arxiv url: http://arxiv.org/abs/2604.17233v1
- Date: Sun, 19 Apr 2026 03:35:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.406886
- Title: Enhancing Zero-shot Personalized Image Aesthetics Assessment with Profile-aware Multimodal LLM
- Title(参考訳): プロファイル対応マルチモーダルLCMによるゼロショットパーソナライズ画像美学評価の強化
- Authors: Chun Wang, Chenfeng Wei, Chenyang Liu, Weihong Deng,
- Abstract要約: 我々はP-MLLMを紹介した。P-MLLMはプロファイルを意識したマルチモーダルLCMで、制御された視覚統合のための選択的融合モジュールで凍結LDMを増強する。
最近のPIAAベンチマークの実験では、P-MLLMは競争力のあるゼロショット性能を達成している。
- 参考スコア(独自算出の注目度): 40.55407144140813
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Personalized image aesthetics assessment (PIAA) aims to predict an individual user's subjective rating of an image, which requires modeling user-specific aesthetic preferences. Existing methods rely on historical user ratings for this modeling and therefore struggle when such data are unavailable. We address this zero-shot setting by using user profiles as contextual signals for personalization and adopting a profile-based personalization paradigm. We introduce P-MLLM, a profile-aware multimodal LLM that augments a frozen LLM with selective fusion modules for controlled visual integration. These modules selectively integrate visual information into the model's evolving hidden states during profile-conditioned reasoning, allowing visual information to be incorporated in a profile-aware manner. Experiments on recent PIAA benchmarks show that P-MLLM achieves competitive zero-shot performance and remains effective even with coarse profile information, highlighting the potential of profile-based personalization for zero-shot PIAA.
- Abstract(参考訳): パーソナライズされた画像美学評価(PIAA)は、個々のユーザのイメージに対する主観的評価を予測することを目的としている。
既存の手法は、このモデリングの歴史的ユーザ評価に依存しており、そのようなデータが利用できない場合に苦労する。
ユーザプロファイルをパーソナライズのためのコンテキスト信号として使用し、プロファイルベースのパーソナライズパラダイムを採用することで、このゼロショット設定に対処する。
我々はP-MLLMを紹介した。P-MLLMはプロファイルを意識したマルチモーダルLCMで、制御された視覚統合のための選択的融合モジュールで凍結LDMを増強する。
これらのモジュールは、プロファイル条件の推論中にモデルの進化した隠れ状態に視覚情報を選択的に統合し、プロファイル対応の方法で視覚情報を組み込むことができる。
最近のPIAAベンチマークでは、P-MLLMは競争力のあるゼロショット性能を実現し、粗いプロファイル情報であっても有効であり、ゼロショットPIAAのプロファイルベースのパーソナライズの可能性を強調している。
関連論文リスト
- Synthetic Interaction Data for Scalable Personalization in Large Language Models [67.31884245564086]
本稿ではPersonaGymという高忠実な合成データ生成フレームワークを紹介する。
パーソナライゼーションを静的なペルソナ-参照ペアとして扱う以前の作業とは異なり、PersonaGymは動的な選好プロセスをモデル化する。
我々は,高忠実度マルチターンパーソナライズされたインタラクショントラジェクトリの大規模かつ高品質で多様な合成データセットであるPersonaAtlasをリリースする。
論文 参考訳(メタデータ) (2026-02-12T20:41:22Z) - Personalized Language Models via Privacy-Preserving Evolutionary Model Merging [53.97323896430374]
言語モデルにおけるパーソナライゼーションは、個々のユーザやユーザグループに対する振る舞いをモデル化することを目的としている。
進化的アルゴリズム(PriME)によるプライバシ保護モデルマージを提案する。
PriMEは、プライバシーリスクを低減しつつ、ユーティリティを直接最適化するために、勾配のない方法を採用している。
LaMPベンチマークの実験によると、Primeは一貫してベースラインを上回り、タスクパフォーマンスを最大45%改善している。
論文 参考訳(メタデータ) (2025-03-23T09:46:07Z) - Measuring What Makes You Unique: Difference-Aware User Modeling for Enhancing LLM Personalization [68.79814761867314]
本稿では,Large Language Models (LLM) のパーソナライゼーションを強化するために,差分認識パーソナライズ学習(DPL)を提案する。
DPLは、戦略的に代表ユーザを比較のために選択し、タスク関連の違いを抽出するための構造化標準を確立する。
実世界のデータセットの実験により、DPLはLLMのパーソナライゼーションを大幅に向上させることが示された。
論文 参考訳(メタデータ) (2025-03-04T09:53:26Z) - User Profile with Large Language Models: Construction, Updating, and Benchmarking [0.3350491650545292]
高品質なオープンソースユーザプロファイルデータセットを2つ提示する。
これらのデータセットは、ユーザープロファイルモデリング技術を評価するための強力な基盤を提供する。
プロファイル構築と更新の両方に対処するために,大規模言語モデルを用いた方法論を示す。
論文 参考訳(メタデータ) (2025-02-15T03:57:52Z) - Personalized Preference Fine-tuning of Diffusion Models [75.22218338096316]
拡散モデルとパーソナライズされた嗜好を整合させるマルチリワード最適化の目的であるPDを導入する。
PPDでは、拡散モデルがユーザーの個人の好みを数秒で学習する。
提案手法は,Stable Cascadeに対して平均76%の勝利率を達成し,特定のユーザの好みをより正確に反映した画像を生成する。
論文 参考訳(メタデータ) (2025-01-11T22:38:41Z) - LLMs + Persona-Plug = Personalized LLMs [41.60364110693824]
パーソナライゼーションは多くの言語タスクやアプリケーションにおいて重要な役割を担っている。
これにより、大きな言語モデル(LLM)を適用して、ユーザの好みに合わせてカスタマイズされたアウトプットを生成する、さまざまなパーソナライズされたアプローチが開発された。
そこで我々は,LLMモデルを提案する。軽量なプラグインユーザ埋め込みモジュールを用いて,過去の状況をすべてモデル化し,個人毎のユーザ固有の埋め込みを構築する。
論文 参考訳(メタデータ) (2024-09-18T11:54:45Z) - U-VAP: User-specified Visual Appearance Personalization via Decoupled Self Augmentation [18.841473623776153]
最先端のパーソナライズモデルでは、被写体全体をオーバーフィットさせる傾向があり、画素空間における視覚的特徴を乱すことはできない。
ユーザ固有の視覚属性を学習するために,ターゲット関連および非ターゲットサンプルを生成するために,新たなデカップリング自己拡張戦略を提案する。
SOTAパーソナライズ手法による様々な視覚特性の実験は、新規な文脈における対象の視覚的外観を模倣する手法の能力を示している。
論文 参考訳(メタデータ) (2024-03-29T15:20:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。