論文の概要: PreferThinker: Reasoning-based Personalized Image Preference Assessment
- arxiv url: http://arxiv.org/abs/2511.00609v1
- Date: Sat, 01 Nov 2025 16:19:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 16:37:26.861155
- Title: PreferThinker: Reasoning-based Personalized Image Preference Assessment
- Title(参考訳): PreferThinker: 推論に基づくパーソナライズされた画像優先評価
- Authors: Shengqi Xu, Xinpeng Zhou, Yabo Zhang, Ming Liu, Tao Liang, Tianyu Zhang, Yalong Bai, Zuxuan Wu, Wangmeng Zuo,
- Abstract要約: 推論に基づくパーソナライズされた画像嗜好評価フレームワークを提案する。
まず、ユーザーの好みプロファイルを参照画像から予測する。
次に、解釈可能で多次元のスコアと候補画像の評価を提供する。
- 参考スコア(独自算出の注目度): 83.66114370585976
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Personalized image preference assessment aims to evaluate an individual user's image preferences by relying only on a small set of reference images as prior information. Existing methods mainly focus on general preference assessment, training models with large-scale data to tackle well-defined tasks such as text-image alignment. However, these approaches struggle to handle personalized preference because user-specific data are scarce and not easily scalable, and individual tastes are often diverse and complex. To overcome these challenges, we introduce a common preference profile that serves as a bridge across users, allowing large-scale user data to be leveraged for training profile prediction and capturing complex personalized preferences. Building on this idea, we propose a reasoning-based personalized image preference assessment framework that follows a \textit{predict-then-assess} paradigm: it first predicts a user's preference profile from reference images, and then provides interpretable, multi-dimensional scores and assessments of candidate images based on the predicted profile. To support this, we first construct a large-scale Chain-of-Thought (CoT)-style personalized assessment dataset annotated with diverse user preference profiles and high-quality CoT-style reasoning, enabling explicit supervision of structured reasoning. Next, we adopt a two-stage training strategy: a cold-start supervised fine-tuning phase to empower the model with structured reasoning capabilities, followed by reinforcement learning to incentivize the model to explore more reasonable assessment paths and enhance generalization. Furthermore, we propose a similarity-aware prediction reward to encourage better prediction of the user's preference profile, which facilitates more reasonable assessments exploration. Extensive experiments demonstrate the superiority of the proposed method.
- Abstract(参考訳): パーソナライズされた画像嗜好評価は、少数の参照画像のみを先行情報として頼りにすることで、個人の画像嗜好を評価することを目的としている。
既存の手法は主に、テキストイメージアライメントなどの明確に定義されたタスクに対処するために、大規模データを用いたトレーニングモデルである、一般的な嗜好評価に重点を置いている。
しかし、これらのアプローチは、ユーザ固有のデータが乏しく、スケーラビリティが低く、個人の好みが多様で複雑であるため、パーソナライズされた好みを扱うのに苦労する。
これらの課題を克服するために、ユーザ間のブリッジとして機能する共通の嗜好プロファイルを導入し、大規模なユーザデータをプロファイル予測のトレーニングや複雑なパーソナライズされた嗜好のキャプチャに利用できるようにする。
この考え方に基づいて,まずユーザの嗜好プロファイルを基準画像から予測し,その予測されたプロファイルに基づいて,解釈可能な多次元スコアと候補画像の評価を行う。
これをサポートするために,我々はまず,多様なユーザ嗜好プロファイルと高品質なCoTスタイル推論を付加した大規模Chain-of-Thought(CoT)スタイルのパーソナライズアセスメントデータセットを構築し,構造化推論の明示的な監視を可能にする。
次に、構造化推論能力を持つモデルを強化するための冷間開始教師付き微調整フェーズと、より合理的な評価パスを探究し、一般化を促進するための強化学習という2段階のトレーニング戦略を採用する。
さらに,ユーザの嗜好プロファイルをよりよく予測し,より合理的なアセスメント探索を容易にするために,類似性を考慮した予測報酬を提案する。
大規模実験により提案手法の優位性を実証した。
関連論文リスト
- Personalized Recommendations via Active Utility-based Pairwise Sampling [1.704905100460915]
単純かつ直感的なペアワイズ比較から好みを学習するユーティリティベースのフレームワークを提案する。
本研究の中心的な貢献は,嗜好評価のための新規なユーティリティベースアクティブサンプリング戦略である。
論文 参考訳(メタデータ) (2025-08-12T19:09:33Z) - Learning User Preferences for Image Generation Model [15.884017849539754]
本稿では,マルチモーダルな大規模言語モデルに基づいて,パーソナライズされたユーザの好みを学習する手法を提案する。
対照的な選好損失は、利用者の「好き」と「嫌い」を効果的に区別するように設計されている。
学習可能な選好トークンは、既存のユーザ間で共有された関心表現をキャプチャし、モデルがグループ固有の選好を活性化し、類似ユーザ間の一貫性を高める。
論文 参考訳(メタデータ) (2025-08-11T17:39:42Z) - LOTUS: A Leaderboard for Detailed Image Captioning from Quality to Societal Bias and User Preferences [91.13704541413551]
LOTUSは詳細なキャプションを評価するためのリーダーボードである。
キャプションの品質など、様々な側面を包括的に評価する。
多様なユーザの嗜好に基準を合わせることで、嗜好指向の評価を可能にする。
論文 参考訳(メタデータ) (2025-07-25T15:12:42Z) - NextQuill: Causal Preference Modeling for Enhancing LLM Personalization [82.15961484963256]
因果選好モデルに基づく新しいパーソナライズフレームワークであるNextQuillを紹介する。
この洞察に基づいて、NextQuillは2つの補完的なアライメント戦略を導入した。
複数のパーソナライズベンチマークの実験により、NextQuillはパーソナライズ品質を大幅に改善することが示された。
論文 参考訳(メタデータ) (2025-06-03T02:08:55Z) - Is Active Persona Inference Necessary for Aligning Small Models to Personal Preferences? [16.12440288407791]
人気のトレンドは、現在のユーザの会話にプレフィックスを追加して、好みの配布を操ることである。
ほとんどのメソッドは、前の例の選好ペアで個人的な選好を受動的にモデル化する。
モデルが嗜好記述を積極的に推測する利点があるかどうかを問う。
次に、微調整された1-8Bサイズのモデルが、個人の好みを推測し調整する上で、いかに効果的かをテストする。
論文 参考訳(メタデータ) (2025-05-19T15:39:48Z) - Interactive Visualization Recommendation with Hier-SUCB [52.11209329270573]
本稿では,従来のインタラクションからユーザフィードバックを学習する対話型パーソナライズドビジュアライゼーションレコメンデーション(PVisRec)システムを提案する。
よりインタラクティブで正確なレコメンデーションのために、PVisRec設定における文脈的半帯域であるHier-SUCBを提案する。
論文 参考訳(メタデータ) (2025-02-05T17:14:45Z) - Personalized Preference Fine-tuning of Diffusion Models [75.22218338096316]
拡散モデルとパーソナライズされた嗜好を整合させるマルチリワード最適化の目的であるPDを導入する。
PPDでは、拡散モデルがユーザーの個人の好みを数秒で学習する。
提案手法は,Stable Cascadeに対して平均76%の勝利率を達成し,特定のユーザの好みをより正確に反映した画像を生成する。
論文 参考訳(メタデータ) (2025-01-11T22:38:41Z) - Scaling Up Personalized Image Aesthetic Assessment via Task Vector Customization [37.66059382315255]
本稿では,画像の審美性評価や画質評価に手軽に利用できるデータベースを活用する,ユニークなアプローチを提案する。
各データベースの特徴を表すタスクベクトルの最適な組み合わせを決定することにより、個人向けにパーソナライズされたモデルを作成することに成功した。
論文 参考訳(メタデータ) (2024-07-09T18:42:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。