論文の概要: Efficient Personalization of Generative Models via Optimal Experimental Design
- arxiv url: http://arxiv.org/abs/2512.19057v1
- Date: Mon, 22 Dec 2025 05:47:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-23 18:54:32.634927
- Title: Efficient Personalization of Generative Models via Optimal Experimental Design
- Title(参考訳): 最適実験設計による生成モデルの効率的なパーソナライズ
- Authors: Guy Schacht, Ziyad Sheebaelhamd, Riccardo De Santi, Mojmír Mutný, Andreas Krause,
- Abstract要約: 提案手法では,選択クエリ選択の問題を,下位の潜在嗜好モデルに関する情報を最大化する問題として定式化する。
この問題には凸最適化の定式化があり、統計的に計算効率の良いアルゴリズムED-PBRLを導入する。
本稿では,テキストから画像への生成モデルをユーザ固有のスタイルにパーソナライズすることで,提案フレームワークを実証的に提示する。
- 参考スコア(独自算出の注目度): 31.83801602641749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Preference learning from human feedback has the ability to align generative models with the needs of end-users. Human feedback is costly and time-consuming to obtain, which creates demand for data-efficient query selection methods. This work presents a novel approach that leverages optimal experimental design to ask humans the most informative preference queries, from which we can elucidate the latent reward function modeling user preferences efficiently. We formulate the problem of preference query selection as the one that maximizes the information about the underlying latent preference model. We show that this problem has a convex optimization formulation, and introduce a statistically and computationally efficient algorithm ED-PBRL that is supported by theoretical guarantees and can efficiently construct structured queries such as images or text. We empirically present the proposed framework by personalizing a text-to-image generative model to user-specific styles, showing that it requires less preference queries compared to random query selection.
- Abstract(参考訳): 人間のフィードバックからの選好学習は、生成モデルとエンドユーザのニーズを一致させる能力を持つ。
人間のフィードバックはコストと時間を要するため、データ効率のよいクエリ選択方法の需要が生まれる。
本研究は, 最適実験設計を利用して, ユーザの嗜好を効率的にモデル化する潜在報酬関数を効率よく解明する手法を提案する。
提案手法では,選択クエリ選択の問題を,下位の潜在嗜好モデルに関する情報を最大化する問題として定式化する。
本稿では, この問題に凸最適化の定式化があることを示し, 理論的保証に支えられ, 画像やテキストなどの構造化クエリを効率的に構築できる統計的, 計算学的に効率的なアルゴリズムED-PBRLを導入する。
本研究では,テキストから画像への生成モデルをユーザ固有のスタイルにパーソナライズすることで,提案するフレームワークを実証的に提示する。
関連論文リスト
- Inference-Time Personalized Alignment with a Few User Preference Queries [24.28598841525897]
生成モデルの応答とユーザの好みを一致させる問題について検討する。
提案するUserAlignは,複数クエリによるユーザの好みを,ペアの応答比較として提案する。
論文 参考訳(メタデータ) (2025-11-04T20:07:03Z) - Personalized Recommendations via Active Utility-based Pairwise Sampling [1.704905100460915]
単純かつ直感的なペアワイズ比較から好みを学習するユーティリティベースのフレームワークを提案する。
本研究の中心的な貢献は,嗜好評価のための新規なユーティリティベースアクティブサンプリング戦略である。
論文 参考訳(メタデータ) (2025-08-12T19:09:33Z) - Comparison-based Active Preference Learning for Multi-dimensional Personalization [7.349038301460469]
大きな言語モデル(LLM)は目覚ましい成功を収めていますが、それらを人間の好みに合わせることは、依然として重要な課題です。
近年,多次元のパーソナライゼーションが研究されている。これはモデルが明示的な嗜好に合った応答を生成できるようにすることを目的としている。
対話的に収集された比較フィードバックから暗黙的なユーザの嗜好を捉えるために,能動多次元選好学習(AMPLe)を提案する。
論文 参考訳(メタデータ) (2024-11-01T11:49:33Z) - An incremental preference elicitation-based approach to learning potentially non-monotonic preferences in multi-criteria sorting [53.36437745983783]
まず最適化モデルを構築し,非単調な選好をモデル化する。
本稿では,情報量測定手法と質問選択戦略を考案し,各イテレーションにおいて最も情報に富む選択肢を特定する。
2つのインクリメンタルな選好に基づくアルゴリズムは、潜在的に単調な選好を学習するために開発された。
論文 参考訳(メタデータ) (2024-09-04T14:36:20Z) - Diffusion Model for Data-Driven Black-Box Optimization [54.25693582870226]
我々は、強力な生成AI技術である拡散モデルに注目し、ブラックボックス最適化の可能性について検討する。
本研究では,1)実数値報酬関数のノイズ測定と,2)対比較に基づく人間の嗜好の2種類のラベルについて検討する。
提案手法は,設計最適化問題を条件付きサンプリング問題に再構成し,拡散モデルのパワーを有効活用する。
論文 参考訳(メタデータ) (2024-03-20T00:41:12Z) - Functional Graphical Models: Structure Enables Offline Data-Driven Optimization [111.28605744661638]
構造がサンプル効率のよいデータ駆動最適化を実現する方法を示す。
また、FGM構造自体を推定するデータ駆動最適化アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-01-08T22:33:14Z) - Top-N Recommendation with Counterfactual User Preference Simulation [26.597102553608348]
ユーザーランキングに基づく好みの学習を目的としたTop-Nレコメンデーションは、長い間、広範囲のアプリケーションにおいて基本的な問題だった。
本稿では,データ不足問題に対処するため,因果推論フレームワーク内での推薦タスクの再構築を提案する。
論文 参考訳(メタデータ) (2021-09-02T14:28:46Z) - Human Preference-Based Learning for High-dimensional Optimization of
Exoskeleton Walking Gaits [55.59198568303196]
この研究は、LineCoSparという、高次元でユーザの好みを学習するヒューマン・イン・ザ・ループの好みベースのフレームワークを提示する。
シミュレーションと人為的試行において,LineCoSparは高次元の選好最適化のためのサンプル効率のよい手法であることを実証的に検証した。
この結果はエキソ骨格の歩行合成に影響を及ぼし,臨床応用と患者のリハビリテーションに有効である。
論文 参考訳(メタデータ) (2020-03-13T22:02:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。