論文の概要: Sample-Constrained Black Box Optimization for Audio Personalization
- arxiv url: http://arxiv.org/abs/2507.12773v1
- Date: Thu, 17 Jul 2025 04:26:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-18 20:10:24.3395
- Title: Sample-Constrained Black Box Optimization for Audio Personalization
- Title(参考訳): 音声パーソナライズのためのサンプル制約付きブラックボックス最適化
- Authors: Rajalaxmi Rajagopalan, Yu-Lin Wei, Romit Roy Choudhury,
- Abstract要約: ユーザエクスペリエンスを最大化するために音声をパーソナライズする問題について考察する。
我々は,任意の音楽や音声に適用可能なフィルタ$h*$を見つけることを目指しており,ユーザの満足度を最大化する。
- 参考スコア(独自算出の注目度): 7.054093620465401
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We consider the problem of personalizing audio to maximize user experience. Briefly, we aim to find a filter $h^*$, which applied to any music or speech, will maximize the user's satisfaction. This is a black-box optimization problem since the user's satisfaction function is unknown. Substantive work has been done on this topic where the key idea is to play audio samples to the user, each shaped by a different filter $h_i$, and query the user for their satisfaction scores $f(h_i)$. A family of ``surrogate" functions is then designed to fit these scores and the optimization method gradually refines these functions to arrive at the filter $\hat{h}^*$ that maximizes satisfaction. In certain applications, we observe that a second type of querying is possible where users can tell us the individual elements $h^*[j]$ of the optimal filter $h^*$. Consider an analogy from cooking where the goal is to cook a recipe that maximizes user satisfaction. A user can be asked to score various cooked recipes (e.g., tofu fried rice) or to score individual ingredients (say, salt, sugar, rice, chicken, etc.). Given a budget of $B$ queries, where a query can be of either type, our goal is to find the recipe that will maximize this user's satisfaction. Our proposal builds on Sparse Gaussian Process Regression (GPR) and shows how a hybrid approach can outperform any one type of querying. Our results are validated through simulations and real world experiments, where volunteers gave feedback on music/speech audio and were able to achieve high satisfaction levels. We believe this idea of hybrid querying opens new problems in black-box optimization and solutions can benefit other applications beyond audio personalization.
- Abstract(参考訳): ユーザエクスペリエンスを最大化するために音声をパーソナライズする問題について考察する。
簡単に言えば、どんな音楽や音声にも当てはまるフィルタ$h^*$は、ユーザの満足度を最大化する。
これは、ユーザの満足度関数が不明であるため、ブラックボックス最適化の問題である。
このトピックでは、ユーザに対してオーディオサンプルを再生し、それぞれ異なるフィルタ$h_i$で形作り、満足度スコア$f(h_i)$をユーザに問い合わせる、という重要なアイデアがなされている。
関数のファミリはこれらのスコアに適合するように設計され、最適化法はこれらの関数を徐々に洗練させ、満足度を最大化するフィルタ $\hat{h}^*$ に到達する。
特定のアプリケーションにおいて、最適なフィルタである$h^*[j]$に対して、ユーザが個々の要素を$h^*[j]$で教えてくれる2つ目のタイプのクエリが可能であることを観察する。
ユーザーの満足度を最大化するレシピを作るのが目的である料理のアナロジーを考えてみましょう。
調理済みのレシピ(例えば、豆腐飯)や、個々の材料(例えば、塩、砂糖、米、鶏等)を採点する。
どちらのタイプのクエリも可能な、B$クエリの予算を考えると、私たちの目標は、ユーザの満足度を最大化するレシピを見つけることです。
我々の提案はスパースガウスプロセス回帰(GPR)に基づいており、ハイブリッドアプローチがどのようなタイプのクエリよりも優れているかを示している。
本研究の結果は,ボランティアが音楽・音声のフィードバックを受け,高い満足度を達成できるシミュレーションと実世界の実験によって検証された。
ハイブリッドクエリというこのアイデアは,ブラックボックス最適化における新たな課題を開き,オーディオパーソナライゼーション以外の他のアプリケーションにもメリットがあると考えています。
関連論文リスト
- An Adaptive Mixer Allocation Algorithm for the Quantum Alternating Operator Ansatz [2.7704630812545474]
制約付き最適化問題の解法としてアダプティブミキサーアロケーションアルゴリズム(AMA)を提案する。
AMAはリソース消費を大幅に減らし、QAOA+の回路深度は34.08%$29.77%、CNOTゲートの数は15.05%$18.72%である。
論文 参考訳(メタデータ) (2024-12-27T12:43:36Z) - Differential Privacy with Multiple Selections [52.5653572324012]
感性のある機能を持つユーザがサーバから異なるプライベートな方法でレコメンデーションを得るような設定について検討する。
本稿では,サーバが複数のレコメンデーションを送信可能なマルチセレクションアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-07-19T19:34:51Z) - Adaptively Learning to Select-Rank in Online Platforms [34.258659206323664]
本研究は、異種ユーザの候補プールからアイテムを適応的にランク付けすることの課題に対処する。
本研究では,多様なユーザの好みや項目位置の影響を考慮に入れたユーザ応答モデルを構築した。
シミュレーションと実世界の両方のデータセットで実施された実験は、アルゴリズムがベースラインを上回っていることを示している。
論文 参考訳(メタデータ) (2024-06-07T15:33:48Z) - Prompt Optimization with Human Feedback [69.95991134172282]
人間のフィードバックによる迅速な最適化問題(POHF)について検討する。
我々は自動POHF(Automatic POHF)というアルゴリズムを導入する。
その結果、APOHFは、少数の好みフィードバックインスタンスを用いて、効率的に適切なプロンプトを見つけることができることがわかった。
論文 参考訳(メタデータ) (2024-05-27T16:49:29Z) - qPOTS: Efficient batch multiobjective Bayesian optimization via Pareto optimal Thompson sampling [0.0]
多目的最適化を解くためのサンプル効率のアプローチは、プロセス・オラクル・サロゲート(GP)とMOBOOTS$である。
我々はトンプソンサンプリング(TS)に基づくアプローチ(qtextttPOTS$)を提案する。
$qtextttPOTS$は、GP後部の安価な多目的最適化を進化的アプローチで解決する。
論文 参考訳(メタデータ) (2023-10-24T12:35:15Z) - Eliciting User Preferences for Personalized Multi-Objective Decision
Making through Comparative Feedback [76.7007545844273]
目的に対して異なるユーザの好みに対応する多目的意思決定フレームワークを提案する。
我々のモデルは、ベクトル値の報酬関数を持つマルコフ決定プロセスで構成され、各ユーザが未知の選好ベクトルを持つ。
少数の比較クエリを用いて,ユーザに対してほぼ最適なポリシを求めるアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-02-07T23:58:19Z) - Low-Cost Algorithmic Recourse for Users With Uncertain Cost Functions [74.00030431081751]
本稿では,ユーザ固有のコスト関数の概念を定式化し,ユーザのための行動可能なリコースを識別する新しい手法を提案する。
本手法は,強いベースライン法に比べて最大25.89パーセントのユーザを満足させる。
論文 参考訳(メタデータ) (2021-11-01T19:49:35Z) - The Power of Subsampling in Submodular Maximization [51.629656762796564]
このアプローチは,既存の手法よりもはるかに単純であるにもかかわらず,最適/最先端の結果をもたらすことを示す。
我々は,映像要約,位置情報要約,映画推薦タスクにおけるアルゴリズムの有効性を実証的に示す。
論文 参考訳(メタデータ) (2021-04-06T20:25:57Z) - Learning with User-Level Privacy [61.62978104304273]
ユーザレベルの差分プライバシー制約下での学習課題を,アルゴリズムを用いて解析する。
個々のサンプルのプライバシーのみを保証するのではなく、ユーザレベルのdpはユーザの貢献全体を保護します。
プライバシコストが$tau$に比例した$K$適応的に選択されたクエリのシーケンスにプライベートに答えるアルゴリズムを導き出し、私たちが検討する学習タスクを解決するためにそれを適用します。
論文 参考訳(メタデータ) (2021-02-23T18:25:13Z) - Human Strategic Steering Improves Performance of Interactive
Optimization [33.54512897507445]
推奨システムでは、何を推奨するかを選択し、最適化タスクはユーザーが推奨するアイテムを推薦する。
我々は、この基本的な仮定は、受動的フィードバック源ではない人間のユーザーによって広範囲に侵害される可能性があると論じる。
我々は,人間と最適化アルゴリズムが協調して1次元関数の最大値を求める機能最適化タスクを設計した。
論文 参考訳(メタデータ) (2020-05-04T06:56:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。