論文の概要: DAK-UCB: Diversity-Aware Prompt Routing for LLMs and Generative Models
- arxiv url: http://arxiv.org/abs/2603.23140v2
- Date: Wed, 25 Mar 2026 08:13:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 14:25:26.082631
- Title: DAK-UCB: Diversity-Aware Prompt Routing for LLMs and Generative Models
- Title(参考訳): DAK-UCB:LLMと生成モデルのための多様性を考慮したプロンプトルーティング
- Authors: Donya Jafari, Farzan Farnia,
- Abstract要約: 本稿では,多様性を考慮した生成モデルのオンライン選択のための文脈的帯域幅アルゴリズムとして,ダイバーシティ・アウェア・カーネル化アッパー信頼境界(DAK-UCB)を導入する。
DAK-UCBは,一連のプロンプトに対して世代間の忠実さを維持しつつ,多様性を考慮したモデル選択を促進する。
- 参考スコア(独自算出の注目度): 18.198091804236782
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The expansion of generative AI and LLM services underscores the growing need for adaptive mechanisms to select an appropriate available model to respond to a user's prompts. Recent works have proposed offline and online learning formulations to identify the optimal generative AI model for an input prompt, based solely on maximizing prompt-based fidelity evaluation scores, e.g., CLIP-Score in text-to-image generation. However, such fidelity-based selection methods overlook the diversity of generated outputs, and hence, they can fail to address potential diversity shortcomings in the generated responses. In this paper, we introduce the Diversity-Aware Kernelized Upper Confidence Bound (DAK-UCB) method as a contextual bandit algorithm for the online selection of generative models with diversity considerations. The proposed DAK-UCB method incorporates both fidelity and diversity-related metrics into the selection process. We design this framework based on prompt-aware diversity score functions that decompose to a two-sample-based expectation over prompt-output pairs in the previous generation rounds. Specifically, we illustrate the application of our framework using joint kernel distance and kernel entropy measures. Our experimental results demonstrate the effectiveness of DAK-UCB in promoting diversity-aware model selection while maintaining fidelity in the generations for a sequence of prompts. The code is available at https://github.com/Donya-Jafari/DAK-UCB.
- Abstract(参考訳): 生成AIとLLMサービスの拡張は、ユーザのプロンプトに応答する適切なモデルを選択するための適応メカニズムの必要性の高まりを浮き彫りにしている。
最近の研究は、テキスト・ツー・イメージ生成におけるプロンプトに基づく忠実度評価スコアの最大化のみに基づいて、入力プロンプトのための最適な生成AIモデルを特定するためのオフラインおよびオンライン学習の定式化を提案している。
しかし、そのような忠実度に基づく選択法は、生成した出力の多様性を見落としているため、生成した応答における潜在的な多様性の欠点に対処できない。
本稿では,多様性を考慮した生成モデルのオンライン選択のための文脈的帯域幅アルゴリズムとして,ダイバーシティ・アウェア・カーネル化アッパー信頼境界法(DAK-UCB)を提案する。
DAK-UCB法は,その選択過程に忠実度と多様性に関連する指標の両方を取り入れた手法である。
本フレームワークは,前世代ラウンドにおけるプロンプト・アウトプットペアに対する2サンプル・ベースの期待値に分解する,プロンプト・アウェアの多様性スコア関数に基づいて設計する。
具体的には,共同カーネル距離とカーネルエントロピー測定を用いたフレームワークの応用について述べる。
実験の結果,DAK-UCBの多様性を考慮したモデル選択の促進効果が,世代間の信頼度を維持しつつ,一連のプロンプトに対して有効であることが示された。
コードはhttps://github.com/Donya-Jafari/DAK-UCBで公開されている。
関連論文リスト
- When Exploration Comes for Free with Mixture-Greedy: Do we need UCB in Diversity-Aware Multi-Armed Bandits? [18.528635656824864]
明示的な UCB 型最適化を伴わない簡単な emphMixture-Greedy 戦略はより高速に収束し,より優れた性能が得られることを示す。
透明な構造条件下では、多様性を意識した目的は内部混合物を好んで暗黙的な探索を引き起こす。
これらの結果は,多様性を意識したモデル選択のためのマルチアーム帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状帯状
論文 参考訳(メタデータ) (2026-03-23T08:59:45Z) - DPWriter: Reinforcement Learning with Diverse Planning Branching for Creative Writing [78.70918589095639]
強化学習(RL)に基づく大規模言語モデル(LLM)の強化は、しばしば出力の多様性を低下させる。
本稿では,半構造化長鎖(CoT)を中心に構成されたRLフレームワークを提案する。
本稿では,多様性の多様性に基づいて,計画段階での分岐を戦略的に導入する横計画分岐手法を提案する。
論文 参考訳(メタデータ) (2026-01-14T16:30:20Z) - UME-R1: Exploring Reasoning-Driven Generative Multimodal Embeddings [70.60608084375691]
我々は、生成的埋め込みの探索の先駆者であり、生成的パラダイム内の埋め込みタスクを統合する。
UME-R1は,2段階のトレーニング戦略からなる汎用なマルチモーダル埋め込みフレームワークである。
ビデオ、画像、ビジュアルドキュメントにまたがる78タスクにわたるMMEB-V2ベンチマークで評価した。
論文 参考訳(メタデータ) (2025-11-01T05:04:23Z) - Jointly Reinforcing Diversity and Quality in Language Model Generations [64.72289248044514]
大規模言語モデル(LM)のポストトレーニングは、しばしば多様性を犠牲にして正確さと役に立つことを優先する。
DARling(Diversity-Aware Reinforcement Learning)は、応答品質とセマンティック多様性を協調的に最適化するフレームワークである。
論文 参考訳(メタデータ) (2025-09-02T17:38:47Z) - SPARKE: Scalable Prompt-Aware Diversity and Novelty Guidance in Diffusion Models via RKE Score [22.364171814102487]
拡散モデルは高忠実度画像合成と即時誘導生成モデルにおいて顕著な成功を収めている。
そこで本稿では,SPARKE(Scalble Prompt-Aware R'eny Kernel Entropy Diversity Guidance)法を提案する。
本研究では,複数のテキスト・画像拡散モデル上でSPARKE法を数値的に検証し,提案手法が有意な計算コストを伴わずに生成したデータの迅速な多様性を向上させることを示す。
論文 参考訳(メタデータ) (2025-06-11T20:53:45Z) - MMaDA: Multimodal Large Diffusion Language Models [61.13527224215318]
マルチモーダル拡散基礎モデルの新たなクラスであるMMaDAを紹介する。
テキスト推論、マルチモーダル理解、テキスト・ツー・イメージ生成など、さまざまな領域で優れたパフォーマンスを実現するように設計されている。
論文 参考訳(メタデータ) (2025-05-21T17:59:05Z) - Evaluating the Diversity and Quality of LLM Generated Content [72.84945252821908]
品質閾値を満たす出力間の効果的な意味的多様性を測定するための枠組みを導入する。
嗜好調整モデルでは語彙的および構文的多様性が低下するが、SFTやベースモデルよりも効果的な意味的多様性が得られる。
これらの発見は、多種多様な高品質な出力を必要とするアプリケーションに重要な意味を持つ。
論文 参考訳(メタデータ) (2025-04-16T23:02:23Z) - PAK-UCB Contextual Bandit: An Online Learning Approach to Prompt-Aware Selection of Generative Models and LLMs [38.167419614117044]
本研究では,与えられた入力プロンプトに対して最適なデータ生成モデルを予測するためのオンライン学習フレームワークを提案する。
提案したPAK-UCBアルゴリズムは、腕に共通するコンテキスト変数を持つコンテキスト帯域(CB)設定に対処する。
実画像と画像と画像の合成モデルを用いた実験により,RFF-UCBは最適な生成モデルを特定するのに成功していることが示された。
論文 参考訳(メタデータ) (2024-10-17T07:33:35Z) - Diversified Batch Selection for Training Acceleration [68.67164304377732]
オンラインバッチ選択として知られる一般的な研究ラインでは、トレーニングプロセス中の情報サブセットの選択について検討している。
バニラ参照モデルフリーメソッドは、独立してデータをサンプリング的にスコア付けし、選択する。
DivBS(Diversified Batch Selection)を提案する。
論文 参考訳(メタデータ) (2024-06-07T12:12:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。