Fugu-MT 論文翻訳(概要): SPICA: Retrieving Scenarios for Pluralistic In-Context Alignment

論文の概要: SPICA: Retrieving Scenarios for Pluralistic In-Context Alignment

arxiv url: http://arxiv.org/abs/2411.10912v2
Date: Thu, 19 Dec 2024 16:20:49 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-20 18:44:15.809509
Title: SPICA: Retrieving Scenarios for Pluralistic In-Context Alignment
Title（参考訳）: SPICA:多元的インコンテキストアライメントのためのシナリオの検索
Authors: Quan Ze Chen, K. J. Kevin Feng, Chan Young Park, Amy X. Zhang,
Abstract要約: 本研究では,文脈内サンプル検索におけるグループレベルの差異を考慮に入れたSPICAを提案する。 SPICAはシナリオバンク、グループインフォームド検索メトリクス、コンテキスト内アライメントプロンプトの3つの設計を導入している。また,SPICAは類似度に基づく検索よりも高い評価を受けており,5点スケールで最大0.16点の改善が見られた。
参考スコア（独自算出の注目度）: 23.56394881275276
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: When different groups' values differ, one approach to model alignment is to steer models at inference time towards each group's preferences. However, techniques like in-context learning only consider similarity when drawing few-shot examples and not cross-group differences in values. We propose SPICA, a framework that accounts for group-level differences during in-context example retrieval. SPICA introduces three designs: scenario banks, group-informed retrieval metrics, and in-context alignment prompts. From an evaluation of SPICA on an alignment task collecting inputs from four demographic groups ($n = 544$), our metrics retrieve in-context examples that more closely match observed preferences, with the best prompt configuration using multiple contrastive responses to demonstrate examples. In an end-to-end evaluation ($n = 120$), we observe that SPICA is higher rated than similarity-based retrieval, with groups seeing up to a +0.16 point improvement on a 5 point scale. Additionally, gains from SPICA were more uniform, with all groups benefiting from alignment rather than only some. Finally, we find that while a group-agnostic approach can align to aggregated values, it is not most suited for divergent groups.
Abstract（参考訳）: 異なるグループの値が異なる場合、モデルアライメントの1つのアプローチは、各グループの好みに対する推論時間でモデルをステアリングすることである。しかし、文脈内学習のような手法は、数ショットの例を描く場合にのみ類似性を考慮し、値の群間差を考慮しない。本研究では,文脈内サンプル検索におけるグループレベルの差異を考慮に入れたSPICAを提案する。 SPICAはシナリオバンク、グループインフォームド検索メトリクス、コンテキスト内アライメントプロンプトの3つの設計を導入している。 4つの階層群(n = 544$)から入力を収集するアライメントタスクにおけるSPICAの評価から,観測された嗜好とより密に一致したコンテキスト内サンプルを抽出し,複数のコントラスト応答を用いた最適なプロンプト構成で実例を示す。エンドツーエンド評価(n = 120$)では、SPICAが類似性に基づく検索よりも高い評価を受けており、5点スケールで最大0.16ポイント改善するグループがある。さらにSPICAの利得はより均一であり、すべてのグループは一部のグループよりもアライメントの恩恵を受けている。最後に、群に依存しないアプローチは集約された値に整合できるが、発散群には最も適していないことが分かる。

関連論文リスト

Stylized Meta-Album: Group-bias injection with style transfer to study robustness against distribution shifts [8.203767260570386]
画像分類メタデータセットであるStylized Meta-Album(SMA)を紹介する。 SMAは、多種多様な4800のグループセットを提供し、様々な主題(対象物、植物、動物、人間の行動、テクスチャ)と複数のスタイルを組み合わせる。 SMAはグループやクラスに対する柔軟な制御を可能にし、さまざまなベンチマークシナリオを反映するデータセットの設定を可能にします。
論文参考訳（メタデータ） (2025-12-10T15:55:32Z)
Order Matters: Rethinking Prompt Construction in In-Context Learning [52.19217980839306]
In-context Learning (ICL)により、大規模言語モデルでは、例の列に条件付けすることで、新しいタスクを実行できる。以前の作業のほとんどは、どの例が選択されたかが、これらの例の順序よりもパフォーマンスにはるかに大きな影響を与えると仮定している。この仮定を再検討し、選択と順序付けの効果を体系的に比較する。
論文参考訳（メタデータ） (2025-11-12T19:57:55Z)
GroupCoOp: Group-robust Fine-tuning via Group Prompt Learning [57.888537648437115]
Group Context Optimization (GroupCoOp) は、単純で効果的な微調整アルゴリズムである。微調整視覚言語モデル(VLM)の群ロバスト性を高める GroupCoOpは、5つのCLIPアーキテクチャにわたる5つのベンチマークで最高の結果を得た。
論文参考訳（メタデータ） (2025-09-28T09:54:30Z)
The Pitfalls of Growing Group Complexity: LLMs and Social Choice-Based Aggregation for Group Recommendations [2.6470894980840525]
Group Recommender Systems (GRS) は、社会的選択に基づくアグリゲーション戦略を使って単一のレコメンデーションを導いた。ゼロショット学習に基づいて,言語モデルがこれらの戦略を正しく実行できる条件について検討する。 100以上のレーティングを考慮すると、パフォーマンスが低下し始めています。今後の研究は、GRS評価の要素としてグループ複雑性を含むべきであると結論付けている。
論文参考訳（メタデータ） (2025-05-08T07:43:01Z)
Correlative and Discriminative Label Grouping for Multi-Label Visual Prompt Tuning [12.052388861361937]
近年の研究では、ラベル間の共起関係が強調され、準最適モデルが導かれる。ラベル間の相関関係と識別関係のバランスをとるためのマルチラベルビジュアルプロンプトチューニングフレームワークを提案する。提案手法は,複数の事前学習モデルにおいて,競争結果とSOTA法より優れる。
論文参考訳（メタデータ） (2025-04-14T08:52:50Z)
Group Preference Alignment: Customized LLM Response Generation from In-Situ Conversations [36.29709573877113]
グループ選好アライメントは、ユーザグループ間での会話選好における文脈固有のバリエーションを特定する。当社のフレームワークは,ユーザの好みに対する出力のアライメントを大幅に改善し,ベースライン手法よりも優れています。
論文参考訳（メタデータ） (2025-03-11T04:32:54Z)
Unleashing the Power of Large Language Models for Group POI Recommendations [39.49785677738477]
Group Point-of-Interest(POI)推奨は、あるグループのユーザの多様な嗜好を満たす次のPOIを予測することを目的としている。グループPOIレコメンデーションの既存の方法は、チェックインデータからの単一のIDベースの機能に依存している。文脈認識グループPOIレコメンデーションのためのLarge Language Model(LLM)のパワーを解放するフレームワークを提案する。
論文参考訳（メタデータ） (2024-11-20T16:02:14Z)
Towards Global Optimal Visual In-Context Learning Prompt Selection [50.174301123013045]
そこで本研究では,グローバルな最適プロンプトを特定するための,コンテキスト内サンプル選択フレームワークを提案する。 Partial2Globalと呼ばれるこの手法では、より包括的な比較を行うために、トランスフォーマーベースのリストワイズローダを採用している。 partial2Globalの有効性は、前景のセグメンテーション、単一物体の検出、画像の着色に関する実験を通じて検証される。
論文参考訳（メタデータ） (2024-05-24T07:07:24Z)
$Se^2$: Sequential Example Selection for In-Context Learning [83.17038582333716]
インコンテキスト学習(ICL)のための大規模言語モデル(LLM)は、実演例によって起動する必要がある。以前の研究は、主に"select then organize"パラダイムに従って、ICLの例の選択を幅広く検討してきた。本稿では,この問題を$Se$quential $Se$lection問題として定式化し,シーケンシャル・アウェア法である$Se2$を導入する。
論文参考訳（メタデータ） (2024-02-21T15:35:04Z)
Learning Label Hierarchy with Supervised Contrastive Learning [8.488965459026678]
教師付きコントラスト学習(SCL)フレームワークは、各クラスを独立したものとして扱うため、すべてのクラスが等しく重要であるとみなす。本稿では,クラス間の類似性を利用して階層情報をSCLに組み込んだラベル認識型SCL手法(LASCL)のファミリーを紹介する。 3つのデータセットに対する実験により、提案したLASCLは、複数ラベルの1つのラベルを区別するテキスト分類にうまく機能することが示された。
論文参考訳（メタデータ） (2024-01-31T23:21:40Z)
A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文参考訳（メタデータ） (2024-01-26T14:21:45Z)
Group Preference Optimization: Few-Shot Alignment of Large Language Models [28.464834028110538]
グループ優先最適化(Group Preference Optimization)は、言語モデルを数ショットで個々のグループを選好する。大規模言語モデルを用いた厳密な評価により, GPOの有効性を実証的に検証した。以上の結果から,GPOはモデルをより正確に整合させるだけでなく,グループ固有の嗜好を少なくし,トレーニングや推論のリソースを少なくする。
論文参考訳（メタデータ） (2023-10-17T18:41:57Z)
Focus on the Common Good: Group Distributional Robustness Follows [47.62596240492509]
本稿では,多様なグループ間で共有される特徴の学習を明示的に促進する,新しい,シンプルなアルゴリズムを提案する。グループDROは、最低の正規化損失を持つグループに焦点を当て、代わりに、他のグループでもより良いパフォーマンスを実現するグループに焦点を当てるが、共有/共通機能を学ぶことにつながる可能性がある。
論文参考訳（メタデータ） (2021-10-06T09:47:41Z)
Contextualizing Meta-Learning via Learning to Decompose [125.76658595408607]
本稿では,メタ学習型サポート・ツー・ターゲット戦略の文脈化を図るために,ネットワーク(LeadNet)を分解する学習を提案する。 LeadNetは、コンテキスト間の比較をポリセムの埋め込みに組み込むことで、右に関連付けられた戦略を自動的に選択することを学ぶ。
論文参考訳（メタデータ） (2021-06-15T13:10:56Z)
You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文参考訳（メタデータ） (2021-06-03T14:59:59Z)
Learning Multi-Attention Context Graph for Group-Based Re-Identification [214.84551361855443]
オーバーラップしていないカメラシステムを介して人々のグループを再識別または取得することを学ぶことは、ビデオ監視において重要なアプリケーションです。本研究では,グループre-idというグループを識別するためのコンテキスト情報の利用を検討する。本研究では,グループベースリドタスクを同時に処理するグラフニューラルネットワークに基づく新しい統合フレームワークを提案する。
論文参考訳（メタデータ） (2021-04-29T09:57:47Z)
Overcoming Data Sparsity in Group Recommendation [52.00998276970403]
グループレコメンデータシステムは、ユーザの個人的な好みだけでなく、嗜好集約戦略も正確に学習できなければならない。本稿では,BGEM(Bipartite Graphding Model)とGCN(Graph Convolutional Networks)を基本構造として,グループとユーザ表現を統一的に学習する。
論文参考訳（メタデータ） (2020-10-02T07:11:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。