Fugu-MT 論文翻訳(概要): Active Preference Learning for Ordering Items In- and Out-of-sample

論文の概要: Active Preference Learning for Ordering Items In- and Out-of-sample

arxiv url: http://arxiv.org/abs/2405.03059v2
Date: Sun, 27 Oct 2024 08:36:13 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:32.235053
Title: Active Preference Learning for Ordering Items In- and Out-of-sample
Title（参考訳）: 注文項目のイン・オブ・アウト・サンプルに対するアクティブな選好学習
Authors: Herman Bergström, Emil Carlsson, Devdatt Dubhashi, Fredrik D. Johansson,
Abstract要約: アイテムペアを積極的にサンプリングすることで、正確な順序付けを学ぶのに必要なアノテーションの数を減らすことができる。多くのアルゴリズムはアイテム間の共有構造を無視している。また、比較におけるノイズがアイテムペア間でどのように変化するかは無視することが一般的である。
参考スコア（独自算出の注目度）: 7.0774164818430565
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Learning an ordering of items based on pairwise comparisons is useful when items are difficult to rate consistently on an absolute scale, for example, when annotators have to make subjective assessments. When exhaustive comparison is infeasible, actively sampling item pairs can reduce the number of annotations necessary for learning an accurate ordering. However, many algorithms ignore shared structure between items, limiting their sample efficiency and precluding generalization to new items. It is also common to disregard how noise in comparisons varies between item pairs, despite it being informative of item similarity. In this work, we study active preference learning for ordering items with contextual attributes, both in- and out-of-sample. We give an upper bound on the expected ordering error of a logistic preference model as a function of which items have been compared. Next, we propose an active learning strategy that samples items to minimize this bound by accounting for aleatoric and epistemic uncertainty in comparisons. We evaluate the resulting algorithm, and a variant aimed at reducing model misspecification, in multiple realistic ordering tasks with comparisons made by human annotators. Our results demonstrate superior sample efficiency and generalization compared to non-contextual ranking approaches and active preference learning baselines.
Abstract（参考訳）: 例えば、アノテータが主観的な評価をしなければならない場合など、アイテムが絶対的なスケールで一貫した評価が難しい場合には、ペアワイズ比較に基づいてアイテムの順序付けを学ぶことが有用である。徹底的な比較が不可能な場合、アイテムペアを積極的にサンプリングすることで、正確な順序付けを学ぶのに必要なアノテーションの数を減らすことができる。しかし、多くのアルゴリズムはアイテム間の共有構造を無視し、サンプル効率を制限し、新しい項目への一般化を先取りしている。比較におけるノイズは、アイテムの類似点が情報化されているにもかかわらず、アイテムペア間でどのように変化するかは無視することが一般的である。そこで本研究では,文脈属性を持つ商品を注文する上でのアクティブな嗜好学習について検討する。本稿では,ロジスティック選好モデルの予測順序誤差について,項目の比較を行った関数として上限を与える。次に,この制約を最小化するための積極的学習手法を提案する。提案手法は,人間のアノテータによる比較による複数の現実的順序付けタスクにおいて,結果のアルゴリズムと,モデルの誤特定を減らすことを目的とした変種を評価した。本結果は,非文脈的ランキング手法や能動的選好学習ベースラインと比較して,サンプル効率と一般化が優れていることを示す。

関連論文リスト

Order Matters: Rethinking Prompt Construction in In-Context Learning [52.19217980839306]
In-context Learning (ICL)により、大規模言語モデルでは、例の列に条件付けすることで、新しいタスクを実行できる。以前の作業のほとんどは、どの例が選択されたかが、これらの例の順序よりもパフォーマンスにはるかに大きな影響を与えると仮定している。この仮定を再検討し、選択と順序付けの効果を体系的に比較する。
論文参考訳（メタデータ） (2025-11-12T19:57:55Z)
EZ-Sort: Efficient Pairwise Comparison via Zero-Shot CLIP-Based Pre-Ordering and Human-in-the-Loop Sorting [0.5861893391102716]
ペアワイズ比較は、主観的または難しいアノテーションタスクにおける絶対評価や順序分類よりも好まれることが多い。最近の研究は、ソートアルゴリズムを用いてペアワイズ比較を積極的にサンプリングすることで、アノテーションの負担(O(n log n))を大幅に減らした。さらに,(1)コントラスト言語-画像事前学習(CLIP)モデルを用いて項目を概ね事前注文し,(2)手軽で明白な比較を自動比較に置き換えることで,アノテーションの効率を向上する。
論文参考訳（メタデータ） (2025-08-29T12:06:49Z)
Learning when to rank: Estimation of partial rankings from sparse, noisy comparisons [0.0]
偏位を学習するための原理的ベイズ手法を開発した。我々の枠組みはいかなる統計的ランキング法にも適応できる。従来のランキングよりも、データの微妙な要約が提供される。
論文参考訳（メタデータ） (2025-01-05T11:04:30Z)
SortNet: Learning To Rank By a Neural-Based Sorting Algorithm [5.485151775727742]
本稿では、ニューラルネットワークをコンパレータとしてオブジェクトを順序付けする適応的なランキングアルゴリズムであるSoltNetを提案する。提案アルゴリズムをLETORデータセット上で評価し,他の手法と比較して有望な性能を示す。
論文参考訳（メタデータ） (2023-11-03T12:14:26Z)
Sorting with Predictions [1.7042264000899532]
学習強化アルゴリズムのレンズをソートする根本的な問題について検討する。我々は,$O(sum_i log eta_i)$の正確な比較だけで,新しい,シンプルなアルゴリズムを設計する。比較複雑性は, 検証された誤差測度に対して理論的に最適であることを示す。
論文参考訳（メタデータ） (2023-11-01T18:00:03Z)
Bipartite Ranking Fairness through a Model Agnostic Ordering Adjustment [54.179859639868646]
本稿では,二部類ランキングにおける公平性を実現するためのモデルに依存しない後処理フレームワークxOrderを提案する。 xOrderは、教師なしおよび教師なしの公正度メトリックを含む、さまざまな分類モデルとランキングフェアネスメトリクスと互換性がある。提案アルゴリズムを,4つのベンチマークデータセットと2つの実世界の患者電子健康記録リポジトリ上で評価した。
論文参考訳（メタデータ） (2023-07-27T07:42:44Z)
Crowdsourcing subjective annotations using pairwise comparisons reduces bias and error compared to the majority-vote method [0.0]
本稿では,ランダムな誤差と測定バイアスが,主観的構成物のクラウドソースアノテーションにどのように入るかを理解するための理論的枠組みを提案する。次に、Eloスコアとペア比較ラベリングを組み合わせたパイプラインを提案し、両種類の測定誤差を低減するために、ユビキタスな多数投票法より優れていることを示す。
論文参考訳（メタデータ） (2023-05-31T17:14:12Z)
Learning by Sorting: Self-supervised Learning with Group Ordering Constraints [75.89238437237445]
本稿では,対照学習目標である群順序制約(GroCo)の新たなバリエーションを提案する。正の対と負の対の距離をソートし、正の対が負の対よりも多くの距離を持つかに基づいてそれぞれの損失を計算するという考え方を利用しており、したがって正しく順序付けされていない。各種自己教師付き学習ベンチマークの定式化について検討し、バニラのコントラスト学習と比較して結果が向上するだけでなく、k-NNの性能において、線形探索や性能向上において同等の手法と競合する性能を示すことを示す。
論文参考訳（メタデータ） (2023-01-05T11:17:55Z)
Optimizing Active Learning for Low Annotation Budgets [6.753808772846254]
ディープラーニングでは、アクティブな学習は通常、微調整によって連続した深層モデルを更新する反復的なプロセスとして実装される。移行学習にインスパイアされたアプローチを用いてこの問題に対処する。本稿では,ALプロセスの反復性を利用してより堅牢なサンプルを抽出する新しい取得関数を提案する。
論文参考訳（メタデータ） (2022-01-18T18:53:10Z)
Adaptive Sampling for Heterogeneous Rank Aggregation from Noisy Pairwise Comparisons [85.5955376526419]
ランキングアグリゲーション問題では、各項目を比較する際に、様々な精度レベルが示される。本稿では,ノイズのあるペアワイズ比較によってアイテムのランクを推定する,除去に基づくアクティブサンプリング戦略を提案する。提案アルゴリズムは,商品の真のランキングを高い確率で返却できることを示す。
論文参考訳（メタデータ） (2021-10-08T13:51:55Z)
Towards Model-Agnostic Post-Hoc Adjustment for Balancing Ranking Fairness and Algorithm Utility [54.179859639868646]
Bipartiteランキングは、ラベル付きデータから正の個人よりも上位の個人をランク付けするスコアリング機能を学ぶことを目的としている。学習したスコアリング機能が、異なる保護グループ間で体系的な格差を引き起こすのではないかという懸念が高まっている。本稿では、二部構成のランキングシナリオにおいて、それらのバランスをとるためのモデル後処理フレームワークを提案する。
論文参考訳（メタデータ） (2020-06-15T10:08:39Z)
Ranking a set of objects: a graph based least-square approach [70.7866286425868]
同一労働者の群集によるノイズの多いペアワイズ比較から始まる$N$オブジェクトのランク付けの問題について考察する。品質評価のために,最小二乗内在的最適化基準に依存する非適応的ランキングアルゴリズムのクラスを提案する。
論文参考訳（メタデータ） (2020-02-26T16:19:09Z)
Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。最小クラスタ回復誤差率のアルゴリズムを考案する。適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文参考訳（メタデータ） (2019-10-14T09:18:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。