論文の概要: Score-Based Density Estimation from Pairwise Comparisons
- arxiv url: http://arxiv.org/abs/2510.09146v1
- Date: Fri, 10 Oct 2025 08:49:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.495159
- Title: Score-Based Density Estimation from Pairwise Comparisons
- Title(参考訳): ペアワイズ比較によるスコアベース密度推定
- Authors: Petrus Mikkola, Luigi Acerbi, Arto Klami,
- Abstract要約: 本研究では, 知識の活用と人間のフィードバックからの学習を動機とした, 対比較による密度推定について検討した。
本研究では,未観測目標密度と係留勝者密度を関連付け,スコアマッチングを用いて勝者のスコアを学習する。
信念と勝者密度のスコアベクトルはコリニアであり、位置依存的テンパリング場によってリンクされていることを証明する。
- 参考スコア(独自算出の注目度): 13.996217500923414
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We study density estimation from pairwise comparisons, motivated by expert knowledge elicitation and learning from human feedback. We relate the unobserved target density to a tempered winner density (marginal density of preferred choices), learning the winner's score via score-matching. This allows estimating the target by `de-tempering' the estimated winner density's score. We prove that the score vectors of the belief and the winner density are collinear, linked by a position-dependent tempering field. We give analytical formulas for this field and propose an estimator for it under the Bradley-Terry model. Using a diffusion model trained on tempered samples generated via score-scaled annealed Langevin dynamics, we can learn complex multivariate belief densities of simulated experts, from only hundreds to thousands of pairwise comparisons.
- Abstract(参考訳): 本研究では,専門家による知識の抽出と人間のフィードバックからの学習を動機とした,対比較による密度推定について検討する。
本研究では,未観測目標密度と誘引された勝者密度(選択選択の有意な密度)を関連付け,スコアマッチングにより勝者の得点を学習する。
これにより、推定した勝者密度のスコアを 'de-tempering' によってターゲットを推定できる。
信念と勝者密度のスコアベクトルはコリニアであり、位置依存的テンパリング場によってリンクされていることを証明する。
この分野で解析式を与え,Bradley-Terryモデルに基づく推定器を提案する。
スコアスケールで熱処理したランゲヴィン力学を用いて得られた誘電体サンプルに基づいて訓練された拡散モデルを用いて、シミュレーションされた専門家の複雑な多変量信念密度を、数百対から数千対の比較で学ぶことができる。
関連論文リスト
- Density Ratio Estimation with Conditional Probability Paths [14.251729168309067]
条件変数に基づく時間スコア推定のための新しいフレームワークを提案する。
従来の手法と比較して,本手法は時間スコアの学習を高速化し,密度比の推定精度が向上することを示した。
論文 参考訳(メタデータ) (2025-02-04T13:13:35Z) - Your copula is a classifier in disguise: classification-based copula density estimation [2.5261465733373965]
本稿では,コプラ密度推定を識別タスクとして再解釈する。
我々は、よく知られたコプラクラスと、我々の解釈に自然に生じる分類問題との同値性を導出する。
推定器が最大推定値に類似した理論的保証を達成することを示す。
論文 参考訳(メタデータ) (2024-11-05T11:25:34Z) - $CrowdDiff$: Multi-hypothesis Crowd Density Estimation using Diffusion Models [26.55769846846542]
群集カウントは群集分析の基本的な問題であり、群集密度マップを推定し、群集密度値の和を和らげることが典型的である。
逆拡散過程として群衆密度マップを生成するCrowdDiff$を提示する。
また,拡散モデルの性質から,数量化性能を向上させるため,複数の密度マップを作成することを提案する。
論文 参考訳(メタデータ) (2023-03-22T17:58:01Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Imitation with Neural Density Models [98.34503611309256]
本稿では,Imitation Occupancy Entropy Reinforcement Learning (RL) を報奨として,専門家の占有率の密度推定によるImitation Learning (IL) の新しい枠組みを提案する。
提案手法は,専門家の占有率と模倣者の占有率の逆Kulback-Leibler偏差を確実に低くする非逆モデル自由RLの目的を最大化する。
論文 参考訳(メタデータ) (2020-10-19T19:38:36Z) - Nonparametric Density Estimation from Markov Chains [68.8204255655161]
我々はマルコフ・チェインにインスパイアされた新しい非パラメトリック密度推定器を導入し、よく知られたケルネル密度推定器を一般化する。
我々の推定器は, 通常のものに対していくつかの利点を示し, 全密度アルゴリズムの基盤として容易に利用できる。
論文 参考訳(メタデータ) (2020-09-08T18:33:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。