論文の概要: Statistical Models of Top-$k$ Partial Orders
- arxiv url: http://arxiv.org/abs/2406.15893v1
- Date: Sat, 22 Jun 2024 17:04:24 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-25 20:03:15.650534
- Title: Statistical Models of Top-$k$ Partial Orders
- Title(参考訳): 部分順序のトップ$kの統計モデル
- Authors: Amel Awadelkarim, Johan Ugander,
- Abstract要約: 我々は、トップ$k$部分順序とリスト長$k$に対する分布を共同でモデル化するためのアプローチを導入し、分類する。
サンフランシスコの学校選別とサンフランシスコの選別選別選別選別選別選別選別選別選別によるデータを用いて、モデルが観測されたデータをどのように予測するかを評価する。
- 参考スコア(独自算出の注目度): 7.121002367542985
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In many contexts involving ranked preferences, agents submit partial orders over available alternatives. Statistical models often treat these as marginal in the space of total orders, but this approach overlooks information contained in the list length itself. In this work, we introduce and taxonomize approaches for jointly modeling distributions over top-$k$ partial orders and list lengths $k$, considering two classes of approaches: composite models that view a partial order as a truncation of a total order, and augmented ranking models that model the construction of the list as a sequence of choice decisions, including the decision to stop. For composite models, we consider three dependency structures for joint modeling of order and truncation length. For augmented ranking models, we consider different assumptions on how the stop-token choice is modeled. Using data consisting of partial rankings from San Francisco school choice and San Francisco ranked choice elections, we evaluate how well the models predict observed data and generate realistic synthetic datasets. We find that composite models, explicitly modeling length as a categorical variable, produce synthetic datasets with accurate length distributions, and an augmented model with position-dependent item utilities jointly models length and preferences in the training data best, as measured by negative log loss. Methods from this work have significant implications on the simulation and evaluation of real-world social systems that solicit ranked preferences.
- Abstract(参考訳): ランク付けされた選好を含む多くの文脈において、エージェントは利用可能な代替品に対して部分的な注文を提出する。
統計モデルはしばしばこれらを全順序空間の限界として扱うが、このアプローチはリストの長さ自体に含まれる情報を見落としている。
本研究では, 部分順序を全順序の切り離しと見なす複合モデルと, リストの構成を停止決定を含む選択決定の順序としてモデル化する拡張的ランキングモデルという, 2種類のアプローチを考慮し, トップ$k$部分順序とリスト長を併用して分布をモデル化するためのアプローチを導入・分類する。
複合モデルの場合,次数とトラニケート長の合同モデリングのための3つの依存構造を考察する。
拡張ランキングモデルでは、停止選択がどうモデル化されるかについて異なる仮定を考察する。
サンフランシスコの学校選考とサンフランシスコの選考選考から得られる部分的なランキングのデータを用いて、モデルが観測データをどのように予測し、現実的な合成データセットを生成するかを評価する。
その結果,分類変数として長さを明示的にモデル化し,正確な長さ分布を持つ合成データセットを生成する複合モデルと,負のログロスによって測定されたトレーニングデータにおける長さと嗜好を協調的にモデル化した位置依存アイテムユーティリティを持つ拡張モデルが得られた。
この研究から得られた手法は、ランク付けされた嗜好を求める実世界の社会システムのシミュレーションと評価に重要な意味を持つ。
関連論文リスト
- Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Learning Rich Rankings [7.940293148084844]
文脈的反復選択(CRS)モデルを構築し、自然の多モード性とリッチネスをランキング空間にもたらす。
構造に依存したテールリスクと予測されるリスクバウンダリによるモデルの下での最大推定の理論的保証を提供する。
また,MNL選択モデルとPlackett-Luce(PL)ランキングモデルに対する最大極大推定器の予測リスクに,最初の厳密な境界を設けた。
論文 参考訳(メタデータ) (2023-12-22T21:40:57Z) - A Federated Data Fusion-Based Prognostic Model for Applications with Multi-Stream Incomplete Signals [1.2277343096128712]
本稿では、複数のユーザが共同で障害時間予測モデルを構築することができるフェデレーション予測モデルを提案する。
数値解析により,提案モデルの性能は古典的非フェデレーション予測モデルと同一であることが示唆された。
論文 参考訳(メタデータ) (2023-11-13T17:08:34Z) - Dataless Knowledge Fusion by Merging Weights of Language Models [51.8162883997512]
微調整された事前学習言語モデルは、下流のNLPモデルを構築するための主要なパラダイムとなっている。
これは、より優れた単一モデルを生み出すために、個々のモデル間で知識を融合させる障壁を生み出します。
パラメータ空間のモデルをマージするデータレス知識融合法を提案する。
論文 参考訳(メタデータ) (2022-12-19T20:46:43Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - A Unified Statistical Learning Model for Rankings and Scores with
Application to Grant Panel Review [1.240096657086732]
ランク付けとスコアは、審査員がオブジェクトのコレクションにおける好みや品質の知覚を表現するために使用する2つの一般的なデータタイプである。
各タイプのデータを個別に研究するためのモデルが多数存在するが、両タイプのデータを同時に取得する統一統計モデルは存在しない。
このギャップを埋めるために,Mallows-Binomialモデルを提案し,BinomialスコアモデルとMallowsの$phi$ランキングモデルを組み合わせた。
論文 参考訳(メタデータ) (2022-01-07T16:56:52Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Split Modeling for High-Dimensional Logistic Regression [0.2676349883103404]
短時間コンパイルしたアンサンブルロジスティック分類モデルに対して,新しい手法を提案する。
本手法は,予測精度に優れたバイアスオフの活用法を学習する。
提案手法を実装したオープンソースソフトウェアライブラリを議論する。
論文 参考訳(メタデータ) (2021-02-17T05:57:26Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Statistical Inference of Minimally Complex Models [0.0]
最小複素モデル (Minimally Complex Models, MCM) は任意の順序の相互作用を持つスピンモデルである。
これらのモデルに限定されたベイズモデル選択は計算可能であることが示される。
モデル複雑性に対して適合性をトレードオフするそれらの証拠は、パラメータフィッティングなしで容易に計算できる。
論文 参考訳(メタデータ) (2020-08-02T16:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。