論文の概要: Measuring IIA Violations in Similarity Choices with Bayesian Models
- arxiv url: http://arxiv.org/abs/2508.14615v1
- Date: Wed, 20 Aug 2025 11:02:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-21 16:52:41.43214
- Title: Measuring IIA Violations in Similarity Choices with Bayesian Models
- Title(参考訳): ベイズモデルと類似性選択におけるIIA違反の測定
- Authors: Hugo Sales Corrêa, Suryanarayana Sankagiri, Daniel Ratton Figueiredo, Matthias Grossglauser,
- Abstract要約: 類似性選択データは、例えば情報検索や埋め込み学習設定の文脈で、人間がターゲットと類似性に基づいて選択を行うときに発生する。
IIA違反は多くの個別選択設定で検出されているが、類似性選択設定には注意が払われている。
本稿では,古典的適合性テストと,後方予測チェックの枠組みに基づくベイズ的テストの2つの統計的手法を提案する。
- 参考スコア(独自算出の注目度): 4.592329937682345
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Similarity choice data occur when humans make choices among alternatives based on their similarity to a target, e.g., in the context of information retrieval and in embedding learning settings. Classical metric-based models of similarity choice assume independence of irrelevant alternatives (IIA), a property that allows for a simpler formulation. While IIA violations have been detected in many discrete choice settings, the similarity choice setting has received scant attention. This is because the target-dependent nature of the choice complicates IIA testing. We propose two statistical methods to test for IIA: a classical goodness-of-fit test and a Bayesian counterpart based on the framework of Posterior Predictive Checks (PPC). This Bayesian approach, our main technical contribution, quantifies the degree of IIA violation beyond its mere significance. We curate two datasets: one with choice sets designed to elicit IIA violations, and another with randomly generated choice sets from the same item universe. Our tests confirmed significant IIA violations on both datasets, and notably, we find a comparable degree of violation between them. Further, we devise a new PPC test for population homogeneity. Results show that the population is indeed homogenous, suggesting that the IIA violations are driven by context effects -- specifically, interactions within the choice sets. These results highlight the need for new similarity choice models that account for such context effects.
- Abstract(参考訳): 類似性選択データは、情報検索や埋め込み学習設定の文脈において、人間がターゲットと類似性に基づいて選択肢の選択を行うときに発生する。
古典的メートル法に基づく類似性選択のモデルは、より単純な定式化を可能にする性質である無関係な代替物 (IIA) の独立性を前提としている。
IIA違反は多くの個別選択設定で検出されているが、類似性選択設定には注意が払われている。
これは、選択のターゲット依存の性質がIIAテストを複雑にするためである。
本稿では,古典的適合性テストと,後予測チェック(PPC)の枠組みに基づくベイズ的テストの2つの統計的手法を提案する。
このベイズ的アプローチは、我々の主要な技術的貢献であり、単に重要なだけでなく、IIA違反の程度を定量化します。
我々は、IIA違反を誘発するために設計された選択セットと、同じアイテム宇宙からランダムに生成された選択セットの2つのデータセットをキュレートする。
私たちのテストでは、両方のデータセットに重要なIIA違反が確認されました。
さらに,人口均質性に対する新しいPPC試験を考案した。
その結果、人口は確かに均質であり、IIA違反は文脈効果(特に選択集合内の相互作用)によって引き起こされることを示唆している。
これらの結果は、そのような文脈効果を考慮に入れた新しい類似性選択モデルの必要性を強調している。
関連論文リスト
- Detecting and Identifying Selection Structure in Sequential Data [53.24493902162797]
我々は,音楽のシーケンスなどの実践的な状況において,潜在目的に基づくデータポイントの選択的包摂が一般的である,と論じる。
選択構造はパラメトリックな仮定や介入実験なしで識別可能であることを示す。
また、他の種類の依存関係と同様に、選択構造を検知し、識別するための証明可能な正当性アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-06-29T20:56:34Z) - Causal Feature Selection via Transfer Entropy [59.999594949050596]
因果発見は、観察データによる特徴間の因果関係を特定することを目的としている。
本稿では,前向きと後向きの機能選択に依存する新たな因果的特徴選択手法を提案する。
精度および有限サンプルの場合の回帰誤差と分類誤差について理論的に保証する。
論文 参考訳(メタデータ) (2023-10-17T08:04:45Z) - Model-based causal feature selection for general response types [8.228587135343071]
Invariant causal prediction (ICP) は、不均一な設定からのデータを必要とする因果的特徴選択の手法である。
我々は変換モデル(TRAM)ベースのICPを開発し、連続的、分類的、カウント型、非形式的に検閲された応答を可能にする。
我々は、オープンソースのRパッケージ「tramicp」を提供し、シミュレーションデータに対する我々のアプローチを評価し、重篤な患者の生存の因果的特徴を調査する事例研究を行った。
論文 参考訳(メタデータ) (2023-09-22T12:42:48Z) - Bounding Counterfactuals under Selection Bias [60.55840896782637]
本稿では,識別不能なクエリと識別不能なクエリの両方に対処するアルゴリズムを提案する。
選択バイアスによって引き起こされる欠如にもかかわらず、利用可能なデータの可能性は無限であることを示す。
論文 参考訳(メタデータ) (2022-07-26T10:33:10Z) - Selective Ensembles for Consistent Predictions [19.154189897847804]
不整合は高い文脈では望ましくない。
この矛盾は、予測を超えて属性を特徴付けていることが示される。
我々は,選択的アンサンブルが低禁制率を維持しつつ,一貫した予測と特徴属性を達成することを証明した。
論文 参考訳(メタデータ) (2021-11-16T05:03:56Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z) - Selecting Treatment Effects Models for Domain Adaptation Using Causal
Knowledge [82.5462771088607]
監視されていないドメイン適応設定下でITE法用に特別に設計された新しいモデル選択メトリックを提案する。
特に,介入効果の予測が対象領域の既知の因果構造を満たすモデルを選択することを提案する。
論文 参考訳(メタデータ) (2021-02-11T21:03:14Z) - Double machine learning for sample selection models [0.12891210250935145]
本稿では,サンプル選択や帰属によるサブポピュレーションに対してのみ結果が観察される場合の個別分散処理の評価について考察する。
a)Neyman-orthogonal, Duubly robust, and efficient score function, which suggests the robustness of treatment effect Estimation to moderate regularization biases in the machine learning based Estimation of the outcome, treatment, or sample selection model and (b) sample splitting ( or cross-fitting) to prevent overfitting bias。
論文 参考訳(メタデータ) (2020-11-30T19:40:21Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z) - Fundamental Limits of Testing the Independence of Irrelevant
Alternatives in Discrete Choice [9.13127392774573]
MNL(Multinomial Logit)モデルとIIA(Independent of Irrelevant Alternatives)モデルが最も広く使われているツールである。
最低ケース誤差が低いIIAの一般的なテストは、選択問題の代替案の数で指数関数的に多くのサンプルを必要とすることを示す。
我々の下限は構造に依存しており、最適化の潜在的な原因として、特定の選択集合の集合で起こりうる違反にIIAのテストを制限すると、より悲観的でない構造に依存した下限が得られる。
論文 参考訳(メタデータ) (2020-01-20T10:15:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。