論文の概要: Predicting Census Survey Response Rates via Interpretable Nonparametric
Additive Models with Structured Interactions
- arxiv url: http://arxiv.org/abs/2108.11328v1
- Date: Tue, 24 Aug 2021 17:49:55 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-26 23:40:35.436306
- Title: Predicting Census Survey Response Rates via Interpretable Nonparametric
Additive Models with Structured Interactions
- Title(参考訳): 構造的相互作用を考慮した解釈可能な非パラメトリック付加モデルによるセンササーベイ応答率予測
- Authors: Shibal Ibrahim, Rahul Mazumder, Peter Radchenko, Emanuel Ben-David
- Abstract要約: 我々は,調査における応答率を高精度に予測する新しい解釈可能な統計手法を提案する。
提案手法は,最先端の機械学習手法に予測性能を損なうことなく,解釈可能性を大幅に向上させる。
- 参考スコア(独自算出の注目度): 7.866556977836076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Accurate and interpretable prediction of survey response rates is important
from an operational standpoint. The US Census Bureau's well-known ROAM
application uses principled statistical models trained on the US Census
Planning Database data to identify hard-to-survey areas. An earlier
crowdsourcing competition revealed that an ensemble of regression trees led to
the best performance in predicting survey response rates; however, the
corresponding models could not be adopted for the intended application due to
limited interpretability. In this paper, we present new interpretable
statistical methods to predict, with high accuracy, response rates in surveys.
We study sparse nonparametric additive models with pairwise interactions via
$\ell_0$-regularization, as well as hierarchically structured variants that
provide enhanced interpretability. Despite strong methodological underpinnings,
such models can be computationally challenging -- we present new scalable
algorithms for learning these models. We also establish novel non-asymptotic
error bounds for the proposed estimators. Experiments based on the US Census
Planning Database demonstrate that our methods lead to high-quality predictive
models that permit actionable interpretability for different segments of the
population. Interestingly, our methods provide significant gains in
interpretability without losing in predictive performance to state-of-the-art
black-box machine learning methods based on gradient boosting and feedforward
neural networks. Our code implementation in python is available at
https://github.com/ShibalIbrahim/Additive-Models-with-Structured-Interactions.
- Abstract(参考訳): 調査回答率の正確かつ解釈可能な予測は,運用の観点から重要である。
アメリカ合衆国国勢調査局のよく知られたroam申請は、米国の国勢調査計画データベースデータに基づいて訓練された原則に基づく統計モデルを使用して、調査の難しい地域を特定する。
初期のクラウドソーシングコンペティションでは、回帰ツリーのアンサンブルが調査応答率の予測に最高の性能をもたらしたが、限定的な解釈可能性のため、対応するモデルは対象に適用できなかった。
本稿では,調査における応答率を高精度に予測する新しい解釈可能な統計手法を提案する。
我々は,$\ell_0$-regularization による対関係を持つ疎非パラメトリック加法モデルと,解釈性を高める階層構造変種について検討した。
強力な方法論的基盤にもかかわらず、そのようなモデルは計算的に困難であり、これらのモデルを学習するための新しいスケーラブルなアルゴリズムを提示します。
また,提案した推定器の非漸近誤差境界も確立した。
米国国勢調査計画データベースに基づく実験は、我々の手法が、人口の異なるセグメントに対して実行可能な解釈可能性を可能にする高品質な予測モデルに繋がることを示している。
興味深いことに,我々の手法は,勾配向上とフィードフォワードニューラルネットワークに基づく最先端のブラックボックス機械学習手法に予測性能を損なうことなく,解釈可能性を大幅に向上させる。
pythonのコード実装はhttps://github.com/ShibalIbrahim/Additive-Models-with-Structured-Interactionsで公開されています。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Scaling Laws Do Not Scale [54.72120385955072]
最近の研究によると、データセットのサイズが大きくなると、そのデータセットでトレーニングされたモデルのパフォーマンスが向上する。
このスケーリング法則の関係は、モデルのアウトプットの質を異なる集団がどのように認識するかと一致しないパフォーマンスを測定するために使われる指標に依存する、と我々は主張する。
異なるコミュニティは、互いに緊張関係にある価値を持ち、モデル評価に使用されるメトリクスについて、困難で、潜在的に不可能な選択をもたらす可能性がある。
論文 参考訳(メタデータ) (2023-07-05T15:32:21Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - A prediction and behavioural analysis of machine learning methods for
modelling travel mode choice [0.26249027950824505]
我々は、モデル選択に影響を及ぼす可能性のある重要な要因の観点から、複数のモデリング問題に対して異なるモデリングアプローチを体系的に比較する。
その結果,非凝集性予測性能が最も高いモデルでは,行動指標やアグリゲーションモードのシェアが低下することが示唆された。
MNLモデルは様々な状況において堅牢に機能するが、ML手法はWillingness to Payのような行動指標の推定を改善することができる。
論文 参考訳(メタデータ) (2023-01-11T11:10:32Z) - A Graph-Enhanced Click Model for Web Search [67.27218481132185]
ウェブ検索のための新しいグラフ強調クリックモデル(GraphCM)を提案する。
セッション内情報とセッション間情報の両方を、スパーシリティ問題とコールドスタート問題に活用する。
論文 参考訳(メタデータ) (2022-06-17T08:32:43Z) - Mixed Effects Neural ODE: A Variational Approximation for Analyzing the
Dynamics of Panel Data [50.23363975709122]
パネルデータ解析に(固定・ランダムな)混合効果を取り入れたME-NODEという確率モデルを提案する。
我々は、Wong-Zakai定理によって提供されるSDEの滑らかな近似を用いて、我々のモデルを導出できることを示す。
次に、ME-NODEのためのエビデンスに基づく下界を導出し、(効率的な)トレーニングアルゴリズムを開発する。
論文 参考訳(メタデータ) (2022-02-18T22:41:51Z) - Black-box Bayesian inference for economic agent-based models [0.0]
2種類のブラックボックス近似ベイズ推定法の有効性について検討した。
ニューラルネットワークに基づくブラックボックス法は, 経済シミュレーションモデルに対して, アートパラメータ推論の状態を提示する。
論文 参考訳(メタデータ) (2022-02-01T18:16:12Z) - ALT-MAS: A Data-Efficient Framework for Active Testing of Machine
Learning Algorithms [58.684954492439424]
少量のラベル付きテストデータのみを用いて機械学習モデルを効率的にテストする新しいフレームワークを提案する。
ベイズニューラルネットワーク(bnn)を用いたモデルアンダーテストの関心指標の推定が目的である。
論文 参考訳(メタデータ) (2021-04-11T12:14:04Z) - Learning Opinion Dynamics From Social Traces [25.161493874783584]
本稿では,現実の社会的トレースに,生成的,エージェントライクな意見力学モデルを適用するための推論機構を提案する。
本稿では,古典的エージェントに基づく意見力学モデルから,その生成的モデルへの変換による提案について紹介する。
われわれのモデルをRedditの現実世界のデータに適用して、バックファイア効果の影響に関する長年にわたる疑問を探る。
論文 参考訳(メタデータ) (2020-06-02T14:48:17Z) - Amortized Bayesian Inference for Models of Cognition [0.1529342790344802]
専門的なニューラルネットワークアーキテクチャを用いたシミュレーションベース推論の最近の進歩は、ベイズ近似計算の多くの過去の問題を回避している。
本稿では,アモータイズされたベイズパラメータの推定とモデル比較について概説する。
論文 参考訳(メタデータ) (2020-05-08T08:12:15Z) - Amortized Bayesian model comparison with evidential deep learning [0.12314765641075436]
本稿では,専門的なディープラーニングアーキテクチャを用いたベイズモデルの比較手法を提案する。
提案手法は純粋にシミュレーションベースであり,観測された各データセットに対して,すべての代替モデルを明示的に適合させるステップを回避している。
提案手法は,本研究で検討した事例に対して,精度,キャリブレーション,効率の点で優れた結果が得られることを示す。
論文 参考訳(メタデータ) (2020-04-22T15:15:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。