論文の概要: Addressing Dynamic and Sparse Qualitative Data: A Hilbert Space
Embedding of Categorical Variables
- arxiv url: http://arxiv.org/abs/2308.11781v1
- Date: Tue, 22 Aug 2023 20:40:31 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-24 16:47:17.157968
- Title: Addressing Dynamic and Sparse Qualitative Data: A Hilbert Space
Embedding of Categorical Variables
- Title(参考訳): 動的かつスパースな定性データへの対処:カテゴリー変数のヒルベルト空間埋め込み
- Authors: Anirban Mukherjee and Hannah H. Chang
- Abstract要約: 因果推定のための定量的モデルに定性的データを組み込む新しい枠組みを提案する。
機能分析を使用して、よりニュアンスで柔軟なフレームワークを作成します。
シミュレーションの総合的証拠を用いて本モデルを検証し,その妥当性を実世界の研究で実証する。
- 参考スコア(独自算出の注目度): 0.26107298043931204
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a novel framework for incorporating qualitative data into
quantitative models for causal estimation. Previous methods use categorical
variables derived from qualitative data to build quantitative models. However,
this approach can lead to data-sparse categories and yield inconsistent
(asymptotically biased) and imprecise (finite sample biased) estimates if the
qualitative information is dynamic and intricate. We use functional analysis to
create a more nuanced and flexible framework. We embed the observed categories
into a latent Baire space and introduce a continuous linear map -- a Hilbert
space embedding -- from the Baire space of categories to a Reproducing Kernel
Hilbert Space (RKHS) of representation functions. Through the Riesz
representation theorem, we establish that the canonical treatment of
categorical variables in causal models can be transformed into an identified
structure in the RKHS. Transfer learning acts as a catalyst to streamline
estimation -- embeddings from traditional models are paired with the kernel
trick to form the Hilbert space embedding. We validate our model through
comprehensive simulation evidence and demonstrate its relevance in a real-world
study that contrasts theoretical predictions from economics and psychology in
an e-commerce marketplace. The results confirm the superior performance of our
model, particularly in scenarios where qualitative information is nuanced and
complex.
- Abstract(参考訳): 因果推定のための定量的モデルに定性的データを組み込む新しい枠組みを提案する。
従来の手法では、質的データから派生した分類変数を使用して量的モデルを構築していた。
しかし、このアプローチは、定性的情報が動的で複雑であれば、データスパースなカテゴリにつながり、矛盾(漸近的に偏り)と不正確な(有限サンプル偏り)推定をもたらす可能性がある。
機能分析を使って、より微妙で柔軟なフレームワークを作ります。
観測された圏を潜在ベール空間に埋め込み、圏のベール空間から表現関数の再現ケルネルヒルベルト空間(RKHS)への連続線型写像(ヒルベルト空間埋め込み)を導入する。
リースの表現定理により、因果モデルにおけるカテゴリー変数の正準処理が、RKHSの特定構造に変換できることが証明される。
伝達学習は、合理化推定の触媒として作用する -- 伝統的なモデルからの埋め込みは、ヒルベルト空間埋め込みを形成するためにカーネルトリックと組み合わせられる。
我々は,eコマース市場における経済学や心理学の理論的予測と対比する実世界研究において,総合シミュレーションによるモデルの有効性を検証し,その妥当性を実証する。
その結果,定性的情報が曖昧で複雑であるシナリオでは,モデルの性能が向上することが確認できた。
関連論文リスト
- GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - CAVIAR: Categorical-Variable Embeddings for Accurate and Robust Inference [0.2209921757303168]
社会科学の研究は、しばしば分類変数と結果の関係に頼っている。
本稿では,高次元空間における値を仮定するカテゴリ変数を埋め込む新しい手法であるCAVIARを紹介する。
論文 参考訳(メタデータ) (2024-04-07T14:47:07Z) - Directed Cyclic Graph for Causal Discovery from Multivariate Functional
Data [15.26007975367927]
因果構造学習のための機能線形構造方程式モデルを提案する。
解釈可能性を高めるために,本モデルは低次元因果埋め込み空間を含む。
提案モデルが標準仮定の下で因果的同定可能であることを示す。
論文 参考訳(メタデータ) (2023-10-31T15:19:24Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Kalman Filter for Online Classification of Non-Stationary Data [101.26838049872651]
オンライン連続学習(OCL)では、学習システムはデータのストリームを受け取り、予測とトレーニングの手順を順次実行する。
本稿では,線形予測量に対するニューラル表現と状態空間モデルを用いた確率ベイズオンライン学習モデルを提案する。
多クラス分類の実験では、モデルの予測能力と非定常性を捉える柔軟性を示す。
論文 参考訳(メタデータ) (2023-06-14T11:41:42Z) - Representer Point Selection for Explaining Regularized High-dimensional
Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。
私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。
提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-05-31T16:23:58Z) - On the Influence of Enforcing Model Identifiability on Learning dynamics
of Gaussian Mixture Models [14.759688428864159]
特異モデルからサブモデルを抽出する手法を提案する。
本手法はトレーニング中のモデルの識別性を強制する。
この手法がディープニューラルネットワークのようなより複雑なモデルにどのように適用できるかを示す。
論文 参考訳(メタデータ) (2022-06-17T07:50:22Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Modeling Massive Spatial Datasets Using a Conjugate Bayesian Linear
Regression Framework [0.0]
階層的モデリングフレームワークに簡単に組み込むことのできる、様々なスケーラブルな空間プロセスモデルが提案されている。
本稿では,空間過程の推論を迅速に行うことができる共役ベイズ線形回帰モデルとして,点参照空間過程モデルをどうキャストするかを論じる。
論文 参考訳(メタデータ) (2021-09-09T17:46:00Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Multiplicative noise and heavy tails in stochastic optimization [62.993432503309485]
経験的最適化は現代の機械学習の中心であるが、その成功における役割はまだ不明である。
分散による離散乗法雑音のパラメータによく現れることを示す。
最新のステップサイズやデータを含む重要な要素について、詳細な分析を行い、いずれも最先端のニューラルネットワークモデルで同様の結果を示す。
論文 参考訳(メタデータ) (2020-06-11T09:58:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。