論文の概要: A Data-Driven State Aggregation Approach for Dynamic Discrete Choice
Models
- arxiv url: http://arxiv.org/abs/2304.04916v1
- Date: Tue, 11 Apr 2023 01:07:24 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 16:36:57.402198
- Title: A Data-Driven State Aggregation Approach for Dynamic Discrete Choice
Models
- Title(参考訳): 動的離散選択モデルのためのデータ駆動状態集約手法
- Authors: Sinong Geng, Houssam Nassif and Carlos A. Manzanares
- Abstract要約: 本稿では,状態の選択と集約のためのデータ駆動型手法を提案する。
提案した2段階のアプローチは,問題次元を減らして次元の呪いを緩和する。
2つの古典的動的離散的選択推定法におけるアルゴリズムの実証的性能を実証する。
- 参考スコア(独自算出の注目度): 7.7347261505610865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study dynamic discrete choice models, where a commonly studied problem
involves estimating parameters of agent reward functions (also known as
"structural" parameters), using agent behavioral data. Maximum likelihood
estimation for such models requires dynamic programming, which is limited by
the curse of dimensionality. In this work, we present a novel algorithm that
provides a data-driven method for selecting and aggregating states, which
lowers the computational and sample complexity of estimation. Our method works
in two stages. In the first stage, we use a flexible inverse reinforcement
learning approach to estimate agent Q-functions. We use these estimated
Q-functions, along with a clustering algorithm, to select a subset of states
that are the most pivotal for driving changes in Q-functions. In the second
stage, with these selected "aggregated" states, we conduct maximum likelihood
estimation using a commonly used nested fixed-point algorithm. The proposed
two-stage approach mitigates the curse of dimensionality by reducing the
problem dimension. Theoretically, we derive finite-sample bounds on the
associated estimation error, which also characterize the trade-off of
computational complexity, estimation error, and sample complexity. We
demonstrate the empirical performance of the algorithm in two classic dynamic
discrete choice estimation applications.
- Abstract(参考訳): 本研究では,エージェント行動データを用いてエージェント報酬関数(構造的パラメータとも呼ばれる)のパラメータを推定する動的離散選択モデルについて検討する。
そのようなモデルの最大確率推定には、次元の呪いによって制限される動的プログラミングが必要である。
本稿では,状態の選択と集約のためのデータ駆動型手法を提供する新しいアルゴリズムを提案する。
我々の方法は2つの段階で動作する。
第1段階では,フレキシブルな逆強化学習手法を用いてエージェントq関数を推定する。
これらの推定されたq関数とクラスタリングアルゴリズムを用いて、q関数の変化を駆動する最も重要な状態のサブセットを選択する。
第2段階では、これらの選択された「集約」状態を用いて、一般に使用されるネスト固定点アルゴリズムを用いて最大確率推定を行う。
提案手法は,問題次元を小さくすることで次元の呪いを軽減する。
理論的には、関連する推定誤差の有限サンプル境界を導出し、計算複雑性、推定誤差、サンプル複雑性のトレードオフを特徴付ける。
2つの古典的動的離散的選択推定法におけるアルゴリズムの実証的性能を示す。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - Efficient Model-Free Exploration in Low-Rank MDPs [76.87340323826945]
低ランクマルコフ決定プロセスは、関数近似を持つRLに対して単純だが表現力のあるフレームワークを提供する。
既存のアルゴリズムは、(1)計算的に抽出可能であるか、または(2)制限的な統計的仮定に依存している。
提案手法は,低ランクMPPの探索のための最初の実証可能なサンプル効率アルゴリズムである。
論文 参考訳(メタデータ) (2023-07-08T15:41:48Z) - Learning Unnormalized Statistical Models via Compositional Optimization [73.30514599338407]
実データと人工雑音のロジスティックな損失として目的を定式化することにより, ノイズコントラスト推定(NCE)を提案する。
本稿では,非正規化モデルの負の対数類似度を最適化するための直接的アプローチについて検討する。
論文 参考訳(メタデータ) (2023-06-13T01:18:16Z) - Adaptive LASSO estimation for functional hidden dynamic geostatistical
model [69.10717733870575]
関数型隠れ統計モデル(f-HD)のためのペナル化極大推定器(PMLE)に基づく新しいモデル選択アルゴリズムを提案する。
このアルゴリズムは反復最適化に基づいており、適応最小限の収縮・セレクタ演算子(GMSOLAS)ペナルティ関数を用いており、これは不給付のf-HD最大線量推定器によって得られる。
論文 参考訳(メタデータ) (2022-08-10T19:17:45Z) - Manifold learning-based polynomial chaos expansions for high-dimensional
surrogate models [0.0]
システム記述における不確実性定量化(UQ)のための多様体学習に基づく手法を提案する。
提案手法は高精度な近似を達成でき、UQタスクの大幅な高速化につながる。
論文 参考訳(メタデータ) (2021-07-21T00:24:15Z) - Goal-directed Generation of Discrete Structures with Conditional
Generative Models [85.51463588099556]
本稿では,強化学習目標を直接最適化し,期待される報酬を最大化するための新しいアプローチを提案する。
提案手法は、ユーザ定義プロパティを持つ分子の生成と、所定の目標値を評価する短いピソン表現の同定という2つのタスクで検証する。
論文 参考訳(メタデータ) (2020-10-05T20:03:13Z) - SODEN: A Scalable Continuous-Time Survival Model through Ordinary
Differential Equation Networks [14.564168076456822]
本稿では、ニューラルネットワークとスケーラブルな最適化アルゴリズムを用いた生存分析のためのフレキシブルモデルを提案する。
提案手法の有効性を,既存の最先端ディープラーニングサバイバル分析モデルと比較した。
論文 参考訳(メタデータ) (2020-08-19T19:11:25Z) - Landscape-Aware Fixed-Budget Performance Regression and Algorithm
Selection for Modular CMA-ES Variants [1.0965065178451106]
市販の教師あり学習手法を用いて,高品質な性能予測が可能であることを示す。
このアプローチを,モジュール型CMA-ESアルゴリズム群から選択した,非常に類似したアルゴリズムのポートフォリオ上でテストする。
論文 参考訳(メタデータ) (2020-06-17T13:34:57Z) - Instability, Computational Efficiency and Statistical Accuracy [101.32305022521024]
我々は,人口レベルでのアルゴリズムの決定論的収束率と,$n$サンプルに基づく経験的対象に適用した場合の(不安定性)の間の相互作用に基づいて,統計的精度を得るフレームワークを開発する。
本稿では,ガウス混合推定,非線形回帰モデル,情報的非応答モデルなど,いくつかの具体的なモデルに対する一般結果の応用について述べる。
論文 参考訳(メタデータ) (2020-05-22T22:30:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。