論文の概要: Dynamic Inference
- arxiv url: http://arxiv.org/abs/2111.14746v2
- Date: Tue, 30 Nov 2021 18:33:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-01 12:26:16.729145
- Title: Dynamic Inference
- Title(参考訳): 動的推論
- Authors: Aolin Xu
- Abstract要約: いくつかの逐次推定問題では、推定される量の将来値は、その現在の値の推定に依存する。
例えば、大手投資家による株価予測、インタラクティブな製品レコメンデーション、マルチエージェントシステムにおける行動予測などがある。
本研究では,ベイズ確率的枠組みの下でこの問題の定式化を行い,全体の推測損失を最小化するための最適推定戦略を導出する。
- 参考スコア(独自算出の注目度): 4.568777157687959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Traditional statistical estimation, or statistical inference in general, is
static, in the sense that the estimate of the quantity of interest does not
change the future evolution of the quantity. In some sequential estimation
problems however, we encounter the situation where the future values of the
quantity to be estimated depend on the estimate of its current value. Examples
include stock price prediction by big investors, interactive product
recommendation, and behavior prediction in multi-agent systems. We may call
such problems as dynamic inference. In this work, a formulation of this problem
under a Bayesian probabilistic framework is given, and the optimal estimation
strategy is derived as the solution to minimize the overall inference loss. How
the optimal estimation strategy works is illustrated through two examples,
stock trend prediction and vehicle behavior prediction. When the underlying
models for dynamic inference are unknown, we can consider the problem of
learning for dynamic inference. This learning problem can potentially unify
several familiar machine learning problems, including supervised learning,
imitation learning, and reinforcement learning.
- Abstract(参考訳): 従来の統計的推定、あるいは一般に統計的推測は、興味の量の推定が将来の量の進化を変えないという意味で静的である。
しかし、いくつかの逐次推定問題では、推定される量の将来値がその現在の値の推定に依存する状況に遭遇する。
例えば、大手投資家による株価予測、インタラクティブな製品推奨、マルチエージェントシステムの行動予測などだ。
動的推論のような問題を呼ぶことができる。
本研究では,ベイズ確率的枠組みの下でこの問題の定式化を行い,全体の推測損失を最小化するための最適推定戦略を導出する。
最適推定戦略の動作は,ストックトレンド予測と車両挙動予測の2つの例から説明される。
動的推論の基盤となるモデルが未知である場合、動的推論の学習の問題を考えることができる。
この学習問題は、教師付き学習、模倣学習、強化学習など、よく知られた機械学習問題を統一する可能性がある。
関連論文リスト
- Evaluating Pedestrian Trajectory Prediction Methods with Respect to Autonomous Driving [0.9217021281095907]
本稿では,単一軌跡生成の文脈における歩行者軌跡予測における技術の現状を評価する。
評価は、平均変位誤差(ADE)と最終変位誤差(FDE)を報告した広く使われているETH/UCYデータセット上で行われる。
論文 参考訳(メタデータ) (2023-08-09T19:21:50Z) - Bayesian Learning for Dynamic Inference [2.2843885788439793]
いくつかの逐次推定問題では、推定される量の将来値は、その現在の値の推定に依存する。
本研究では,未知量生成モデルがランダムに描画されることを前提として,動的推論のためのベイズ学習問題を定式化する。
我々は、推論損失を最小限に抑えるために、オフラインとオンラインの両方で最適なベイズ学習ルールを導出する。
論文 参考訳(メタデータ) (2022-12-30T19:16:23Z) - Towards Out-of-Distribution Sequential Event Prediction: A Causal
Treatment [72.50906475214457]
シーケンシャルなイベント予測の目標は、一連の歴史的なイベントに基づいて次のイベントを見積もることである。
実際には、次のイベント予測モデルは、一度に収集されたシーケンシャルなデータで訓練される。
文脈固有の表現を学習するための階層的な分岐構造を持つフレームワークを提案する。
論文 参考訳(メタデータ) (2022-10-24T07:54:13Z) - Prediction of Dilatory Behavior in eLearning: A Comparison of Multiple
Machine Learning Models [0.2963240482383777]
タスクの不合理な遅延である Procrastination は、オンライン学習においてよくある出来事である。
このような予測に焦点を当てた研究はほとんどない。
様々な種類の予測器と様々な手法の予測性能の比較を含む研究は、事実上存在しない。
論文 参考訳(メタデータ) (2022-06-30T07:24:08Z) - Stateful Offline Contextual Policy Evaluation and Learning [88.9134799076718]
我々は、シーケンシャルデータから、政治以外の評価と学習について研究する。
動的パーソナライズされた価格設定などの問題の因果構造を形式化する。
本報告では,本クラスにおけるアウト・オブ・サンプル・ポリシーの性能改善について述べる。
論文 参考訳(メタデータ) (2021-10-19T16:15:56Z) - Unifying Gradient Estimators for Meta-Reinforcement Learning via
Off-Policy Evaluation [53.83642844626703]
オフ・ポリシー評価に基づいて,高次値関数の高次微分を推定するための統一フレームワークを提供する。
本フレームワークは, ヘッセン推定の偏りと分散トレードオフを解明する特別事例として, 多くの先行的アプローチを解釈する。
論文 参考訳(メタデータ) (2021-06-24T15:58:01Z) - Foresee then Evaluate: Decomposing Value Estimation with Latent Future
Prediction [37.06232589005015]
価値関数は強化学習(rl)の中心的な概念である
将来予測付き価値分解(VDFP)を提案する。
価値関数を潜在未来ダイナミクス部とポリシー非依存軌道返却部とに分析分解し、潜在ダイナミクスをモデル化する方法を誘導し、価値推定において別々に返却する。
論文 参考訳(メタデータ) (2021-03-03T07:28:56Z) - Double Robust Representation Learning for Counterfactual Prediction [68.78210173955001]
そこで本稿では, 対実予測のための2次ロバスト表現を学習するための, スケーラブルな新しい手法を提案する。
我々は、個々の治療効果と平均的な治療効果の両方に対して、堅牢で効率的な対実的予測を行う。
このアルゴリズムは,実世界の最先端技術と合成データとの競合性能を示す。
論文 参考訳(メタデータ) (2020-10-15T16:39:26Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z) - Value-driven Hindsight Modelling [68.658900923595]
値推定は強化学習(RL)パラダイムの重要な構成要素である。
モデル学習は、観測系列に存在する豊富な遷移構造を利用することができるが、このアプローチは通常、報酬関数に敏感ではない。
この2つの極点の間に位置するRLにおける表現学習のアプローチを開発する。
これにより、タスクに直接関連し、値関数の学習を加速できる、抽出可能な予測ターゲットが提供される。
論文 参考訳(メタデータ) (2020-02-19T18:10:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。