論文の概要: Assessing model error in counterfactual worlds
- arxiv url: http://arxiv.org/abs/2512.00836v1
- Date: Sun, 30 Nov 2025 11:08:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.444455
- Title: Assessing model error in counterfactual worlds
- Title(参考訳): 反現実的世界におけるモデル誤差の評価
- Authors: Emily Howerton, Justin Lessler,
- Abstract要約: 予測と観測の違いは、シナリオ偏差とモデル誤校正の2つの源泉から生じると我々は主張する。
ここでは、この誤差を推定するための3つのアプローチを提示、対比し、シミュレーション実験においてそれぞれの利点と限界を実証する。
本稿では, シナリオ予測を評価可能なものにするために必要となるシナリオ設計の構成要素について考察する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Counterfactual scenario modeling exercises that ask "what would happen if?" are one of the most common ways we plan for the future. Despite their ubiquity in planning and decision making, scenario projections are rarely evaluated retrospectively. Differences between projections and observations come from two sources: scenario deviation and model miscalibration. We argue the latter is most important for assessing the value of models in decision making, but requires estimating model error in counterfactual worlds. Here we present and contrast three approaches for estimating this error, and demonstrate the benefits and limitations of each in a simulation experiment. We provide recommendations for the estimation of counterfactual error and discuss the components of scenario design that are required to make scenario projections evaluable.
- Abstract(参考訳): 将来計画する最も一般的な方法のひとつが,“もしそうなったらどうなるか?”を問う,現実的シナリオモデリングのエクササイズです。
計画と意思決定に多用されているにもかかわらず、シナリオ予測はふりかえりに評価されることはめったにない。
投影と観測の違いは、シナリオ偏差とモデル誤校正の2つのソースから生じる。
後者は意思決定におけるモデルの価値を評価する上で最も重要であると我々は主張するが、反ファクトの世界ではモデルエラーを推定する必要がある。
ここでは、この誤差を推定するための3つのアプローチを提示、対比し、シミュレーション実験においてそれぞれの利点と限界を実証する。
本稿では, シナリオ予測を評価可能なものにするために必要となるシナリオ設計の構成要素について考察する。
関連論文リスト
- From Black-box to Causal-box: Towards Building More Interpretable Models [57.23201263629627]
本稿では, 因果解釈可能性の概念を導入し, 特定のモデルのクラスから対実的クエリを評価できるときの形式化について述べる。
我々は、与えられたモデルアーキテクチャが与えられた偽物クエリをサポートするかどうかを決定する完全なグラフィカルな基準を導出する。
論文 参考訳(メタデータ) (2025-10-24T20:03:18Z) - A Probabilistic Perspective on Unlearning and Alignment for Large Language Models [48.96686419141881]
大規模言語モデル(LLM)のための最初の形式的確率的評価フレームワークを紹介する。
すなわち,モデルの出力分布に関する確率保証の高い新しい指標を提案する。
私たちのメトリクスはアプリケーションに依存しないので、デプロイ前にモデル機能についてより信頼性の高い見積を行うことができます。
論文 参考訳(メタデータ) (2024-10-04T15:44:23Z) - Bounding-Box Inference for Error-Aware Model-Based Reinforcement Learning [4.185571779339683]
モデルに基づく強化学習では、シミュレーションされた経験は実環境からの経験と同等のものとして扱われることが多い。
モデルベースの更新に対する不確実性を推定するために、最適結果が分布に敏感な推測を必要とすることを示す。
境界ボックス推論は効果的な選択計画を支援することができる。
論文 参考訳(メタデータ) (2024-06-23T04:23:15Z) - Scenario-based Evaluation of Prediction Models for Automated Vehicles [0.0]
自動運転車の安全性評価における評価の実践はシナリオベースで実施されるべきである。
オープンモーションデータセットの軌跡を捉えた動きの種類に応じて分類する。
その結果, 共通評価手法は不十分であり, モデルが動作するアプリケーションに応じて評価を行う必要があることがわかった。
論文 参考訳(メタデータ) (2022-10-11T09:45:43Z) - Probabilistic Modeling for Human Mesh Recovery [73.11532990173441]
本稿では,2次元の証拠から3次元の人体復元の問題に焦点を当てた。
我々は,この問題を,入力から3Dポーズの分布へのマッピング学習として再考した。
論文 参考訳(メタデータ) (2021-08-26T17:55:11Z) - Planning with Expectation Models for Control [8.238241895275232]
ワンなど。
一定の政策を評価する 予測のみの計画を考えました
期待モデルによる計画は、アクション値関数ではなく、状態値関数を更新する必要があることを証明します。
論文 参考訳(メタデータ) (2021-04-17T13:37:14Z) - The Causal Learning of Retail Delinquency [13.866975878174207]
本稿では、貸主の信用決定に変化があった場合の借主の返済の期待差に焦点を当てる。
本稿では,誤差を大幅に低減できる推定器を構築するための別の手法を提案する。
因果効果が正しく説明されれば, 推定誤差の相対的低減は極めて有意であることがわかった。
論文 参考訳(メタデータ) (2020-12-17T08:46:01Z) - Forethought and Hindsight in Credit Assignment [62.05690959741223]
我々は、前向きモデルや後向きモデルによる後向き操作による予測として使われる計画の利益と特異性を理解するために活動する。
本稿では,予測を(再)評価すべき状態の選択に主眼を置いて,計画におけるモデルの利用について検討する。
論文 参考訳(メタデータ) (2020-10-26T16:00:47Z) - Counterfactual Predictions under Runtime Confounding [74.90756694584839]
本研究は, 過去のデータからすべての関連要因を抽出した環境で, 事実予測タスクについて検討する。
本稿では,この環境下での対実予測モデル学習のための2次ロバスト手法を提案する。
論文 参考訳(メタデータ) (2020-06-30T15:49:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。