論文の概要: Policy4OOD: A Knowledge-Guided World Model for Policy Intervention Simulation against the Opioid Overdose Crisis
- arxiv url: http://arxiv.org/abs/2602.12373v1
- Date: Thu, 12 Feb 2026 20:08:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:53.731907
- Title: Policy4OOD: A Knowledge-Guided World Model for Policy Intervention Simulation against the Opioid Overdose Crisis
- Title(参考訳): Policy4OOD:オピオイド過量危機に対する政策介入シミュレーションのための知識誘導世界モデル
- Authors: Yijun Ma, Zehong Wang, Weixiang Sun, Zheyuan Zhang, Kaiwen Shi, Nitesh Chawla, Yanfang Ye,
- Abstract要約: オピオイドの流行はアメリカでも最も深刻な公衆衛生危機の1つだ。
我々は、どのような政策、エフェクトが現れるか、そしていつ効果が広がるかという3つの課題に対処する知識誘導型時間的世界モデルを提案する。
本研究では,空間的依存関係と構造的政策知識が予測精度を大幅に向上させることを示す。
- 参考スコア(独自算出の注目度): 22.203336225009778
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The opioid epidemic remains one of the most severe public health crises in the United States, yet evaluating policy interventions before implementation is difficult: multiple policies interact within a dynamic system where targeting one risk pathway may inadvertently amplify another. We argue that effective opioid policy evaluation requires three capabilities -- forecasting future outcomes under current policies, counterfactual reasoning about alternative past decisions, and optimization over candidate interventions -- and propose to unify them through world modeling. We introduce Policy4OOD, a knowledge-guided spatio-temporal world model that addresses three core challenges: what policies prescribe, where effects manifest, and when effects unfold.Policy4OOD jointly encodes policy knowledge graphs, state-level spatial dependencies, and socioeconomic time series into a policy-conditioned Transformer that forecasts future opioid outcomes.Once trained, the world model serves as a simulator: forecasting requires only a forward pass, counterfactual analysis substitutes alternative policy encodings in the historical sequence, and policy optimization employs Monte Carlo Tree Search over the learned simulator. To support this framework, we construct a state-level monthly dataset (2019--2024) integrating opioid mortality, socioeconomic indicators, and structured policy encodings. Experiments demonstrate that spatial dependencies and structured policy knowledge significantly improve forecasting accuracy, validating each architectural component and the potential of world modeling for data-driven public health decision support.
- Abstract(参考訳): オピオイドの流行はアメリカでも最も深刻な公衆衛生危機の1つだが、実施前の政策介入を評価することは困難である。
我々は、効果的なオピオイド政策評価には、現在の政策の下での将来の成果を予測すること、代替過去の決定に対する反実的推論、候補者の介入に対する最適化という3つの能力が必要であり、世界モデリングを通じてそれらを統一することを提案する。
ポリシ4OODは,政策知識グラフ,状態レベルの空間依存性,社会経済時系列を,将来のオピオイド結果を予測するポリシコンディショニングトランスフォーマーに共同でエンコードする。トレーニングされたことにより,世界モデルはシミュレータとして機能する。予測は前方パスのみを必要とし,逆ファクト解析は歴史的シーケンス内の代替ポリシエンコーディングを代用し,政策最適化はモンテカルロ木探索を学習シミュレータに採用する。
この枠組みをサポートするために、オピオイド死亡率、社会経済指標、構造化政策エンコーディングを統合した州レベルの月次データセット(2019-2024)を構築した。
実験により、空間的依存関係と構造化された政策知識が予測精度を大幅に向上し、データ駆動型公衆衛生意思決定支援のための世界モデリングの可能性を検証した。
関連論文リスト
- LLM-Powered Social Digital Twins: A Framework for Simulating Population Behavioral Response to Policy Interventions [0.2787288702904897]
ソーシャルデジタルツイン(Social Digital Twins)は、大規模言語モデルが個々のエージェントの認知エンジンとして機能する仮想人口レプリカである。
新型コロナウイルスをケーススタディとして、パンデミック対応の領域でこの枠組みをインスタンス化する。
本稿では, 政策シミュレーション, アプローチの限界, パンデミック対応を超えてLLMベースのデジタル双生児を拡大するための方向性について論じる。
論文 参考訳(メタデータ) (2026-01-03T13:25:33Z) - Beating the Winner's Curse via Inference-Aware Policy Optimization [26.01488014918074]
一般的なアプローチは、機械学習モデルをトレーニングして反現実的な結果を予測し、予測された客観的価値を最適化するポリシーを選択することである。
提案手法は,政策を下流でどのように評価するかを考慮し,政策最適化を改良する,推論対応政策最適化と呼ばれる新しい戦略を提案する。
論文 参考訳(メタデータ) (2025-10-20T23:28:12Z) - Game and Reference: Policy Combination Synthesis for Epidemic Prevention and Control [4.635793210136456]
疫病対策のための新しい政策組合せ合成(PCS)モデルを提案する。
極端な意思決定を防止するため、モデル作成ポリシーと実際のポリシーの対立学習を導入する。
また、同様のシナリオ下での最高の歴史的政策から、モデルに経験を引き出すために、対照的な学習も採用しています。
論文 参考訳(メタデータ) (2024-03-16T00:26:59Z) - Hallucinated Adversarial Control for Conservative Offline Policy
Evaluation [64.94009515033984]
本研究では,環境相互作用のオフラインデータセットが与えられた場合,政策のパフォーマンスを低く抑えることを目的とした,保守的非政治評価(COPE)の課題について検討する。
本稿では,遷移力学の不確実性を考慮した学習モデルに基づくHAMBOを紹介する。
結果のCOPE推定値が妥当な下界であることを証明し、正則性条件下では、真に期待された戻り値への収束を示す。
論文 参考訳(メタデータ) (2023-03-02T08:57:35Z) - POETREE: Interpretable Policy Learning with Adaptive Decision Trees [78.6363825307044]
POETREEは、ポリシー学習を解釈するための新しいフレームワークである。
患者の観察と医療史に基づいて、医師の行動を決定する確率的ツリーポリシーを構築する。
これは、リアルおよび合成医療データセットの最先端を上回ります。
論文 参考訳(メタデータ) (2022-03-15T16:50:52Z) - Reinforcement Learning with Heterogeneous Data: Estimation and Inference [84.72174994749305]
人口の不均一性に関する逐次的決定問題に対処するために,K-ヘテロ・マルコフ決定過程(K-ヘテロ・MDP)を導入する。
本稿では、ある政策の価値を推定するための自己クラスタ化政策評価(ACPE)と、ある政策クラスにおける最適な政策を推定するための自己クラスタ化政策イテレーション(ACPI)を提案する。
理論的な知見を裏付けるシミュレーションを行い,MIMIC-III標準データセットの実証的研究を行った。
論文 参考訳(メタデータ) (2022-01-31T20:58:47Z) - Building a Foundation for Data-Driven, Interpretable, and Robust Policy
Design using the AI Economist [67.08543240320756]
AIエコノミストフレームワークは,2段階強化学習とデータ駆動型シミュレーションを用いて,効果的な,柔軟な,解釈可能なポリシー設計を可能にする。
RLを用いて訓練されたログリニア政策は、過去の結果と比較して、公衆衛生と経済の両面から社会福祉を著しく改善することがわかった。
論文 参考訳(メタデータ) (2021-08-06T01:30:41Z) - Reinforcement Learning for Optimization of COVID-19 Mitigation policies [29.4529156655747]
2020年は新型コロナウイルスの感染拡大が世界最悪の世界的なパンデミックの1つとなった。
世界中の政府は公衆衛生を保護し、経済を最大限に維持するという課題に直面している。
疫学モデルは、これらの病気の拡散に関する洞察を与え、介入政策の効果を予測する。
論文 参考訳(メタデータ) (2020-10-20T18:40:15Z) - When and How to Lift the Lockdown? Global COVID-19 Scenario Analysis and
Policy Assessment using Compartmental Gaussian Processes [111.69190108272133]
新型コロナウイルス(COVID-19)の世界的な感染拡大を受け、多くの国が前例のないロックダウン措置を講じている。
さまざまなロックダウンポリシーシナリオの下で、新型コロナウイルスの死亡率を予測するデータ駆動モデルが不可欠だ。
本稿では,グローバルな状況下での新型コロナウイルスロックダウンポリシーの効果を予測するためのベイズモデルを開発する。
論文 参考訳(メタデータ) (2020-05-13T18:21:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。