論文の概要: Posterior Distribution-assisted Evolutionary Dynamic Optimization as an Online Calibrator for Complex Social Simulations
- arxiv url: http://arxiv.org/abs/2601.19481v1
- Date: Tue, 27 Jan 2026 11:15:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-28 15:26:51.293669
- Title: Posterior Distribution-assisted Evolutionary Dynamic Optimization as an Online Calibrator for Complex Social Simulations
- Title(参考訳): 複雑な社会シミュレーションのためのオンラインキャリブレータとしての後部分布支援進化的動的最適化
- Authors: Peng Yang, Zhenhua Yang, Boquan Jiang, Chenkai Wang, Ke Tang, Xin Yao,
- Abstract要約: 複雑な社会システムのためのシミュレータの校正は、システムから観測されたターゲットデータに最もよく適合するシミュレータの出力を駆動する最適なパラメータを特定することを目的としている。
オンラインキャリブレーションは、環境力学のドライバとして観測データを明示的に取り入れている。
本研究では,パラメータと観測データの後方分布を明示的に学習し,既存の進化的動的最適化手法の変更検出と環境適応の両立を容易にすることを提案する。
- 参考スコア(独自算出の注目度): 13.662001414667996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The calibration of simulators for complex social systems aims to identify the optimal parameter that drives the output of the simulator best matching the target data observed from the system. As many social systems may change internally over time, calibration naturally becomes an online task, requiring parameters to be updated continuously to maintain the simulator's fidelity. In this work, the online setting is first formulated as a dynamic optimization problem (DOP), requiring the search for a sequence of optimal parameters that fit the simulator to real system changes. However, in contrast to traditional DOP formulations, online calibration explicitly incorporates the observational data as the driver of environmental dynamics. Due to this fundamental difference, existing Evolutionary Dynamic Optimization (EDO) methods, despite being extensively studied for black-box DOPs, are ill-equipped to handle such a scenario. As a result, online calibration problems constitute a new set of challenging DOPs. Here, we propose to explicitly learn the posterior distributions of the parameters and the observational data, thereby facilitating both change detection and environmental adaptation of existing EDOs for this scenario. We thus present a pretrained posterior model for implementation, and fine-tune it during the optimization. Extensive tests on both economic and financial simulators verify that the posterior distribution strongly promotes EDOs in such DOPs widely existed in social science.
- Abstract(参考訳): 複雑な社会システムのためのシミュレータの校正は、システムから観測されたターゲットデータに最もよく適合するシミュレータの出力を駆動する最適なパラメータを特定することを目的としている。
多くの社会システムが時間とともに内部的に変化するため、キャリブレーションは自然にオンラインのタスクとなり、シミュレータの忠実さを維持するためにパラメータを継続的に更新する必要がある。
本研究では、オンライン設定を動的最適化問題(DOP)として定式化し、シミュレータに実際のシステム変更に適合する最適なパラメータの列を探索する必要がある。
しかし、従来のDOPの定式化とは対照的に、オンラインキャリブレーションでは、環境力学のドライバとして観測データを明示的に取り入れている。
この根本的な違いのため、既存の進化的動的最適化(EDO)法はブラックボックスDOPに対して広く研究されているが、そのようなシナリオを扱うには不十分である。
その結果、オンラインキャリブレーションの問題は、新しいDOPの集合を構成する。
そこで本研究では,パラメータと観測データの後方分布を明示的に学習し,既存のEDOの変更検出と環境適応の両立を容易にすることを提案する。
そこで我々は,事前訓練した後続モデルを提案し,最適化時に微調整を行う。
経済・金融シミュレーターの徹底的な試験により、後部分布は社会科学において広く存在するDOPにおけるEDOを強く促進することが明らかとなった。
関連論文リスト
- Stabilizing Test-Time Adaptation of High-Dimensional Simulation Surrogates via D-Optimal Statistics [23.824598203175455]
TTA(Test-Time Adaptation)は、マシンラーニングサロゲートのトレーニングとデプロイの間の分散シフトを軽減する。
本稿では,最大情報量(D-Optimal)統計を格納するTTAフレームワークを提案する。
提案手法は, 計算コストの低減により, 最大7%のアウト・オブ・ディストリビューション改善が得られる。
論文 参考訳(メタデータ) (2026-02-17T18:55:18Z) - Online Adaptive Reinforcement Learning with Echo State Networks for Non-Stationary Dynamics [0.5745796568988237]
本稿では,Reservoir Computingに基づく強化学習のための軽量オンライン適応フレームワークを提案する。
具体的には,Echo State Networks (ESNs) を適応モジュールとして統合し,最近の観測履歴を潜在文脈表現にエンコードする。
厳しい環境変化を伴うCartPoleおよびHalfCheetahタスクに対する提案手法の評価を行った。
論文 参考訳(メタデータ) (2026-02-06T02:51:01Z) - Trainability-Oriented Hybrid Quantum Regression via Geometric Preconditioning and Curriculum Optimization [0.6445605125467574]
量子ニューラルネットワーク(QNN)は、科学的な機械学習への関心が高まっている。
レグレッション設定では、ノイズのある勾配の下でのトレーサビリティの制限や、不条件の最適化に悩まされることが多い。
本稿では、これらのボトルネックを軽減するために設計されたハイブリッド量子古典回帰フレームワークを提案する。
論文 参考訳(メタデータ) (2026-01-17T07:32:18Z) - Calibrating Agent-Based Financial Markets Simulators with Pretrainable Automatic Posterior Transformation-Based Surrogates [5.002657036975061]
エージェントベースモデル(ABM)は複雑な社会システムをシミュレーションするための重要な最適化問題である。
目的は、シミュレーションデータと実世界の観測との差を最小限に抑えて、与えられたABMの最適パラメータを特定することである。
既存の手法では,1) ABMの非線形だがマルチモーダルな性質のため,元の評価関数のサロゲートは困難であり,2) 一般的なサロゲートは複数のキャリブレーションタスク間で最適化経験を共有できない。
本研究は、負相関探索と適応信頼回帰を用いた自動後部変換を提案する。
論文 参考訳(メタデータ) (2026-01-11T14:05:26Z) - DAO-GP Drift Aware Online Non-Linear Regression Gaussian-Process [8.665001359628592]
現実世界のデータセットは、しばしば進化するデータ分布を特徴とする時間的ダイナミクスを示す。
コンセプトドリフトと呼ばれるこの現象を無視することは、モデルの予測精度を著しく低下させる。
Drift-Aware Online Process (GP) は、新規で、完全に適応的で、超自由で、スパースな非線形回帰モデルである。
論文 参考訳(メタデータ) (2025-12-09T18:12:38Z) - Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - Online Bayesian Experimental Design for Partially Observed Dynamical Systems [10.774974720491565]
本研究では,部分可観測性を持つ動的システムにおけるデータ収集を最適化するための基本的フレームワークを開発する。
我々のフレームワークは、部分観測可能性とオンライン推論の両方をうまく処理します。
論文 参考訳(メタデータ) (2025-11-06T14:29:05Z) - Efficient Transformed Gaussian Process State-Space Models for Non-Stationary High-Dimensional Dynamical Systems [49.819436680336786]
本研究では,高次元非定常力学系のスケーラブルかつ柔軟なモデリングのための効率的な変換ガウス過程状態空間モデル(ETGPSSM)を提案する。
具体的には、ETGPSSMは、単一の共有GPと入力依存の正規化フローを統合し、複雑な非定常遷移ダイナミクスを捉える前に、表現的な暗黙のプロセスを生成する。
ETGPSSMは、計算効率と精度の観点から、既存のGPSSMとニューラルネットワークベースのSSMより優れています。
論文 参考訳(メタデータ) (2025-03-24T03:19:45Z) - Self-Augmented Preference Optimization: Off-Policy Paradigms for Language Model Alignment [104.18002641195442]
既存のペアデータを必要としない、効果的でスケーラブルなトレーニングパラダイムである自己拡張型優先度最適化(SAPO)を導入する。
負の反応を自律的に生成するセルフプレイの概念に基づいて、我々はさらに、データ探索とエクスプロイトを強化するために、非政治的な学習パイプラインを組み込む。
論文 参考訳(メタデータ) (2024-05-31T14:21:04Z) - Bayesian Adaptive Calibration and Optimal Design [23.319315014843713]
現在の機械学習アプローチは、主に観測データで利用可能な固定された設計セットに対する再実行シミュレーションに依存している。
本稿では,バッチシーケンスプロセス内で最大情報化シミュレーションを実行するためのデータ効率アルゴリズムを提案する。
合成問題と実データ問題にまたがる関連手法と比較して,本手法の利点を示す。
論文 参考訳(メタデータ) (2024-05-23T11:14:35Z) - Parameter-Adaptive Approximate MPC: Tuning Neural-Network Controllers without Retraining [50.00291020618743]
この研究は、大規模なデータセットを再計算し、再トレーニングすることなくオンラインチューニングが可能な、新しいパラメータ適応型AMPCアーキテクチャを導入している。
資源制約の厳しいマイクロコントローラ(MCU)を用いた2種類の実カートポールシステムの揺らぎを制御し,パラメータ適応型AMPCの有効性を示す。
これらの貢献は、現実世界のシステムにおけるAMPCの実践的応用に向けた重要な一歩である。
論文 参考訳(メタデータ) (2024-04-08T20:02:19Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - On Controller Tuning with Time-Varying Bayesian Optimization [74.57758188038375]
制御対象とその変更に関する適切な事前知識を用いて、時間変化最適化(TVBO)を用いて、変更環境におけるコントローラのオンラインチューニングを行う。
本研究では,不確実性注入(UI)を用いたTVBO戦略を提案する。
我々のモデルはTVBOの最先端手法よりも優れており、後悔の軽減と不安定なパラメータ構成の低減を実現している。
論文 参考訳(メタデータ) (2022-07-22T14:54:13Z) - Logarithmic Regret Bound in Partially Observable Linear Dynamical
Systems [91.43582419264763]
部分的に観測可能な線形力学系におけるシステム同定と適応制御の問題について検討する。
開ループ系と閉ループ系の両方において有限時間保証付きの最初のモデル推定法を提案する。
AdaptOnは、未知の部分観測可能な線形力学系の適応制御において、$textpolylogleft(Tright)$ regretを達成する最初のアルゴリズムであることを示す。
論文 参考訳(メタデータ) (2020-03-25T06:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。