論文の概要: Nash Neural Networks : Inferring Utilities from Optimal Behaviour
- arxiv url: http://arxiv.org/abs/2203.13432v1
- Date: Fri, 25 Mar 2022 03:26:22 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-28 14:38:53.040451
- Title: Nash Neural Networks : Inferring Utilities from Optimal Behaviour
- Title(参考訳): nashニューラルネットワーク : 最適行動からユーティリティを推測する
- Authors: John J. Molina, Simon K. Schnyder, Matthew S. Turner, Ryoichi Yamamoto
- Abstract要約: 我々は新しいタイプの物理情報ニューラルネットワークとしてナッシュニューラルネットワーク(N3$)を提案する。
我々は、集団と個人の両方のダイナミクスが知られているが、特定の状態にある単位時間当たりのコストを特定するペイオフ関数は知られていないと仮定する。
我々は、パンデミックの状況や感染コストに応じて、個人が社会的に離れた場所を選ぶことのできる、流行時の最適な行動を研究するために、N3ドルを適用した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We propose Nash Neural Networks ($N^3$) as a new type of Physics Informed
Neural Network that is able to infer the underlying utility from observations
of how rational individuals behave in a differential game with a Nash
equilibrium. We assume that the dynamics for both the population and the
individual are known, but not the payoff function, which specifies the cost per
unit time of being in any particular state. We construct our network in such a
way that the Euler-Lagrange equations of the corresponding optimal control
problem are satisfied and the optimal control is self-consistently determined.
In this way, we are able to learn the unknown payoff function in an
unsupervised manner. We have applied the $N^3$ to study the optimal behaviour
during epidemics, in which individuals can choose to socially distance
depending on the state of the pandemic and the cost of being infected. Training
our network against synthetic data for a simple SIR model, we showed that it is
possible to accurately reproduce the hidden payoff function, in such a way that
the game dynamics are respected. Our approach will have far-reaching
applications, as it allows one to infer utilities from behavioural data, and
can thus be applied to study a wide array of problems in science, engineering,
economics and government planning.
- Abstract(参考訳): 我々は,Nash平衡を持つ差分ゲームにおいて,理性的な個人がどのように振る舞うかを観察し,基礎となる有用性を推定できる物理情報ニューラルネットワークの新たなタイプとして,ナッシュニューラルネットワーク(N^3$)を提案する。
我々は、集団と個人の両方のダイナミクスが知られているが、特定の状態にある単位時間当たりのコストを特定するペイオフ関数は知られていないと仮定する。
我々は,対応する最適制御問題のオイラー・ラグランジュ方程式を満たし,最適制御を自己整合的に決定するようにネットワークを構築する。
このようにして、未知のペイオフ関数を教師なしの方法で学習することができる。
我々はこのN^3$を、感染状況や感染コストに応じて個人が社会的距離を選択できる流行時の最適な行動の研究に応用した。
単純なsirモデルのための合成データに対してネットワークをトレーニングした結果,ゲームダイナミクスが尊重されるように,隠れたペイオフ関数を正確に再現することが可能であった。
当社のアプローチは,行動データからユーティリティを推定し,科学,工学,経済学,政府の計画における幅広い問題の研究に応用できるため,広範囲の応用が期待できる。
関連論文リスト
- Deep multitask neural networks for solving some stochastic optimal
control problems [0.0]
本稿では,最適制御問題のクラスについて考察し,ニューラルネットワークを用いた効果的な解法を提案する。
マルチタスクニューラルネットワークをトレーニングするために,タスク間の学習を動的にバランスさせる新しいスキームを導入する。
実世界のデリバティブ価格問題に関する数値実験を通じて,本手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-01-23T17:20:48Z) - Deep Neural Networks Tend To Extrapolate Predictably [56.04573160453392]
ニューラルネットワークの予測は、アウト・オブ・ディストリビューション(OOD)入力に直面した場合、予測不可能で過信される傾向がある。
我々は、入力データがOODになるにつれて、ニューラルネットワークの予測が一定値に向かう傾向があることを観察する。
我々は、OOD入力の存在下でリスクに敏感な意思決定を可能にするために、私たちの洞察を実際に活用する方法を示します。
論文 参考訳(メタデータ) (2023-10-02T03:25:32Z) - Stochastic Delay Differential Games: Financial Modeling and Machine
Learning Algorithms [3.222802562733787]
深層学習による遅延差分ゲームの閉ループナッシュ平衡を求める数値手法を提案する。
これらのゲームは、マルチエージェント相互作用と遅延効果がモデルでしばしば望まれる特徴である金融と経済学で広く使われている。
論文 参考訳(メタデータ) (2023-07-12T21:02:45Z) - Human Trajectory Forecasting with Explainable Behavioral Uncertainty [63.62824628085961]
人間の軌道予測は人間の行動を理解し予測し、社会ロボットから自動運転車への応用を可能にする。
モデルフリー手法は予測精度が優れているが説明可能性に欠ける一方、モデルベース手法は説明可能性を提供するが、よく予測できない。
BNSP-SFMは,11種類の最先端手法と比較して,予測精度を最大50%向上することを示す。
論文 参考訳(メタデータ) (2023-07-04T16:45:21Z) - Normalization effects on deep neural networks [20.48472873675696]
ニューラルネットワークの出力の統計的挙動に対する$gamma_i$の選択の影響について検討する。
ニューラルネットワークの出力とテスト精度のばらつきの観点からは、$gamma_i$sを1にすることを選択すべきである。
論文 参考訳(メタデータ) (2022-09-02T17:05:55Z) - LordNet: Learning to Solve Parametric Partial Differential Equations
without Simulated Data [63.55861160124684]
本稿では,離散化されたPDEによって構築された平均2乗残差(MSR)損失から,ニューラルネットワークが直接物理を学習する一般データ自由パラダイムを提案する。
具体的には,低ランク分解ネットワーク(LordNet)を提案する。
Poisson方程式とNavier-Stokes方程式を解く実験は、MSR損失による物理的制約がニューラルネットワークの精度と能力を向上させることを実証している。
論文 参考訳(メタデータ) (2022-06-19T14:41:08Z) - EINNs: Epidemiologically-Informed Neural Networks [75.34199997857341]
本稿では,疫病予測のための新しい物理インフォームドニューラルネットワークEINNを紹介する。
メカニスティックモデルによって提供される理論的柔軟性と、AIモデルによって提供されるデータ駆動表現性の両方を活用する方法について検討する。
論文 参考訳(メタデータ) (2022-02-21T18:59:03Z) - Neural Capacitance: A New Perspective of Neural Network Selection via
Edge Dynamics [85.31710759801705]
現在の実践は、性能予測のためのモデルトレーニングにおいて高価な計算コストを必要とする。
本稿では,学習中のシナプス接続(エッジ)上の制御ダイナミクスを解析し,ニューラルネットワーク選択のための新しいフレームワークを提案する。
我々のフレームワークは、ニューラルネットワークトレーニング中のバックプロパゲーションがシナプス接続の動的進化と等価であるという事実に基づいて構築されている。
論文 参考訳(メタデータ) (2022-01-11T20:53:15Z) - Optimal Stopping via Randomized Neural Networks [6.677219861416146]
本稿では、標準基底関数やディープニューラルネットワークの代わりにランダム化されたニューラルネットワークを使用することの利点について述べる。
我々のアプローチは、既存のアプローチがますます非現実的になるような高次元問題に適用できる。
いずれにせよ、我々のアルゴリズムは、最先端や他の関連する機械学習アプローチよりも時間的に優れている。
論文 参考訳(メタデータ) (2021-04-28T09:47:21Z) - Conditional physics informed neural networks [85.48030573849712]
固有値問題のクラス解を推定するための条件付きPINN(物理情報ニューラルネットワーク)を紹介します。
一つのディープニューラルネットワークが、問題全体に対する偏微分方程式の解を学習できることが示される。
論文 参考訳(メタデータ) (2021-04-06T18:29:14Z) - Interpretable Neural Networks for Panel Data Analysis in Economics [10.57079240576682]
本稿では,高い予測精度と解釈可能性の両方を達成可能な,解釈可能なニューラルネットワークモデルのクラスを提案する。
高次元の行政データを用いて、個人の月間雇用状況を予測するモデルを適用した。
テストセットの精度は94.5%で、従来の機械学習手法に匹敵する。
論文 参考訳(メタデータ) (2020-10-11T18:40:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。