論文の概要: Performance of a Markovian neural network versus dynamic programming on
a fishing control problem
- arxiv url: http://arxiv.org/abs/2109.06856v1
- Date: Tue, 14 Sep 2021 17:49:27 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-15 15:24:08.304321
- Title: Performance of a Markovian neural network versus dynamic programming on
a fishing control problem
- Title(参考訳): 漁獲制御問題におけるマルコフ型ニューラルネットワークと動的プログラミングの性能
- Authors: Mathieu Lauri\`ere and Gilles Pag\`es and Olivier Pironneau
- Abstract要約: 漁獲量は不快であるが、漁場の生産性を制御するのに効率的である。
一般的なモデルは、神経力学プログラミングやハミルトン・ヤコビ・ベルマンアルゴリズムが用いられるバイオマスの微分方程式を持つ。
動的プログラミングによって得られる解と,その解のマルコフ特性を保存するネットワークを用いて得られる解を比較する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fishing quotas are unpleasant but efficient to control the productivity of a
fishing site. A popular model has a stochastic differential equation for the
biomass on which a stochastic dynamic programming or a Hamilton-Jacobi-Bellman
algorithm can be used to find the stochastic control -- the fishing quota. We
compare the solutions obtained by dynamic programming against those obtained
with a neural network which preserves the Markov property of the solution. The
method is extended to a similar multi species model to check its robustness in
high dimension.
- Abstract(参考訳): 漁獲量は不快であるが、漁場の生産性を制御するのに効率的である。
一般的なモデルは、確率的動的計画法やハミルトン・ヤコビ・ベルマンアルゴリズムを用いて、漁獲量(英語版)の確率的制御を見つけることができるバイオマスに対する確率的微分方程式を持つ。
動的プログラミングによって得られる解と,解のマルコフ特性を保存するニューラルネットワークを用いて得られる解を比較する。
この手法は、高次元のロバスト性をチェックするために、類似の多種モデルに拡張される。
関連論文リスト
- Model-based Policy Optimization using Symbolic World Model [46.42871544295734]
ロボット工学における学習に基づく制御手法の適用は、大きな課題を呈している。
1つは、モデルなし強化学習アルゴリズムがサンプル効率の低い観測データを使用することである。
シンボリック回帰によって生成されるシンボリック表現による遷移ダイナミクスの近似を提案する。
論文 参考訳(メタデータ) (2024-07-18T13:49:21Z) - Deep multitask neural networks for solving some stochastic optimal
control problems [0.0]
本稿では,最適制御問題のクラスについて考察し,ニューラルネットワークを用いた効果的な解法を提案する。
マルチタスクニューラルネットワークをトレーニングするために,タスク間の学習を動的にバランスさせる新しいスキームを導入する。
実世界のデリバティブ価格問題に関する数値実験を通じて,本手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-01-23T17:20:48Z) - Pointer Networks with Q-Learning for Combinatorial Optimization [55.2480439325792]
我々は、モデルフリーQ値ポリシー近似をPointer Networks(Ptr-Nets)と統合したハイブリッドニューラルネットワークであるPointer Q-Network(PQN)を紹介する。
実験により,本手法の有効性を実証し,不安定な環境でモデルをテストする。
論文 参考訳(メタデータ) (2023-11-05T12:03:58Z) - Distributed Bayesian Learning of Dynamic States [65.7870637855531]
提案アルゴリズムは有限状態隠れマルコフモデルに対する分散ベイズフィルタタスクである。
逐次状態推定や、動的環境下でのソーシャルネットワーク上での意見形成のモデル化に使用できる。
論文 参考訳(メタデータ) (2022-12-05T19:40:17Z) - Multisymplectic Formulation of Deep Learning Using Mean--Field Type
Control and Nonlinear Stability of Training Algorithm [0.0]
我々は,マルチシンプレクティック構造を持つ流体力学系として,ディープニューラルネットワークのトレーニングを定式化する。
そのため、ディープニューラルネットワークは微分方程式を用いてモデル化され、平均場型制御を用いて学習する。
数値スキームは、多重シンプレクティック構造を持つ流体力学系の正確な解でもある近似解を生成する。
論文 参考訳(メタデータ) (2022-07-07T23:14:12Z) - Gone Fishing: Neural Active Learning with Fisher Embeddings [55.08537975896764]
ディープニューラルネットワークと互換性のあるアクティブな学習アルゴリズムの必要性が高まっている。
本稿では,ニューラルネットワークのための抽出可能かつ高性能な能動学習アルゴリズムBAITを紹介する。
論文 参考訳(メタデータ) (2021-06-17T17:26:31Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - AutoPruning for Deep Neural Network with Dynamic Channel Masking [28.018077874687343]
深層ニューラルネットワークのための学習に基づくオートプルーニングアルゴリズムを提案する。
まず、各層に対する重みと最良チャネルを目的とする2つの目的の問題を定式化する。
次に、最適なチャネル数と重みを同時に導出するために、別の最適化手法を提案する。
論文 参考訳(メタデータ) (2020-10-22T20:12:46Z) - Monotone operator equilibrium networks [97.86610752856987]
我々はモノトン作用素の理論に基づく新しい暗黙深度モデル、モノトン演算子平衡ネットワーク(monDEQ)を開発した。
暗黙的ネットワークの平衡点の発見と単調作用素分割問題の解法との密接な関係を示す。
次に、ネットワークのパラメータ化を開発し、全ての作用素が単調であり続けることを保証し、ユニークな平衡点の存在を保証する。
論文 参考訳(メタデータ) (2020-06-15T17:57:31Z) - Belief Propagation Reloaded: Learning BP-Layers for Labeling Problems [83.98774574197613]
最も単純な推論手法の1つとして、切り詰められた最大積のBelief伝播を取り上げ、それをディープラーニングモデルの適切なコンポーネントにするために必要となるものを加えます。
このBP-Layerは畳み込みニューラルネットワーク(CNN)の最終ブロックまたは中間ブロックとして使用できる
このモデルは様々な密集予測問題に適用可能であり、パラメータ効率が高く、ステレオ、光フロー、セマンティックセグメンテーションにおける堅牢な解を提供する。
論文 参考訳(メタデータ) (2020-03-13T13:11:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。