論文の概要: Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement
- arxiv url: http://arxiv.org/abs/2211.00801v1
- Date: Wed, 2 Nov 2022 00:41:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-03 12:42:58.169612
- Title: Multi-Agent Reinforcement Learning for Adaptive Mesh Refinement
- Title(参考訳): 適応メッシュ微細化のためのマルチエージェント強化学習
- Authors: Jiachen Yang, Ketan Mittal, Tarik Dzanic, Socratis Petrides, Brendan
Keith, Brenden Petersen, Daniel Faissol, Robert Anderson
- Abstract要約: 完全協調型マルコフゲームとしてアダプティブメッシュリファインメント(AMR)の新たな定式化を提案する。
VDGN(Value Decomposition Graph Network)と呼ばれる新しい深層マルチエージェント強化学習アルゴリズムを設計する。
VDGNポリシは,グローバルエラーおよびコスト指標において,エラーしきい値に基づくポリシよりも大幅に優れていることを示す。
- 参考スコア(独自算出の注目度): 17.72127385405445
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Adaptive mesh refinement (AMR) is necessary for efficient finite element
simulations of complex physical phenomenon, as it allocates limited
computational budget based on the need for higher or lower resolution, which
varies over space and time. We present a novel formulation of AMR as a
fully-cooperative Markov game, in which each element is an independent agent
who makes refinement and de-refinement choices based on local information. We
design a novel deep multi-agent reinforcement learning (MARL) algorithm called
Value Decomposition Graph Network (VDGN), which solves the two core challenges
that AMR poses for MARL: posthumous credit assignment due to agent creation and
deletion, and unstructured observations due to the diversity of mesh
geometries. For the first time, we show that MARL enables anticipatory
refinement of regions that will encounter complex features at future times,
thereby unlocking entirely new regions of the error-cost objective landscape
that are inaccessible by traditional methods based on local error estimators.
Comprehensive experiments show that VDGN policies significantly outperform
error threshold-based policies in global error and cost metrics. We show that
learned policies generalize to test problems with physical features, mesh
geometries, and longer simulation times that were not seen in training. We also
extend VDGN with multi-objective optimization capabilities to find the Pareto
front of the tradeoff between cost and error.
- Abstract(参考訳): アダプティブメッシュ改良(Adaptive Mesh refinement, AMR)は、複雑な物理現象の効率的な有限要素シミュレーションに必要であり、空間や時間によって変化する高解像度または低解像度の必要性に基づいて、限られた計算予算を割り当てる。
本稿では,AMRを完全協調型マルコフゲームとして定式化し,各要素が局所情報に基づいて洗練・縮小の選択を行う独立したエージェントであることを示す。
本稿では,AMRがMARLにもたらす2つのコア課題,すなわちエージェントの生成と削除による没後クレジット割り当て,メッシュの多様性による非構造化観測を解くことを目的とした,新しい深層マルチエージェント強化学習(MARL)アルゴリズムであるValue Decomposition Graph Network(VDGN)を設計する。
今回我々は, marl が将来複雑な特徴に遭遇する領域の予測的改良を可能にし, 局所的誤り推定子に基づく従来の手法では利用できない誤差コスト目標の全く新しい領域を解き放つことを初めて示す。
総合的な実験により、VDGNポリシーはグローバルエラーおよびコストメトリクスにおいてエラーしきい値に基づくポリシーを大幅に上回ることが示された。
学習政策は,物理的特徴やメッシュジオメトリ,トレーニングで見られない長いシミュレーション時間などの問題に対して一般化する。
また、VDGNを多目的最適化機能で拡張し、コストとエラーのトレードオフのParetoフロントを見つける。
関連論文リスト
- Feature Attenuation of Defective Representation Can Resolve Incomplete Masking on Anomaly Detection [1.0358639819750703]
教師なし異常検出(UAD)研究では、計算効率が高くスケーラブルなソリューションを開発する必要がある。
再建・塗り替えのアプローチを再考し、強みと弱みを分析して改善する。
異常再構成の特徴情報を減衰させる2つの層のみを用いるFADeR(Feature Attenuation of Defective Representation)を提案する。
論文 参考訳(メタデータ) (2024-07-05T15:44:53Z) - Rotated Multi-Scale Interaction Network for Referring Remote Sensing Image Segmentation [63.15257949821558]
Referring Remote Sensing Image (RRSIS)は、コンピュータビジョンと自然言語処理を組み合わせた新しい課題である。
従来の参照画像(RIS)アプローチは、空中画像に見られる複雑な空間スケールと向きによって妨げられている。
本稿ではRMSIN(Rotated Multi-Scale Interaction Network)を紹介する。
論文 参考訳(メタデータ) (2023-12-19T08:14:14Z) - Spatial Attention-based Distribution Integration Network for Human Pose
Estimation [0.8052382324386398]
本研究では,空間アテンションに基づく分布統合ネットワーク(SADI-NET)を提案する。
我々のネットワークは、受容強化モジュール(RFM)、空間融合モジュール(SFM)、分散学習モジュール(DLM)の3つの効率的なモデルで構成されている。
我々のモデルは、MPIIテストデータセットで920.10%の精度を得、既存のモデルよりも大幅に改善され、最先端のパフォーマンスが確立された。
論文 参考訳(メタデータ) (2023-11-09T12:43:01Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Deep Reinforcement Learning for Adaptive Mesh Refinement [0.9281671380673306]
我々は数値シミュレーションから直接AMR戦略のポリシーネットワークを訓練する。
トレーニング過程は、偏微分方程式に対する厳密な解や高忠実な基底真理を必要としない。
深層強化学習政策は、一般的なAMRと競合し、問題クラス全体にわたってうまく一般化し、精度とコストのバランスが良好であることを示す。
論文 参考訳(メタデータ) (2022-09-25T23:45:34Z) - Multi-Agent Reinforcement Learning via Adaptive Kalman Temporal
Difference and Successor Representation [32.80370188601152]
本稿では,マルチエージェント適応カルマン時間差分(MAK-TD)フレームワークとその継承表現に基づく変種(MAK-SR)を提案する。
提案するMAK-TD/SRフレームワークは,高次元マルチエージェント環境に関連付けられたアクション空間の連続的な性質を考察する。
論文 参考訳(メタデータ) (2021-12-30T18:21:53Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z) - Unsupervised and self-adaptative techniques for cross-domain person
re-identification [82.54691433502335]
非重複カメラにおける人物再識別(ReID)は難しい課題である。
Unsupervised Domain Adaptation(UDA)は、ソースで訓練されたモデルから、IDラベルアノテーションなしでターゲットドメインへの機能学習適応を実行するため、有望な代替手段です。
本稿では,新しいオフライン戦略によって生成されたサンプルのトリプレットを利用する,UDAベースのReID手法を提案する。
論文 参考訳(メタデータ) (2021-03-21T23:58:39Z) - Reinforcement Learning for Adaptive Mesh Refinement [63.7867809197671]
マルコフ決定過程としてのAMRの新規な定式化を提案し,シミュレーションから直接改良政策を訓練するために深部強化学習を適用した。
これらのポリシーアーキテクチャのモデルサイズはメッシュサイズに依存しないため、任意に大きく複雑なシミュレーションにスケールします。
論文 参考訳(メタデータ) (2021-03-01T22:55:48Z) - Unsupervised Domain Adaptation in Person re-ID via k-Reciprocal
Clustering and Large-Scale Heterogeneous Environment Synthesis [76.46004354572956]
個人再識別のための教師なし領域適応手法を提案する。
実験結果から,ktCUDA法とSHRED法は,再同定性能において,+5.7 mAPの平均的改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-01-14T17:43:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。