論文の概要: Lifting DecPOMDPs for Nanoscale Systems -- A Work in Progress
- arxiv url: http://arxiv.org/abs/2110.09152v1
- Date: Mon, 18 Oct 2021 10:14:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 02:03:49.801470
- Title: Lifting DecPOMDPs for Nanoscale Systems -- A Work in Progress
- Title(参考訳): ナノスケールシステムのためのリフティングDecPOMDP -- 研究の進展
- Authors: Tanya Braun, Stefan Fischer, Florian Lau, Ralf M\"oller
- Abstract要約: DNAベースのナノネットは、特に医学分野において、幅広い有望なユースケースを持っている。
大規模なエージェントセット、部分的に観測可能な環境、ノイズの多い観測により、このようなナノスケールシステムは、分散化され、部分的に観測可能なマルコフ決定プロセス(DecPOMDP)としてモデル化することができる。
本報告では, (i) 昇降型DecPOMDPを提示し, エージェントセットを識別不能なエージェントセットに分割し, 最悪のケーススペースを削減し, (ii) ナノスケール医療システムを応用した。
- 参考スコア(独自算出の注目度): 3.775291916736883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-based nanonetworks have a wide range of promising use cases, especially
in the field of medicine. With a large set of agents, a partially observable
stochastic environment, and noisy observations, such nanoscale systems can be
modelled as a decentralised, partially observable, Markov decision process
(DecPOMDP). As the agent set is a dominating factor, this paper presents (i)
lifted DecPOMDPs, partitioning the agent set into sets of indistinguishable
agents, reducing the worst-case space required, and (ii) a nanoscale medical
system as an application. Future work turns to solving and implementing lifted
DecPOMDPs.
- Abstract(参考訳): dnaベースのナノネットワークは、特に医学の分野で、幅広い有望なユースケースを持っている。
多数のエージェントセット、部分的に観測可能な確率的環境、そしてノイズの多い観測により、そのようなナノスケールシステムは分散化された部分観測可能なマルコフ決定過程(decpomdp)としてモデル化することができる。
エージェントセットが支配因子であるので、この論文は
i)DecPOMDPを持ち上げ、エージェントセットを識別不能なエージェントセットに分割し、最悪のケーススペースを減らし、
(ii)ナノスケール医療システムを応用すること。
今後の作業は、解き放たれたDecPOMDPの解決と実装に変わります。
関連論文リスト
- Enhancing Heterogeneous Multi-Agent Cooperation in Decentralized MARL via GNN-driven Intrinsic Rewards [1.179778723980276]
MARL(Multi-agent Reinforcement Learning)は、シーケンシャルな意思決定と制御タスクの鍵となるフレームワークである。
これらのシステムを現実のシナリオに展開するには、分散トレーニング、多様なエージェントセット、そして頻繁な環境報酬信号から学ぶ必要がある。
我々は,新しいグラフニューラルネットワーク(GNN)に基づく本質的なモチベーションを利用して,異種エージェントポリシーの学習を容易にするCoHetアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-08-12T21:38:40Z) - Computing Low-Entropy Couplings for Large-Support Distributions [53.00113867130712]
最小エントロピー結合は因果関係やステガノグラフィーなどの分野で応用されている。
既存のアルゴリズムは、大容量の分布に対して計算的に抽出可能であるか、特定の分布タイプに限定されている。
この研究は、事前の反復MECアプローチを一般化されたパーティションベースの形式主義に統一することにより、これらの制限に対処する。
論文 参考訳(メタデータ) (2024-05-29T21:54:51Z) - Diffusion models as probabilistic neural operators for recovering unobserved states of dynamical systems [49.2319247825857]
拡散に基づく生成モデルは、ニューラル演算子に好適な多くの特性を示す。
本稿では,複数のタスクに適応可能な単一モデルを,トレーニング中のタスク間で交互に学習することを提案する。
論文 参考訳(メタデータ) (2024-05-11T21:23:55Z) - Discovering intrinsic multi-compartment pharmacometric models using Physics Informed Neural Networks [0.0]
我々は、純粋にデータ駆動型ニューラルネットワークモデルであるPKINNを紹介する。
PKINNは、本質的なマルチコンパートメントベースの薬理学構造を効率的に発見し、モデル化する。
得られたモデルは、シンボリック回帰法によって解釈可能であり、説明可能である。
論文 参考訳(メタデータ) (2024-04-30T19:31:31Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Model-Free Learning and Optimal Policy Design in Multi-Agent MDPs Under Probabilistic Agent Dropout [4.949881799107061]
本研究では,マルチエージェント・マルコフ決定プロセス(MDP)について検討し,エージェント・ドロップアウトとポスト・ドロップアウトシステムに対するポリシーの計算を行う。
まず,1つのMDPで,期待されるポストドロップアウトシステムの価値を表現できることを示す。
さらに,モデルのない状況下では,ロバストなMDP値を,プリドロップアウトシステムによって生成されたサンプルで推定できることが示唆された。
論文 参考訳(メタデータ) (2023-04-24T21:29:41Z) - Learning Individual Policies in Large Multi-agent Systems through Local
Variance Minimization [8.140037969280716]
多くのエージェントを持つマルチエージェントシステムでは、各エージェントの他のエージェントの価値への貢献は最小限である。
エージェントの値の分散を最小限に抑える新しいマルチエージェント強化学習(MARL)機構を提案する。
提案手法は, タクシー運転手の収益のばらつきを低減しつつ, 先行するアプローチよりも高いジョイント収益を提供できることを示す。
論文 参考訳(メタデータ) (2022-12-27T06:59:00Z) - A Novel Unified Conditional Score-based Generative Framework for
Multi-modal Medical Image Completion [54.512440195060584]
我々は、スコアベース生成モデル(SGM)を活用するために、統一多モードスコアベース生成モデル(UMM-CSGM)を提案する。
UMM-CSGMは、新しいマルチインマルチアウトコンディションスコアネットワーク(mm-CSN)を用いて、クロスモーダル条件分布の包括的集合を学習する。
BraTS19データセットの実験により、UMM-CSGMは腫瘍誘発病変における不均一な増強と不規則な領域をより確実に合成できることが示された。
論文 参考訳(メタデータ) (2022-07-07T16:57:21Z) - Multi-Agent Learning of Numerical Methods for Hyperbolic PDEs with
Factored Dec-MDP [2.62980689119077]
報酬の定式化は強化学習(RL)や行動クローニングにつながり,RL定式化の下ではすべてのエージェントに対して均質な政策が学べることを示した。
訓練されたエージェントは局所的な観察にのみ作用するため、マルチエージェントシステムは双曲型PDEの一般的な数値法として使用できる。
論文 参考訳(メタデータ) (2022-05-31T12:02:18Z) - Coupled and Uncoupled Dynamic Mode Decomposition in Multi-Compartmental
Systems with Applications to Epidemiological and Additive Manufacturing
Problems [58.720142291102135]
非線形問題に適用した場合,動的分解(DMD)は強力なツールである可能性が示唆された。
特に,Covid-19に対する連続遅延SIRDモデルに対する興味深い数値的応用を示す。
論文 参考訳(メタデータ) (2021-10-12T21:42:14Z) - Integrating Expert ODEs into Neural ODEs: Pharmacology and Disease
Progression [71.7560927415706]
潜在ハイブリッドモデル(LHM)は、専門家が設計したODEのシステムと機械学習したNeural ODEを統合し、システムのダイナミクスを完全に記述する。
新型コロナウイルス患者のLHMと実世界の集中治療データについて検討した。
論文 参考訳(メタデータ) (2021-06-05T11:42:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。