論文の概要: Lifting DecPOMDPs for Nanoscale Systems -- A Work in Progress
- arxiv url: http://arxiv.org/abs/2110.09152v1
- Date: Mon, 18 Oct 2021 10:14:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-20 02:03:49.801470
- Title: Lifting DecPOMDPs for Nanoscale Systems -- A Work in Progress
- Title(参考訳): ナノスケールシステムのためのリフティングDecPOMDP -- 研究の進展
- Authors: Tanya Braun, Stefan Fischer, Florian Lau, Ralf M\"oller
- Abstract要約: DNAベースのナノネットは、特に医学分野において、幅広い有望なユースケースを持っている。
大規模なエージェントセット、部分的に観測可能な環境、ノイズの多い観測により、このようなナノスケールシステムは、分散化され、部分的に観測可能なマルコフ決定プロセス(DecPOMDP)としてモデル化することができる。
本報告では, (i) 昇降型DecPOMDPを提示し, エージェントセットを識別不能なエージェントセットに分割し, 最悪のケーススペースを削減し, (ii) ナノスケール医療システムを応用した。
- 参考スコア(独自算出の注目度): 3.775291916736883
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: DNA-based nanonetworks have a wide range of promising use cases, especially
in the field of medicine. With a large set of agents, a partially observable
stochastic environment, and noisy observations, such nanoscale systems can be
modelled as a decentralised, partially observable, Markov decision process
(DecPOMDP). As the agent set is a dominating factor, this paper presents (i)
lifted DecPOMDPs, partitioning the agent set into sets of indistinguishable
agents, reducing the worst-case space required, and (ii) a nanoscale medical
system as an application. Future work turns to solving and implementing lifted
DecPOMDPs.
- Abstract(参考訳): dnaベースのナノネットワークは、特に医学の分野で、幅広い有望なユースケースを持っている。
多数のエージェントセット、部分的に観測可能な確率的環境、そしてノイズの多い観測により、そのようなナノスケールシステムは分散化された部分観測可能なマルコフ決定過程(decpomdp)としてモデル化することができる。
エージェントセットが支配因子であるので、この論文は
i)DecPOMDPを持ち上げ、エージェントセットを識別不能なエージェントセットに分割し、最悪のケーススペースを減らし、
(ii)ナノスケール医療システムを応用すること。
今後の作業は、解き放たれたDecPOMDPの解決と実装に変わります。
関連論文リスト
- Factored Online Planning in Many-Agent POMDPs [8.728372851272727]
集中型マルチエージェントシステムでは、アクションと観測空間はエージェントの数とともに指数関数的に増加する。
我々はMPOMDPのためのサンプルベースオンラインプランナに重み付き粒子フィルタリングを導入する。
第三に、我々はその信念をスケーラブルに近似する。
論文 参考訳(メタデータ) (2023-12-18T18:35:30Z) - Learning Invariant Molecular Representation in Latent Discrete Space [52.13724532622099]
本稿では,分散シフトに対する不変性とロバスト性を示す分子表現を学習するための新しい枠組みを提案する。
我々のモデルは、様々な分布シフトが存在する場合に、最先端のベースラインに対してより強力な一般化を実現する。
論文 参考訳(メタデータ) (2023-10-22T04:06:44Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - Hierarchical Adaptation with Hypernetworks for Few-shot Molecular
Property Prediction [46.78908408923308]
マイクロショットMPP(HiMPP)のための新しい階層適応機構を提案する。
HiMPPは、数ショットのMPP問題において最先端のパフォーマンスを得る。
論文 参考訳(メタデータ) (2023-10-01T08:28:04Z) - Learning Individual Policies in Large Multi-agent Systems through Local
Variance Minimization [8.140037969280716]
多くのエージェントを持つマルチエージェントシステムでは、各エージェントの他のエージェントの価値への貢献は最小限である。
エージェントの値の分散を最小限に抑える新しいマルチエージェント強化学習(MARL)機構を提案する。
提案手法は, タクシー運転手の収益のばらつきを低減しつつ, 先行するアプローチよりも高いジョイント収益を提供できることを示す。
論文 参考訳(メタデータ) (2022-12-27T06:59:00Z) - A Novel Unified Conditional Score-based Generative Framework for
Multi-modal Medical Image Completion [54.512440195060584]
我々は、スコアベース生成モデル(SGM)を活用するために、統一多モードスコアベース生成モデル(UMM-CSGM)を提案する。
UMM-CSGMは、新しいマルチインマルチアウトコンディションスコアネットワーク(mm-CSN)を用いて、クロスモーダル条件分布の包括的集合を学習する。
BraTS19データセットの実験により、UMM-CSGMは腫瘍誘発病変における不均一な増強と不規則な領域をより確実に合成できることが示された。
論文 参考訳(メタデータ) (2022-07-07T16:57:21Z) - Multi-Agent Learning of Numerical Methods for Hyperbolic PDEs with
Factored Dec-MDP [2.62980689119077]
報酬の定式化は強化学習(RL)や行動クローニングにつながり,RL定式化の下ではすべてのエージェントに対して均質な政策が学べることを示した。
訓練されたエージェントは局所的な観察にのみ作用するため、マルチエージェントシステムは双曲型PDEの一般的な数値法として使用できる。
論文 参考訳(メタデータ) (2022-05-31T12:02:18Z) - Coupled and Uncoupled Dynamic Mode Decomposition in Multi-Compartmental
Systems with Applications to Epidemiological and Additive Manufacturing
Problems [58.720142291102135]
非線形問題に適用した場合,動的分解(DMD)は強力なツールである可能性が示唆された。
特に,Covid-19に対する連続遅延SIRDモデルに対する興味深い数値的応用を示す。
論文 参考訳(メタデータ) (2021-10-12T21:42:14Z) - Integrating Expert ODEs into Neural ODEs: Pharmacology and Disease
Progression [71.7560927415706]
潜在ハイブリッドモデル(LHM)は、専門家が設計したODEのシステムと機械学習したNeural ODEを統合し、システムのダイナミクスを完全に記述する。
新型コロナウイルス患者のLHMと実世界の集中治療データについて検討した。
論文 参考訳(メタデータ) (2021-06-05T11:42:45Z) - Permutation Invariant Policy Optimization for Mean-Field Multi-Agent
Reinforcement Learning: A Principled Approach [128.62787284435007]
本稿では,平均場近似ポリシ最適化(MF-PPO)アルゴリズムを提案する。
我々は,MF-PPOが収束のサブ線形速度で世界的最適政策を達成することを証明した。
特に、置換不変ニューラルアーキテクチャによって引き起こされる誘導バイアスは、MF-PPOが既存の競合より優れていることを示す。
論文 参考訳(メタデータ) (2021-05-18T04:35:41Z) - Evolving Nano Particle Cancer Treatments with Multiple Particle Types [0.0]
本稿では,癌腫瘍を標的としたナノ粒子ベースの薬物デリバリーシステムを設計する際の問題点について検討する。
複数のタイプのNPを利用することは、治療の複雑さが高いため、より効果的であることが期待されている。
この結果から,あらかじめ定義された計算予算の下で,進化的手法を用いて解空間を探索する場合,複数のタイプのNPを利用する方が効率的であることが示唆された。
論文 参考訳(メタデータ) (2020-11-10T08:46:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。