論文の概要: Achieving Optimal Tissue Repair Through MARL with Reward Shaping and Curriculum Learning
- arxiv url: http://arxiv.org/abs/2504.10677v1
- Date: Mon, 14 Apr 2025 19:57:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-24 08:32:19.425557
- Title: Achieving Optimal Tissue Repair Through MARL with Reward Shaping and Curriculum Learning
- Title(参考訳): Reward Shaping と Curriculum Learning を用いたMARLによる組織修復
- Authors: Muhammad Al-Zafar Khan, Jamal Al-Karaki,
- Abstract要約: バイオエージェントを用いた組織修復プロセスの最適化のための多エージェント強化学習フレームワークを提案する。
分子シグナリングをモデル化した反応拡散システム,(2)ヘビアン可塑性を用いた神経様電気化学通信,(3)化学勾配追跡,神経同期,堅牢なペナルティを組み合わせた生体情報報酬関数。
- 参考スコア(独自算出の注目度): 0.276240219662896
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we present a multi-agent reinforcement learning (MARL) framework for optimizing tissue repair processes using engineered biological agents. Our approach integrates: (1) stochastic reaction-diffusion systems modeling molecular signaling, (2) neural-like electrochemical communication with Hebbian plasticity, and (3) a biologically informed reward function combining chemical gradient tracking, neural synchronization, and robust penalties. A curriculum learning scheme guides the agent through progressively complex repair scenarios. In silico experiments demonstrate emergent repair strategies, including dynamic secretion control and spatial coordination.
- Abstract(参考訳): 本稿では, バイオエージェントを用いた組織修復プロセスの最適化のための多エージェント強化学習(MARL)フレームワークを提案する。
本手法は,(1)分子シグナルをモデル化した確率的反応拡散システム,(2)ヘビアン可塑性との神経様電気化学通信,(3)化学勾配追跡,神経同期,堅牢なペナルティを組み合わせた生体情報報酬機能を統合する。
カリキュラム学習スキームは、段階的に複雑な修理シナリオを通じてエージェントをガイドする。
サイリコ実験では、動的分泌制御や空間調整を含む創発的な修復戦略が示される。
関連論文リスト
- Interpretable Deep Learning for Polar Mechanistic Reaction Prediction [43.95903801494905]
PMechRP(Polar Mechanistic Reaction Predictor)は,PMechDBデータセット上で機械学習モデルをトレーニングするシステムである。
私たちは、トランスフォーマーベース、グラフベース、および2段階のシアムアーキテクチャを含む、さまざまな機械学習モデルの比較をトレーニングします。
私たちの最高のパフォーマンスのアプローチはハイブリッドモデルで、5アンサンブルのChemformerモデルと2ステップのSiameseフレームワークを組み合わせたものです。
論文 参考訳(メタデータ) (2025-04-22T02:31:23Z) - Improving Retrospective Language Agents via Joint Policy Gradient Optimization [57.35348425288859]
RetroActは、言語エージェントのタスク計画と自己反射進化機能を共同で最適化するフレームワークである。
模倣学習と強化学習を統合した2段階共同最適化プロセスを開発した。
RetroActはタスクのパフォーマンスと意思決定プロセスを大幅に改善しています。
論文 参考訳(メタデータ) (2025-03-03T12:54:54Z) - Multi-View Incremental Learning with Structured Hebbian Plasticity for Enhanced Fusion Efficiency [13.512920774125776]
MVILという名前のマルチビューインクリメンタルフレームワークは、シーケンシャルに到達したビューの微粒な融合をエミュレートすることを目的としている。
MVILは、構造的ヘビアン可塑性とシナプス分割学習の2つの基本モジュールがある。
6つのベンチマークデータセットの実験結果は、MVILの最先端手法に対する有効性を示している。
論文 参考訳(メタデータ) (2024-12-17T11:10:46Z) - Learning Chemical Reaction Representation with Reactant-Product Alignment [50.28123475356234]
RAlignは、様々な有機反応関連タスクのための新しい化学反応表現学習モデルである。
反応物質と生成物との原子対応を統合することにより、反応中に起こる分子変換を識別する。
モデルが重要な機能群に集中できるように,反応中心認識型アテンション機構を導入する。
論文 参考訳(メタデータ) (2024-11-26T17:41:44Z) - Neural CRNs: A Natural Implementation of Learning in Chemical Reaction Networks [0.0]
本稿では, マスアクション化学反応系における学習の効率的, 自律的, 汎用的な実装であるNeural CRNを提案する。
CRNは純粋にアナログな化学系であり、その化学種の濃度力学において神経計算を符号化する。
論文 参考訳(メタデータ) (2024-08-18T01:43:26Z) - MS-MANO: Enabling Hand Pose Tracking with Biomechanical Constraints [50.61346764110482]
筋骨格系と学習可能なパラメトリックハンドモデルMANOを統合し,MS-MANOを作成する。
このモデルは骨格系を駆動する筋肉と腱の力学をエミュレートし、結果として生じるトルク軌跡に生理学的に現実的な制約を与える。
また,マルチ層パーセプトロンネットワークによる初期推定ポーズを改良する,ループ式ポーズ改善フレームワークBioPRを提案する。
論文 参考訳(メタデータ) (2024-04-16T02:18:18Z) - Emergence of Chemotactic Strategies with Multi-Agent Reinforcement Learning [1.9253333342733674]
ケモタキシーの訓練において,強化学習が生物学的システムに対する洞察を与えることができるかどうかを検討する。
各種エージェントの形状,サイズ,水泳速度をシミュレーションし,生物学的水泳選手の身体的制約,すなわちブラウン運動が,強化学習者のトレーニングが失敗する地域につながるかどうかを判定する。
RLの薬剤は、物理的に可能であればすぐに遊泳でき、場合によっては、アクティブスイミングが環境を圧倒する前にも、遊泳が可能であることが判明した。
論文 参考訳(メタデータ) (2024-04-02T14:42:52Z) - Contrastive-Signal-Dependent Plasticity: Self-Supervised Learning in Spiking Neural Circuits [61.94533459151743]
この研究は、スパイキングネットワークのシナプスを調整するための神経生物学的に動機づけられたスキームを設計することの課題に対処する。
我々の実験シミュレーションは、繰り返しスパイクネットワークを訓練する際、他の生物学的に証明可能なアプローチに対して一貫した優位性を示す。
論文 参考訳(メタデータ) (2023-03-30T02:40:28Z) - Physics Informed Machine Learning for Chemistry Tabulation [5.368509527675853]
動的に生成するThemochemical State Variablesを組み込むため,ChemTabベースの定式化と実装を構築した。
このディープニューラルネットワークアーキテクチャの実装における課題について議論し、その性能を実験的に実証する。
論文 参考訳(メタデータ) (2022-11-06T04:24:38Z) - Investigation of Machine Learning-based Coarse-Grained Mapping Schemes
for Organic Molecules [0.0]
粗粒化(CG)により、異なるシステム解像度間のリンクを確立することができる。
本稿では,変分オートエンコーダに基づく機械学習戦略を適用し,適切なマッピング手法の開発について検討する。
論文 参考訳(メタデータ) (2022-09-26T18:30:51Z) - Efficient Model-based Multi-agent Reinforcement Learning via Optimistic
Equilibrium Computation [93.52573037053449]
H-MARL (Hallucinated Multi-Agent Reinforcement Learning) は,環境と数回交流した後の平衡政策を学習する。
自律運転シミュレーションベンチマークにおいて,本手法を実験的に実証した。
論文 参考訳(メタデータ) (2022-03-14T17:24:03Z) - Efficient Model-Based Multi-Agent Mean-Field Reinforcement Learning [89.31889875864599]
マルチエージェントシステムにおける学習に有効なモデルベース強化学習アルゴリズムを提案する。
我々の理論的な貢献は、MFCのモデルベース強化学習における最初の一般的な後悔の限界である。
コア最適化問題の実用的なパラメトリゼーションを提供する。
論文 参考訳(メタデータ) (2021-07-08T18:01:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。