論文の概要: Combining Propositional Logic Based Decision Diagrams with Decision
Making in Urban Systems
- arxiv url: http://arxiv.org/abs/2011.04405v2
- Date: Tue, 10 Nov 2020 05:46:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:08:15.465741
- Title: Combining Propositional Logic Based Decision Diagrams with Decision
Making in Urban Systems
- Title(参考訳): 命題論理に基づく決定図と都市システムにおける意思決定の組み合わせ
- Authors: Jiajing Ling, Kushagra Chandak, Akshat Kumar
- Abstract要約: 我々は不確実性と部分的可観測性を考慮したマルチエージェントパスフィンディングの課題に取り組む。
我々は命題論理を用いて、RLの高速なシミュレーションを可能にするために、RLアルゴリズムとそれらを統合する。
- 参考スコア(独自算出の注目度): 10.781866671930851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving multiagent problems can be an uphill task due to uncertainty in the
environment, partial observability, and scalability of the problem at hand.
Especially in an urban setting, there are more challenges since we also need to
maintain safety for all users while minimizing congestion of the agents as well
as their travel times. To this end, we tackle the problem of multiagent
pathfinding under uncertainty and partial observability where the agents are
tasked to move from their starting points to ending points while also
satisfying some constraints, e.g., low congestion, and model it as a multiagent
reinforcement learning problem. We compile the domain constraints using
propositional logic and integrate them with the RL algorithms to enable fast
simulation for RL.
- Abstract(参考訳): マルチエージェント問題の解決は, 環境の不確実性, 部分観測可能性, 今後の課題のスケーラビリティなどにより, 困難な課題となる。
特に都市部では,エージェントの混雑と移動時間を最小限に抑えながら,すべてのユーザに対する安全性を維持する必要があるため,より多くの課題がある。
本研究では,不確実性と部分的可観測性の下でのマルチエージェントパスフィンディングの問題に対処し,エージェントが出発点から終了点へ移動すると同時に,混雑度が低いなどの制約を満たし,マルチエージェント強化学習問題としてモデル化する。
我々は命題論理を用いてドメイン制約をコンパイルし、RLアルゴリズムと統合し、RLの高速なシミュレーションを可能にする。
関連論文リスト
- Agentic LLMs in the Supply Chain: Towards Autonomous Multi-Agent Consensus-Seeking [39.373512037111155]
大規模言語モデル(LLM)はサプライチェーン管理(SCM)におけるコンセンサス検索を自動化する
従来のSCMは、ブルウィップ効果のような創発的な問題を避けるために、意思決定における人間のコンセンサスに依存している。
ジェネレーティブAI、特にLLMの最近の進歩は、これらの障壁を克服する約束を示している。
論文 参考訳(メタデータ) (2024-11-15T13:33:10Z) - DePAint: A Decentralized Safe Multi-Agent Reinforcement Learning Algorithm considering Peak and Average Constraints [1.1549572298362787]
本稿では,この問題を解決するために,モーメントに基づく分散勾配法DePaintを提案する。
これは、ピーク制約と平均制約の両方を考慮した、プライバシ保存で完全に分散化されたマルチエージェント強化学習アルゴリズムとしては初めてのものである。
論文 参考訳(メタデータ) (2023-10-22T16:36:03Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Faith and Fate: Limits of Transformers on Compositionality [109.79516190693415]
3つの代表的構成課題にまたがる変圧器大言語モデルの限界について検討する。
これらのタスクは、問題をサブステップに分割し、これらのステップを正確な答えに合成する必要があります。
実験結果から,多段階合成推論を線形化部分グラフマッチングに還元することにより,トランスフォーマーLLMが構成課題を解くことが示唆された。
論文 参考訳(メタデータ) (2023-05-29T23:24:14Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Location-routing Optimisation for Urban Logistics Using Mobile Parcel
Locker Based on Hybrid Q-Learning Algorithm [0.0]
パーセルロッカー(MPL)は、交通渋滞と運用コストを低減する手段として、都市物流事業者によって導入されている。
本稿では,MPLのロケーションルーティング問題を解くための整数プログラミングモデルを提案する。
論文 参考訳(メタデータ) (2021-10-29T01:27:12Z) - Fast Decomposition of Temporal Logic Specifications for Heterogeneous
Teams [1.856334276134661]
我々は,大規模なマルチエージェントパス計画問題を,独立して解決・実行可能なより小さなサブプロブレムに分解することに注力する。
エージェントのミッションは、信号時間論理の断片であるCaTL(Capability Temporal Logic)公式として与えられる。
私たちが取っているアプローチは、時間論理仕様とエージェントのチームの両方を分解することです。
論文 参考訳(メタデータ) (2020-09-30T18:04:39Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。