論文の概要: Combining Propositional Logic Based Decision Diagrams with Decision
Making in Urban Systems
- arxiv url: http://arxiv.org/abs/2011.04405v2
- Date: Tue, 10 Nov 2020 05:46:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:08:15.465741
- Title: Combining Propositional Logic Based Decision Diagrams with Decision
Making in Urban Systems
- Title(参考訳): 命題論理に基づく決定図と都市システムにおける意思決定の組み合わせ
- Authors: Jiajing Ling, Kushagra Chandak, Akshat Kumar
- Abstract要約: 我々は不確実性と部分的可観測性を考慮したマルチエージェントパスフィンディングの課題に取り組む。
我々は命題論理を用いて、RLの高速なシミュレーションを可能にするために、RLアルゴリズムとそれらを統合する。
- 参考スコア(独自算出の注目度): 10.781866671930851
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Solving multiagent problems can be an uphill task due to uncertainty in the
environment, partial observability, and scalability of the problem at hand.
Especially in an urban setting, there are more challenges since we also need to
maintain safety for all users while minimizing congestion of the agents as well
as their travel times. To this end, we tackle the problem of multiagent
pathfinding under uncertainty and partial observability where the agents are
tasked to move from their starting points to ending points while also
satisfying some constraints, e.g., low congestion, and model it as a multiagent
reinforcement learning problem. We compile the domain constraints using
propositional logic and integrate them with the RL algorithms to enable fast
simulation for RL.
- Abstract(参考訳): マルチエージェント問題の解決は, 環境の不確実性, 部分観測可能性, 今後の課題のスケーラビリティなどにより, 困難な課題となる。
特に都市部では,エージェントの混雑と移動時間を最小限に抑えながら,すべてのユーザに対する安全性を維持する必要があるため,より多くの課題がある。
本研究では,不確実性と部分的可観測性の下でのマルチエージェントパスフィンディングの問題に対処し,エージェントが出発点から終了点へ移動すると同時に,混雑度が低いなどの制約を満たし,マルチエージェント強化学習問題としてモデル化する。
我々は命題論理を用いてドメイン制約をコンパイルし、RLアルゴリズムと統合し、RLの高速なシミュレーションを可能にする。
関連論文リスト
- Weighted strategies to guide a multi-objective evolutionary algorithm
for multi-UAV mission planning [12.97430155510359]
この研究は、新しい個体の生成と突然変異のための重み付きランダム・ジェネレータを提案する。
この研究の主な目的は、マルチUAVミッション計画のためのMOEAソルバの収束率を下げることである。
論文 参考訳(メタデータ) (2024-02-28T23:05:27Z) - DePAint: A Decentralized Safe Multi-Agent Reinforcement Learning
Algorithm considering Peak and Average Constraints [1.2617078020344619]
本稿では分散環境でのマルチエージェントポリシー最適化の問題に対処する。
モーメントに基づく分散型政策勾配法であるDePaintを提案し,その解法を提案する。
私たちの知る限りでは、これは、ピークと平均的な制約の両方を考慮に入れた、プライバシ保護で完全に分散化されたマルチエージェント強化学習アルゴリズムとしては初めてのものです。
論文 参考訳(メタデータ) (2023-10-22T16:36:03Z) - Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。
モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。
本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文 参考訳(メタデータ) (2023-06-29T15:57:07Z) - Faith and Fate: Limits of Transformers on Compositionality [109.79516190693415]
3つの代表的構成課題にまたがる変圧器大言語モデルの限界について検討する。
これらのタスクは、問題をサブステップに分割し、これらのステップを正確な答えに合成する必要があります。
実験結果から,多段階合成推論を線形化部分グラフマッチングに還元することにより,トランスフォーマーLLMが構成課題を解くことが示唆された。
論文 参考訳(メタデータ) (2023-05-29T23:24:14Z) - On the Complexity of Multi-Agent Decision Making: From Learning in Games
to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。
本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。
マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文 参考訳(メタデータ) (2023-05-01T06:46:22Z) - DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in
Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。
本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。
ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文 参考訳(メタデータ) (2022-09-07T00:35:27Z) - Location-routing Optimisation for Urban Logistics Using Mobile Parcel
Locker Based on Hybrid Q-Learning Algorithm [0.0]
パーセルロッカー(MPL)は、交通渋滞と運用コストを低減する手段として、都市物流事業者によって導入されている。
本稿では,MPLのロケーションルーティング問題を解くための整数プログラミングモデルを提案する。
論文 参考訳(メタデータ) (2021-10-29T01:27:12Z) - Fast Decomposition of Temporal Logic Specifications for Heterogeneous
Teams [1.856334276134661]
我々は,大規模なマルチエージェントパス計画問題を,独立して解決・実行可能なより小さなサブプロブレムに分解することに注力する。
エージェントのミッションは、信号時間論理の断片であるCaTL(Capability Temporal Logic)公式として与えられる。
私たちが取っているアプローチは、時間論理仕様とエージェントのチームの両方を分解することです。
論文 参考訳(メタデータ) (2020-09-30T18:04:39Z) - Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot
Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。
このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。
すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文 参考訳(メタデータ) (2020-07-06T05:13:20Z) - Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal
Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。
都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文 参考訳(メタデータ) (2020-05-27T01:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。