Fugu-MT 論文翻訳(概要): Combining Propositional Logic Based Decision Diagrams with Decision Making in Urban Systems

論文の概要: Combining Propositional Logic Based Decision Diagrams with Decision Making in Urban Systems

arxiv url: http://arxiv.org/abs/2011.04405v2
Date: Tue, 10 Nov 2020 05:46:56 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-28 01:08:15.465741
Title: Combining Propositional Logic Based Decision Diagrams with Decision Making in Urban Systems
Title（参考訳）: 命題論理に基づく決定図と都市システムにおける意思決定の組み合わせ
Authors: Jiajing Ling, Kushagra Chandak, Akshat Kumar
Abstract要約: 我々は不確実性と部分的可観測性を考慮したマルチエージェントパスフィンディングの課題に取り組む。我々は命題論理を用いて、RLの高速なシミュレーションを可能にするために、RLアルゴリズムとそれらを統合する。
参考スコア（独自算出の注目度）: 10.781866671930851
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Solving multiagent problems can be an uphill task due to uncertainty in the environment, partial observability, and scalability of the problem at hand. Especially in an urban setting, there are more challenges since we also need to maintain safety for all users while minimizing congestion of the agents as well as their travel times. To this end, we tackle the problem of multiagent pathfinding under uncertainty and partial observability where the agents are tasked to move from their starting points to ending points while also satisfying some constraints, e.g., low congestion, and model it as a multiagent reinforcement learning problem. We compile the domain constraints using propositional logic and integrate them with the RL algorithms to enable fast simulation for RL.
Abstract（参考訳）: マルチエージェント問題の解決は, 環境の不確実性, 部分観測可能性, 今後の課題のスケーラビリティなどにより, 困難な課題となる。特に都市部では,エージェントの混雑と移動時間を最小限に抑えながら,すべてのユーザに対する安全性を維持する必要があるため,より多くの課題がある。本研究では,不確実性と部分的可観測性の下でのマルチエージェントパスフィンディングの問題に対処し,エージェントが出発点から終了点へ移動すると同時に,混雑度が低いなどの制約を満たし,マルチエージェント強化学習問題としてモデル化する。我々は命題論理を用いてドメイン制約をコンパイルし、RLアルゴリズムと統合し、RLの高速なシミュレーションを可能にする。

関連論文リスト

Solving Multi-Agent Multi-Goal Path Finding Problems in Polynomial Time [1.7006003864727406]
我々は、グリッドのような無向グラフにおけるエージェントの群れのためのミッションを、複数の目標で計画している。通常のマルチエージェントパスフィニングとは対照的に、ソルバはエージェントに目標の割り当てを独自に見つけて更新する。
論文参考訳（メタデータ） (2025-12-17T15:24:20Z)
An Agentic Framework with LLMs for Solving Complex Vehicle Routing Problems [66.60904891478687]
複雑な車両ルーティング問題を解決するために,LLM (AFL) を用いたエージェントフレームワークを提案する。 AFLは生の入力から知識を直接抽出し、自己完結型コード生成を可能にする。 AFLは、コード信頼性とソリューション実現性の両方において、既存のLCMベースのベースラインを大幅に上回っていることを示す。
論文参考訳（メタデータ） (2025-10-19T03:59:25Z)
Rich Vehicle Routing Problem in Disaster Management enabling Temporally-causal Transhipments across Multi-Modal Transportation Network [1.1470070927586018]
地理的に分散した車両基地に複数台の異種車両を配置し、異なる交通手段を利用できるような、豊富な車両経路問題も検討されている。この問題は、車両経路の等間隔を最小化することで災害応答時間を最適化する現実的な要件から生じる。提案手法の優位性は,Mixed-Integer Linear Programmingの定式化によって実証された。
論文参考訳（メタデータ） (2025-09-16T16:37:18Z)
AgentGym-RL: Training LLM Agents for Long-Horizon Decision Making through Multi-Turn Reinforcement Learning [129.44038804430542]
本稿では,マルチターン対話型意思決定のためのLLMエージェントをRLで学習する新しいフレームワークであるAgentGym-RLを紹介する。本研究では,探索-探索バランスと安定したRL最適化のためのトレーニング手法であるScalingInter-RLを提案する。当社のエージェントは、さまざまな環境にまたがる27のタスクで、商用モデルにマッチするか、超えています。
論文参考訳（メタデータ） (2025-09-10T16:46:11Z)
Reinforcement learning with combinatorial actions for coupled restless bandits [62.89013331120493]
提案するSEQUOIAは,動作空間に対する長期報酬を直接最適化するRLアルゴリズムである。我々は,複数介入,経路制約,二部間マッチング,容量制約という,制約を伴う4つの新しいレスレス・バンディット問題に対して,SEQUOIAを実証的に検証した。
論文参考訳（メタデータ） (2025-03-01T21:25:21Z)
A Multiagent Path Search Algorithm for Large-Scale Coalition Structure Generation [61.08720171136229]
結合構造生成はマルチエージェントシステムにおける基本的な計算問題である。我々はCSGの多エージェントパス探索アルゴリズムであるSALDAEを開発し、連立構造グラフ上で運用する。
論文参考訳（メタデータ） (2025-02-14T15:21:27Z)
Agentic LLMs in the Supply Chain: Towards Autonomous Multi-Agent Consensus-Seeking [39.373512037111155]
大規模言語モデル(LLM)はサプライチェーン管理(SCM)におけるコンセンサス検索を自動化する従来のSCMは、ブルウィップ効果のような創発的な問題を避けるために、意思決定における人間のコンセンサスに依存している。ジェネレーティブAI、特にLLMの最近の進歩は、これらの障壁を克服する約束を示している。
論文参考訳（メタデータ） (2024-11-15T13:33:10Z)
TOP-Former: A Multi-Agent Transformer Approach for the Team Orienteering Problem [47.40841984849682]
車両群のためのルートプランニングは、荷物の配送、監視、輸送といった応用において重要な課題である。 ToP-Formerは、チームのオリエンテーリング問題を効率的に正確に解くために設計されたマルチエージェント経路計画ニューラルネットワークである。
論文参考訳（メタデータ） (2023-11-30T16:10:35Z)
DePAint: A Decentralized Safe Multi-Agent Reinforcement Learning Algorithm considering Peak and Average Constraints [1.1549572298362787]
本稿では,この問題を解決するために,モーメントに基づく分散勾配法DePaintを提案する。これは、ピーク制約と平均制約の両方を考慮した、プライバシ保存で完全に分散化されたマルチエージェント強化学習アルゴリズムとしては初めてのものである。
論文参考訳（メタデータ） (2023-10-22T16:36:03Z)
Safe Model-Based Multi-Agent Mean-Field Reinforcement Learning [48.667697255912614]
平均場強化学習は、同一エージェントの無限集団と相互作用する代表エージェントのポリシーに対処する。モデルベースの平均場強化学習アルゴリズムであるSafe-M$3$-UCRLを提案する。本アルゴリズムは,低需要領域におけるサービスアクセシビリティを確保しつつ,重要な領域における需要を効果的に満たす。
論文参考訳（メタデータ） (2023-06-29T15:57:07Z)
Faith and Fate: Limits of Transformers on Compositionality [109.79516190693415]
3つの代表的構成課題にまたがる変圧器大言語モデルの限界について検討する。これらのタスクは、問題をサブステップに分割し、これらのステップを正確な答えに合成する必要があります。実験結果から,多段階合成推論を線形化部分グラフマッチングに還元することにより,トランスフォーマーLLMが構成課題を解くことが示唆された。
論文参考訳（メタデータ） (2023-05-29T23:24:14Z)
On the Complexity of Multi-Agent Decision Making: From Learning in Games to Partial Monitoring [105.13668993076801]
マルチエージェント強化学習(MARL)理論における中心的な問題は、構造条件やアルゴリズムの原理がサンプル効率の学習保証につながるかを理解することである。本稿では,複数のエージェントを用いた対話型意思決定のための一般的な枠組みとして,この問題について考察する。マルチエージェント意思決定における統計的複雑性を特徴付けることは、単一エージェント決定の統計的複雑性を特徴付けることと等価であることを示す。
論文参考訳（メタデータ） (2023-05-01T06:46:22Z)
DC-MRTA: Decentralized Multi-Robot Task Allocation and Navigation in Complex Environments [55.204450019073036]
本稿では,倉庫環境における移動ロボットのためのタスク割り当てと分散ナビゲーションアルゴリズムを提案する。本稿では,共同分散タスク割り当てとナビゲーションの問題について考察し,それを解決するための2段階のアプローチを提案する。ロボットの衝突のない軌道の計算では,タスク完了時間において最大14%の改善と最大40%の改善が観察される。
論文参考訳（メタデータ） (2022-09-07T00:35:27Z)
Location-routing Optimisation for Urban Logistics Using Mobile Parcel Locker Based on Hybrid Q-Learning Algorithm [0.0]
パーセルロッカー(MPL)は、交通渋滞と運用コストを低減する手段として、都市物流事業者によって導入されている。本稿では,MPLのロケーションルーティング問題を解くための整数プログラミングモデルを提案する。
論文参考訳（メタデータ） (2021-10-29T01:27:12Z)
Fast Decomposition of Temporal Logic Specifications for Heterogeneous Teams [1.856334276134661]
我々は,大規模なマルチエージェントパス計画問題を,独立して解決・実行可能なより小さなサブプロブレムに分解することに注力する。エージェントのミッションは、信号時間論理の断片であるCaTL(Capability Temporal Logic)公式として与えられる。私たちが取っているアプローチは、時間論理仕様とエージェントのチームの両方を分解することです。
論文参考訳（メタデータ） (2020-09-30T18:04:39Z)
Jump Operator Planning: Goal-Conditioned Policy Ensembles and Zero-Shot Transfer [71.44215606325005]
本稿では,シーケンシャルなサブゴールタスクの超指数空間における解を高速に計算するための,Jump-Operator Dynamic Programmingという新しいフレームワークを提案する。このアプローチでは、時間的に拡張された行動として機能する、再利用可能な目標条件付き警察のアンサンブルを制御する。すると、この部分空間上の目的関数のクラスを、解がグラウンド化に不変であるものとして特定し、最適ゼロショット移動をもたらす。
論文参考訳（メタデータ） (2020-07-06T05:13:20Z)
Dynamic Multi-Robot Task Allocation under Uncertainty and Temporal Constraints [52.58352707495122]
本稿では,不確実性およびマルチエージェント協調の下での逐次意思決定における重要な計算課題を分離するマルチロボット割当アルゴリズムを提案する。都市におけるマルチアームコンベヤベルトピック・アンド・プレイスとマルチドローン配送ディスパッチの2つの異なる領域における広範囲なシミュレーション結果について検証を行った。
論文参考訳（メタデータ） (2020-05-27T01:10:41Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。