論文の概要: Gamifying the Vehicle Routing Problem with Stochastic Requests
- arxiv url: http://arxiv.org/abs/1911.05922v2
- Date: Mon, 23 Sep 2024 22:49:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-09 16:01:17.466844
- Title: Gamifying the Vehicle Routing Problem with Stochastic Requests
- Title(参考訳): 確率的要求による車両経路問題のゲーミフィケーション
- Authors: Nicholas D. Kullman, Nikita Dudorov, Jorge E. Mendoza, Martin Cousineau, Justin C. Goodson,
- Abstract要約: 我々は、古典的な物流問題をゲームとして表現するタスクを考え、エージェントにそれをプレイするよう訓練する。
視点,視野,超人的ミニマップなど,さまざまなデザインがエージェントのパフォーマンスにどのような影響を与えるかを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Do you remember your first video game console? We remember ours. Decades ago, they provided hours of entertainment. Now, we have repurposed them to solve dynamic and stochastic optimization problems. With deep reinforcement learning methods posting superhuman performance on a wide range of Atari games, we consider the task of representing a classic logistics problem as a game. Then, we train agents to play it. We consider several game designs for the vehicle routing problem with stochastic requests. We show how various design features impact agents' performance, including perspective, field of view, and minimaps. With the right game design, general purpose Atari agents outperform optimization-based benchmarks, especially as problem size grows. Our work points to the representation of dynamic and stochastic optimization problems via games as a promising research direction.
- Abstract(参考訳): あなたの最初のビデオゲームコンソールを覚えていますか。
私たちは自分のことを思い出す。
数十年前、彼らは何時間もエンターテイメントを提供していた。
現在、動的および確率的最適化問題を解くためにそれらを再利用している。
幅広いアタリゲームに超人的パフォーマンスをポストする深層強化学習手法により,古典的な物流問題をゲームとして表現する作業を考える。
その後、エージェントを訓練してプレイします。
確率的要求を伴う車両経路問題のゲーム設計について検討する。
パースペクティブ、視野、ミニマップなど、さまざまなデザイン特徴がエージェントのパフォーマンスにどのように影響するかを示す。
適切なゲーム設計では、一般的な目的であるAtariエージェントは、特に問題のサイズが大きくなるにつれて、最適化ベースのベンチマークを上回ります。
我々の研究は、ゲームによる動的および確率的最適化問題の表現を、有望な研究方向として示している。
関連論文リスト
- People use fast, goal-directed simulation to reason about novel games [75.25089384921557]
我々は,シンプルだが斬新なコネクテッドnスタイルのボードゲームについて,人々がどう考えるかを研究する。
ゲームがどんなに公平か、そしてどんなに楽しいのかを、ごくわずかな経験から判断するよう、私たちは人々に求めます。
論文 参考訳(メタデータ) (2024-07-19T07:59:04Z) - Imperfect-Recall Games: Equilibrium Concepts and Their Complexity [74.01381499760288]
エージェントが以前保持していた情報を忘れたとき、不完全なリコールの下で最適な意思決定を行う。
不完全なリコールを伴う広範囲形式のゲームフレームワークにおいて、マルチプレイヤー設定における平衡を求める際の計算複雑性を解析する。
論文 参考訳(メタデータ) (2024-06-23T00:27:28Z) - Efficient Ground Vehicle Path Following in Game AI [77.34726150561087]
本稿では,ゲームAIに適した地上車両の効率的な追従経路を提案する。
提案したパスフォロワは,一対一シューティングゲームにおいて,様々なテストシナリオを通じて評価される。
その結果,既存の経路と比較すると,立ち往生するイベントの総数が70%減少した。
論文 参考訳(メタデータ) (2023-07-07T04:20:07Z) - RaidEnv: Exploring New Challenges in Automated Content Balancing for
Boss Raid Games [1.9851345691234763]
RaidEnvは、MMORPGゲームにおけるボスレイドシナリオのための多種多様なカスタマイズ可能なコンテンツを含む新しいゲームシミュレータである。
自動コンテンツバランシングにおけるAIのガイダンスを提供するために,2つの評価指標を導入する。
論文 参考訳(メタデータ) (2023-07-04T12:07:25Z) - Preference-Aware Delivery Planning for Last-Mile Logistics [3.04585143845864]
最適化手法と機械学習手法の両方の長所を組み合わせた,学習可能なパラメータを持つ新しい階層的経路を提案する。
Amazon Last Mile Research Challengeが提供する実際のデリバリデータセットを使用することで、最適化と機械学習コンポーネントの両方を持つことの重要性を実証する。
論文 参考訳(メタデータ) (2023-03-08T02:10:59Z) - Multi-Game Decision Transformers [49.257185338595434]
そこで本研究では,1つのトランスフォーマーモデルを用いて,最大46個のAtariゲーム群を,人間に近いパフォーマンスで同時にプレイ可能であることを示す。
オンラインやオフラインのRL手法や行動クローンなど,マルチゲーム設定におけるいくつかのアプローチを比較した。
マルチゲーム決定変換モデルは、最高のスケーラビリティとパフォーマンスを提供します。
論文 参考訳(メタデータ) (2022-05-30T16:55:38Z) - CCPT: Automatic Gameplay Testing and Validation with
Curiosity-Conditioned Proximal Trajectories [65.35714948506032]
Curiosity-Conditioned Proximal Trajectories (CCPT)法は、好奇心と模倣学習を組み合わせてエージェントを訓練して探索する。
CCPTが複雑な環境を探索し、ゲームプレイの問題を発見し、その過程におけるデザインの監視を行い、それらをゲームデザイナーに直接認識し、強調する方法について説明する。
論文 参考訳(メタデータ) (2022-02-21T09:08:33Z) - Rinascimento: searching the behaviour space of Splendor [0.0]
本研究の目的は,ゲーム内の行動空間(BSpace)を一般手法を用いてマッピングすることである。
特に、イベント値関数の使用は、古典的なスコアベースの報酬信号に基づくエージェントと比較して、BSpaceのカバレッジが著しく改善されている。
論文 参考訳(メタデータ) (2021-06-15T18:46:57Z) - Deep Policy Networks for NPC Behaviors that Adapt to Changing Design
Parameters in Roguelike Games [137.86426963572214]
例えばRoguelikesのようなターンベースの戦略ゲームは、Deep Reinforcement Learning(DRL)にユニークな課題を提示する。
複雑なカテゴリ状態空間をより適切に処理し、設計決定によって強制的に再訓練する必要性を緩和する2つのネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-12-07T08:47:25Z) - Griddly: A platform for AI research in games [0.0]
我々はGriddlyをゲームAI研究の新しいプラットフォームとして紹介する。
Griddlyは、高度にカスタマイズ可能なゲーム、異なるオブザーバタイプ、効率的なC++コアエンジンのユニークな組み合わせを提供する。
本稿では,RLエージェントの観察構成と一般化能力の相違について,一連の基礎実験を行った。
論文 参考訳(メタデータ) (2020-11-12T13:23:31Z) - Physically Embedded Planning Problems: New Challenges for Reinforcement
Learning [26.74526714574981]
近年の深層強化学習(RL)では,囲碁,チェス,小技などの挑戦的なゲームを習得するアルゴリズムが開発されている。
物理的に組込みの計画問題を導入し、それらを一般公開する。
既存のRLアルゴリズムは、物理的に埋め込まれたアルゴリズムの中でも、最も単純なアルゴリズムを習得するのに苦労している。
論文 参考訳(メタデータ) (2020-09-11T16:56:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。