論文の概要: Tactics2D: A Multi-agent Reinforcement Learning Environment for Driving
Decision-making
- arxiv url: http://arxiv.org/abs/2311.11058v1
- Date: Sat, 18 Nov 2023 12:31:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-22 12:43:45.960809
- Title: Tactics2D: A Multi-agent Reinforcement Learning Environment for Driving
Decision-making
- Title(参考訳): tactics2d: 意思決定を駆動するマルチエージェント強化学習環境
- Authors: Yueyuan Li, Songan Zhang, Mingyang Jiang, Xingyuan Chen, Ming Yang
- Abstract要約: Tactics2DはPythonバックエンドを備えたオープンソースのマルチエージェント強化学習ライブラリである。
その目標は、自動運転車のための意思決定アルゴリズムを開発するための便利なツールセットを提供することだ。
- 参考スコア(独自算出の注目度): 8.438182062444564
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tactics2D is an open-source multi-agent reinforcement learning library with a
Python backend. Its goal is to provide a convenient toolset for researchers to
develop decision-making algorithms for autonomous driving. The library includes
diverse traffic scenarios implemented as gym-based environments equipped with
multi-sensory capabilities and violation detection for traffic rules.
Additionally, it features a reinforcement learning baseline tested with
reasonable evaluation metrics. Tactics2D is highly modular and customizable.
The source code of Tactics2D is available at
https://github.com/WoodOxen/Tactics2D.
- Abstract(参考訳): Tactics2DはPythonバックエンドを備えたオープンソースのマルチエージェント強化学習ライブラリである。
その目標は、自動運転車のための意思決定アルゴリズムを開発するための便利なツールセットを提供することだ。
このライブラリには、多感覚機能と交通ルール違反検出を備えたジムベースの環境として実装された多様な交通シナリオが含まれている。
さらに、適切な評価基準でテストされた強化学習ベースラインも備えている。
Tactics2Dは高度にモジュール化され、カスタマイズできる。
Tactics2Dのソースコードはhttps://github.com/WoodOxen/Tactics2Dで公開されている。
関連論文リスト
- Any-point Trajectory Modeling for Policy Learning [67.45990463611942]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - LeTFuser: Light-weight End-to-end Transformer-Based Sensor Fusion for
Autonomous Driving with Multi-Task Learning [16.241116794114525]
本稿では,複数のRGB-Dカメラ表現を融合させるアルゴリズムであるLeTFuserを紹介する。
認識と制御を同時に行うためには,マルチタスク学習を利用する。
論文 参考訳(メタデータ) (2023-10-19T20:09:08Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and
Heuristic Rule-based Methods for Object Manipulation [118.27432851053335]
本稿では,SAPIEN ManiSkill Challenge 2021: No Interaction Trackにおいて,以下の2つのトラックを対象としたシステムの概要と比較分析を行った。
No Interactionは、事前に収集された実証軌道からの学習ポリシーのターゲットを追跡する。
このトラックでは,タスクを一連のサブタスクに分解することで,高品質なオブジェクト操作をトリガするHuristic Rule-based Method (HRM) を設計する。
各サブタスクに対して、ロボットアームに適用可能なアクションを予測するために、単純なルールベースの制御戦略が採用されている。
論文 参考訳(メタデータ) (2022-06-13T16:20:42Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - MetaDrive: Composing Diverse Driving Scenarios for Generalizable
Reinforcement Learning [25.191567110519866]
我々は,強化学習アルゴリズムの研究のために,MetaDriveと呼ばれる新しい運転シミュレーションプラットフォームを開発した。
MetaDriveをベースとして、シングルエージェントとマルチエージェントの両方の設定でさまざまなRLタスクとベースラインを構築します。
論文 参考訳(メタデータ) (2021-09-26T18:34:55Z) - DL-Traff: Survey and Benchmark of Deep Learning Models for Urban Traffic
Prediction [7.476566278759198]
このようなデータに最先端のディープラーニング技術を活用することで、都市交通予測はAIとインテリジェントトランスポーテーションシステムコミュニティに大きな注目を集めている。
具体的なモデリング戦略によると、最先端のディープラーニングモデルは、グリッドベース、グラフベース、時系列モデルという3つのカテゴリに分けられる。
論文 参考訳(メタデータ) (2021-08-20T10:08:26Z) - Transfer Learning in Multi-Agent Reinforcement Learning with Double
Q-Networks for Distributed Resource Sharing in V2X Communication [24.442174952832108]
本稿では,V2X通信ネットワークにおける分散スペクトル共有の問題に対処する。
目的は、V2IおよびV2Vリンクの資源効率の高い共存を提供することである。
論文 参考訳(メタデータ) (2021-07-13T15:50:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。