論文の概要: Tactics2D: A Reinforcement Learning Environment Library with Generative Scenarios for Driving Decision-making
- arxiv url: http://arxiv.org/abs/2311.11058v2
- Date: Sat, 23 Mar 2024 14:49:30 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-27 02:25:46.275104
- Title: Tactics2D: A Reinforcement Learning Environment Library with Generative Scenarios for Driving Decision-making
- Title(参考訳): Tactics2D: 意思決定のための生成シナリオを用いた強化学習環境ライブラリ
- Authors: Yueyuan Li, Songan Zhang, Mingyang Jiang, Xingyuan Chen, Ming Yang,
- Abstract要約: Tactics2DはオープンソースのReinforcement Learning環境ライブラリで、多様で困難なトラフィックシナリオを自動生成する。
その第一の目的は、研究者が学習に基づく駆動意思決定モデルを調べるためのアウト・オブ・ボックスツールキットを提供することである。
機能としては、現実世界のログやデータフォーマットとの広範な互換性、カスタマイズ可能なトラフィックシナリオコンポーネント、リッチな組み込み機能テンプレートなどがある。
- 参考スコア(独自算出の注目度): 7.865231751204186
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Tactics2D is an open-source Reinforcement Learning environment library featured with auto-generation of diverse and challenging traffic scenarios. Its primary goal is to provide an out-of-the-box toolkit for researchers to explore learning-based driving decision-making models. This library implements both rule-based and data-driven approaches to generate interactive traffic scenarios. Noteworthy features of Tactics2D include expansive compatibility with real-world log and data formats, customizable traffic scenario components, and rich built-in functional templates. Developed with user-friendliness in mind, Tactics2D offers detailed documentation and an interactive online tutorial. The software maintains robust reliability, with over 90% code passing unit testing. For access to the source code and participation in discussions, visit the official GitHub page for Tactcis2D at https://github.com/WoodOxen/Tactics2D.
- Abstract(参考訳): Tactics2DはオープンソースのReinforcement Learning環境ライブラリで、多様で困難なトラフィックシナリオを自動生成する。
その第一の目的は、研究者が学習に基づく駆動意思決定モデルを調べるためのアウト・オブ・ボックスツールキットを提供することである。
このライブラリは、対話的なトラフィックシナリオを生成するためのルールベースとデータ駆動のアプローチの両方を実装している。
Tactics2Dの注目すべき機能には、現実世界のログやデータフォーマットとの広範な互換性、カスタマイズ可能なトラフィックシナリオコンポーネント、リッチな組み込み機能テンプレートなどがある。
ユーザフレンドリーを念頭に置いて開発されたTactics2Dは、詳細なドキュメントとインタラクティブなオンラインチュートリアルを提供する。
このソフトウェアは信頼性を保ち、90%以上のコードが単体テストに合格する。
ソースコードへのアクセスと議論への参加については、https://github.com/WoodOxen/Tactics2DのTactcis2Dの公式GitHubページを参照してほしい。
関連論文リスト
- Any-point Trajectory Modeling for Policy Learning [67.45990463611942]
我々は、ビデオフレーム内の任意の点の将来の軌跡を予測するために、ATM(Any-point Trajectory Modeling)を導入する。
ATMは、強力なビデオ事前トレーニングベースラインを平均80%上回っている。
本研究では,人間の動画やビデオからの操作スキルを,異なるロボット形態から効果的に伝達する学習方法を示す。
論文 参考訳(メタデータ) (2023-12-28T23:34:43Z) - Drive Anywhere: Generalizable End-to-end Autonomous Driving with
Multi-modal Foundation Models [114.69732301904419]
本稿では、画像とテキストで検索可能な表現から、運転決定を提供することができる、エンドツーエンドのオープンセット(環境/シーン)自律運転を適用するアプローチを提案する。
当社のアプローチでは, 多様なテストにおいて非並列的な結果を示すと同時に, アウト・オブ・ディストリビューションの状況において, はるかに高いロバスト性を実現している。
論文 参考訳(メタデータ) (2023-10-26T17:56:35Z) - LeTFuser: Light-weight End-to-end Transformer-Based Sensor Fusion for
Autonomous Driving with Multi-Task Learning [16.241116794114525]
本稿では,複数のRGB-Dカメラ表現を融合させるアルゴリズムであるLeTFuserを紹介する。
認識と制御を同時に行うためには,マルチタスク学習を利用する。
論文 参考訳(メタデータ) (2023-10-19T20:09:08Z) - CodeTF: One-stop Transformer Library for State-of-the-art Code LLM [72.1638273937025]
我々は、最先端のCode LLMとコードインテリジェンスのためのオープンソースのTransformerベースのライブラリであるCodeTFを紹介する。
我々のライブラリは、事前訓練されたコードLLMモデルと人気のあるコードベンチマークのコレクションをサポートします。
CodeTFが機械学習/生成AIとソフトウェア工学のギャップを埋められることを願っている。
論文 参考訳(メタデータ) (2023-05-31T05:24:48Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Silver-Bullet-3D at ManiSkill 2021: Learning-from-Demonstrations and
Heuristic Rule-based Methods for Object Manipulation [118.27432851053335]
本稿では,SAPIEN ManiSkill Challenge 2021: No Interaction Trackにおいて,以下の2つのトラックを対象としたシステムの概要と比較分析を行った。
No Interactionは、事前に収集された実証軌道からの学習ポリシーのターゲットを追跡する。
このトラックでは,タスクを一連のサブタスクに分解することで,高品質なオブジェクト操作をトリガするHuristic Rule-based Method (HRM) を設計する。
各サブタスクに対して、ロボットアームに適用可能なアクションを予測するために、単純なルールベースの制御戦略が採用されている。
論文 参考訳(メタデータ) (2022-06-13T16:20:42Z) - GenNI: Human-AI Collaboration for Data-Backed Text Generation [102.08127062293111]
Table2Textシステムは、機械学習を利用した構造化データに基づいてテキスト出力を生成する。
GenNI (Generation Negotiation Interface) は、対話型ビジュアルシステムである。
論文 参考訳(メタデータ) (2021-10-19T18:07:07Z) - MetaDrive: Composing Diverse Driving Scenarios for Generalizable
Reinforcement Learning [25.191567110519866]
我々は,強化学習アルゴリズムの研究のために,MetaDriveと呼ばれる新しい運転シミュレーションプラットフォームを開発した。
MetaDriveをベースとして、シングルエージェントとマルチエージェントの両方の設定でさまざまなRLタスクとベースラインを構築します。
論文 参考訳(メタデータ) (2021-09-26T18:34:55Z) - DL-Traff: Survey and Benchmark of Deep Learning Models for Urban Traffic
Prediction [7.476566278759198]
このようなデータに最先端のディープラーニング技術を活用することで、都市交通予測はAIとインテリジェントトランスポーテーションシステムコミュニティに大きな注目を集めている。
具体的なモデリング戦略によると、最先端のディープラーニングモデルは、グリッドベース、グラフベース、時系列モデルという3つのカテゴリに分けられる。
論文 参考訳(メタデータ) (2021-08-20T10:08:26Z) - Transfer Learning in Multi-Agent Reinforcement Learning with Double
Q-Networks for Distributed Resource Sharing in V2X Communication [24.442174952832108]
本稿では,V2X通信ネットワークにおける分散スペクトル共有の問題に対処する。
目的は、V2IおよびV2Vリンクの資源効率の高い共存を提供することである。
論文 参考訳(メタデータ) (2021-07-13T15:50:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。