論文の概要: TransGPT: Multi-modal Generative Pre-trained Transformer for
Transportation
- arxiv url: http://arxiv.org/abs/2402.07233v1
- Date: Sun, 11 Feb 2024 15:50:35 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-13 16:43:45.281097
- Title: TransGPT: Multi-modal Generative Pre-trained Transformer for
Transportation
- Title(参考訳): トランスgpt : 輸送用マルチモーダル生成予訓練変圧器
- Authors: Peng Wang, Xiang Wei, Fangxu Hu and Wenjuan Han
- Abstract要約: 本稿ではトランスGPT(TransGPT)について述べる。
シングルモーダルデータ用TransGPT-SMとマルチモーダルデータ用TransGPT-MMの2つの独立した変種で構成されている。
この研究は、輸送分野におけるNLPの最先端を推し進め、ITSの研究者や実践者にとって有用なツールを提供する。
- 参考スコア(独自算出の注目度): 19.184173455587263
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Natural language processing (NLP) is a key component of intelligent
transportation systems (ITS), but it faces many challenges in the
transportation domain, such as domain-specific knowledge and data, and
multi-modal inputs and outputs. This paper presents TransGPT, a novel
(multi-modal) large language model for the transportation domain, which
consists of two independent variants: TransGPT-SM for single-modal data and
TransGPT-MM for multi-modal data. TransGPT-SM is finetuned on a single-modal
Transportation dataset (STD) that contains textual data from various sources in
the transportation domain. TransGPT-MM is finetuned on a multi-modal
Transportation dataset (MTD) that we manually collected from three areas of the
transportation domain: driving tests, traffic signs, and landmarks. We evaluate
TransGPT on several benchmark datasets for different tasks in the
transportation domain, and show that it outperforms baseline models on most
tasks. We also showcase the potential applications of TransGPT for traffic
analysis and modeling, such as generating synthetic traffic scenarios,
explaining traffic phenomena, answering traffic-related questions, providing
traffic recommendations, and generating traffic reports. This work advances the
state-of-the-art of NLP in the transportation domain and provides a useful tool
for ITS researchers and practitioners.
- Abstract(参考訳): 自然言語処理(NLP)はインテリジェントトランスポートシステム(ITS)の重要な構成要素であるが、ドメイン固有の知識やデータ、マルチモーダル入力や出力など、輸送領域における多くの課題に直面している。
本稿では、トランスGPT-SMとトランスGPT-MMの2つの独立した変種からなるトランスモーダルドメインのための新しい(マルチモーダルな)大規模言語モデルであるTransGPTを提案する。
TransGPT-SMは、トランスポートドメイン内の様々なソースからのテキストデータを含む単一モーダルトランスポーテーションデータセット(STD)に微調整される。
TransGPT-MMは、交通領域の3つの領域(運転テスト、交通標識、ランドマーク)から手作業で収集したマルチモーダルトランスポーテーションデータセット(MTD)に基づいて微調整される。
我々はトランスgptをトランスポート領域の異なるタスクのためのいくつかのベンチマークデータセットで評価し、ほとんどのタスクでベースラインモデルよりも優れていることを示す。
また,交通シナリオの生成,交通現象の説明,交通関連質問への回答,交通レコメンデーションの提供,交通報告の生成など,交通分析・モデリングにおけるTransGPTの適用可能性についても紹介する。
この研究は、輸送分野におけるNLPの最先端を推し進め、ITSの研究者や実践者にとって有用なツールを提供する。
関連論文リスト
- Think Twice Before Recognizing: Large Multimodal Models for General Fine-grained Traffic Sign Recognition [49.20086587208214]
我々は、微粒な交通標識認識(TSR)を改善するために認識する前に、思考と呼ばれる新しい戦略を提案する。
我々の戦略は、大型マルチモーダルモデル(LMM)の多重思考能力を刺激することで、有効な微粒化TSRを実現する。
論文 参考訳(メタデータ) (2024-09-03T02:08:47Z) - TrafficGPT: Towards Multi-Scale Traffic Analysis and Generation with Spatial-Temporal Agent Framework [3.947797359736224]
我々は3つのAIエージェントを用いてマルチスケールトラフィックデータを処理するマルチスケールトラフィック生成システムであるTrafficGPTを設計した。
TrafficGPTは,1)ユーザと対話し,テキストを介して予測タスクを抽出するテキスト・ツー・デマンドエージェント,2)マルチスケールトラフィックデータを利用して時間的特徴と類似性を生成するトラフィック予測エージェント,3)予測結果を用いて提案や視覚化を行う提案・可視化エージェントの3つの重要なAIエージェントから構成される。
論文 参考訳(メタデータ) (2024-05-08T07:48:40Z) - xMTrans: Temporal Attentive Cross-Modality Fusion Transformer for Long-Term Traffic Prediction [3.08580339590996]
本稿では,長期交通予測,すなわちxMTransに対する時間的注意型クロスモーダルトランスモデルを提案する。
我々は,実世界のデータセットを用いて,交通渋滞とタクシー需要予測に関する提案モデルを評価する実験を行った。
論文 参考訳(メタデータ) (2024-05-08T06:29:26Z) - BjTT: A Large-scale Multimodal Dataset for Traffic Prediction [49.93028461584377]
従来の交通予測手法は、交通トレンドを予測するために、過去の交通データに依存している。
本研究では,交通システムを記述するテキストと生成モデルを組み合わせることで,交通生成にどのように応用できるかを考察する。
本稿では,テキスト・トラフィック生成のための最初の拡散モデルChatTrafficを提案する。
論文 参考訳(メタデータ) (2024-03-08T04:19:56Z) - TransportationGames: Benchmarking Transportation Knowledge of
(Multimodal) Large Language Models [46.862519898969325]
TransportationGamesは(M)LLMを評価するための評価ベンチマークである。
各種(M)LLMの性能を記憶し,理解し,選択したタスクによる交通知識の適用において検証する。
論文 参考訳(メタデータ) (2024-01-09T10:20:29Z) - TrafficMOT: A Challenging Dataset for Multi-Object Tracking in Complex
Traffic Scenarios [23.831048188389026]
トラヒックビデオにおける多目的追跡は、交通監視の精度を高め、道路安全対策を促進する大きな可能性を秘めている。
トラヒックビデオにおけるマルチオブジェクトトラッキングのための既存のデータセットは、制限されたインスタンスや単一のクラスにフォーカスすることが多い。
複雑なシナリオを持つ多様なトラフィック状況をカバーするために設計された、広範なデータセットであるTrafficMOTを紹介する。
論文 参考訳(メタデータ) (2023-11-30T18:59:56Z) - DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model [84.29836263441136]
本研究は,マルチモーダル大言語モデル(MLLM)に基づく新しい解釈可能なエンドツーエンド自動運転システムであるDriveGPT4を紹介する。
DriveGPT4は、車両動作の解釈を促進し、関連する推論を提供し、ユーザによるさまざまな質問に効果的に対処する。
論文 参考訳(メタデータ) (2023-10-02T17:59:52Z) - Communication-Efficient Framework for Distributed Image Semantic
Wireless Transmission [68.69108124451263]
IoTデバイスを用いたマルチタスク分散画像伝送のためのFederated Learning-based semantic communication (FLSC)フレームワーク。
各リンクは階層型視覚変換器(HVT)ベースの抽出器とタスク適応トランスレータで構成される。
チャネル状態情報に基づく多重出力多重出力伝送モジュール。
論文 参考訳(メタデータ) (2023-08-07T16:32:14Z) - TrafficSafetyGPT: Tuning a Pre-trained Large Language Model to a
Domain-Specific Expert in Transportation Safety [2.1906688755530968]
大規模言語モデル(LLM)は、様々な汎用自然言語処理(NLP)タスクにおいて顕著な効果を示している。
本稿では,新しいLAMAモデルであるTrafficSafetyGPTを紹介する。
論文 参考訳(メタデータ) (2023-07-28T05:17:11Z) - Prompting for Multi-Modal Tracking [70.0522146292258]
マルチモーダルトラッキングのための新しいマルチモーダルプロンプトトラッカー(ProTrack)を提案する。
ProTrackはプロンプトパラダイムにより、マルチモーダル入力を単一モーダルに変換することができる。
我々のProTrackは、マルチモーダルデータに余分な訓練を加えることなく、入力を変更するだけで高性能なマルチモーダルトラッキングを実現することができる。
論文 参考訳(メタデータ) (2022-07-29T09:35:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。