論文の概要: AccidentGPT: Large Multi-Modal Foundation Model for Traffic Accident
Analysis
- arxiv url: http://arxiv.org/abs/2401.03040v1
- Date: Fri, 5 Jan 2024 19:33:21 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 20:46:09.335800
- Title: AccidentGPT: Large Multi-Modal Foundation Model for Traffic Accident
Analysis
- Title(参考訳): accidentgpt: 交通事故解析のための大規模マルチモーダル基礎モデル
- Authors: Kebin Wu and Wenbin Li and Xiaofei Xiao
- Abstract要約: AccidentGPTは交通事故解析の基礎モデルである。
マルチモーダルな入力データを組み込んで、動的詳細で事故処理ビデオを自動的に再構築する。
- 参考スコア(独自算出の注目度): 3.8763079966791523
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Traffic accident analysis is pivotal for enhancing public safety and
developing road regulations. Traditional approaches, although widely used, are
often constrained by manual analysis processes, subjective decisions, uni-modal
outputs, as well as privacy issues related to sensitive data. This paper
introduces the idea of AccidentGPT, a foundation model of traffic accident
analysis, which incorporates multi-modal input data to automatically
reconstruct the accident process video with dynamics details, and furthermore
provide multi-task analysis with multi-modal outputs. The design of the
AccidentGPT is empowered with a multi-modality prompt with feedback for
task-oriented adaptability, a hybrid training schema to leverage labelled and
unlabelled data, and a edge-cloud split configuration for data privacy. To
fully realize the functionalities of this model, we proposes several research
opportunities. This paper serves as the stepping stone to fill the gaps in
traditional approaches of traffic accident analysis and attract the research
community attention for automatic, objective, and privacy-preserving traffic
accident analysis.
- Abstract(参考訳): 交通事故分析は公共の安全と道路規制の整備に不可欠である。
従来のアプローチは広く使われているが、しばしば手動の分析プロセス、主観的決定、一様出力、および機密データに関連するプライバシーの問題によって制約される。
本稿では、交通事故解析の基礎モデルであるAccidentGPTのアイデアを紹介し、マルチモーダル入力データを組み込んで、動的詳細で事故処理映像を自動再構成し、さらにマルチモーダル出力によるマルチタスク解析を提供する。
AccidentGPTの設計には、タスク指向の適応性に対するフィードバックと、ラベル付きおよび遅延のないデータを活用するハイブリッドトレーニングスキーマ、データプライバシのためのエッジクラウド分割構成を備えたマルチモーダルプロンプトが付与されている。
本モデルの機能を完全に実現するために,いくつかの研究機会を提案する。
本論文は,交通事故分析における従来のアプローチのギャップを埋めるための足場となり,事故の自動的・客観的・プライバシー保全的事故分析に研究コミュニティの注目を惹きつける。
関連論文リスト
- AVD2: Accident Video Diffusion for Accident Video Description [11.221276595088215]
AVD2(Accident Video Diffusion for Accident Video Description)は,事故現場の理解を高める新しいフレームワークである。
このフレームワークは、自然言語の詳細な記述や推論と一致した事故ビデオを生成する。
EMM-AUデータセットの統合は、自動メトリクスと人的評価の両方にわたって最先端のパフォーマンスを確立する。
論文 参考訳(メタデータ) (2025-02-20T18:22:44Z) - When language and vision meet road safety: leveraging multimodal large language models for video-based traffic accident analysis [6.213279061986497]
SeeUnsafeは、ビデオベースの交通事故分析を、よりインタラクティブで対話的なアプローチに変換するフレームワークである。
本フレームワークでは,様々な長さの動画をマルチモーダル・アグリゲーション・ストラテジーで処理し,レビューと評価のために構造化された応答を生成する。
本研究では,トヨタウーブン交通安全データセットについて広範な実験を行い,SeeUnsafeが事故対応ビデオ分類と視覚的グラウンド化を効果的に実施できることを実証した。
論文 参考訳(メタデータ) (2025-01-17T23:35:34Z) - On-Road Object Importance Estimation: A New Dataset and A Model with Multi-Fold Top-Down Guidance [70.80612792049315]
本稿では,交通オブジェクト重要度(TOI)という,新しい大規模データセットを提案する。
ボトムアップ機能とマルチフォールドトップダウンガイダンスを統合するモデルを提案する。
我々のモデルは最先端の手法を大きなマージンで上回る。
論文 参考訳(メタデータ) (2024-11-26T06:37:10Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - AccidentGPT: Accident Analysis and Prevention from V2X Environmental
Perception with Multi-modal Large Model [32.14950866838055]
AccidentGPTは総合的な事故解析とマルチモーダル大模型の予防である。
自律走行車では、車両を制御し衝突を避けるための総合的な環境認識と理解を提供する。
人間の運転する車には、プロアクティブな長距離安全警告と盲点警告を提供します。
我々のフレームワークは、歩行者、車両、道路、環境を含む交通安全のインテリジェントでリアルタイムな分析を支援する。
論文 参考訳(メタデータ) (2023-12-20T16:19:47Z) - DRUformer: Enhancing the driving scene Important object detection with
driving relationship self-understanding [50.81809690183755]
交通事故はしばしば致命傷を負い、2023年まで5000万人以上の死者を出した。
従来の研究は、主に個々の参加者の重要性を評価し、それらを独立した存在として扱うものであった。
本稿では、重要な物体検出タスクを強化するために、運転シーン関連自己理解変換器(DRUformer)を紹介する。
論文 参考訳(メタデータ) (2023-11-11T07:26:47Z) - Deep Learning Serves Traffic Safety Analysis: A Forward-looking Review [4.228522109021283]
本稿では,トラヒックビデオの理解と解釈に使用できる,典型的な処理パイプラインを提案する。
この処理フレームワークは、ビデオ強調、ビデオ安定化、セマンティックおよびインシデントセグメンテーション、オブジェクト検出と分類、軌道抽出、速度推定、イベント分析、モデリング、異常検出を含む。
論文 参考訳(メタデータ) (2022-03-07T17:21:07Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z) - Multi-intersection Traffic Optimisation: A Benchmark Dataset and a
Strong Baseline [85.9210953301628]
交通信号の制御は、都市部の交通渋滞の緩和に必要不可欠である。
問題モデリングの複雑さが高いため、現在の作業の実験的な設定はしばしば矛盾する。
エンコーダ・デコーダ構造を用いた深層強化学習に基づく新規で強力なベースラインモデルを提案する。
論文 参考訳(メタデータ) (2021-01-24T03:55:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。