論文の概要: Design and Application of Multimodal Large Language Model Based System for End to End Automation of Accident Dataset Generation
- arxiv url: http://arxiv.org/abs/2505.00015v1
- Date: Wed, 23 Apr 2025 04:52:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:55.091978
- Title: Design and Application of Multimodal Large Language Model Based System for End to End Automation of Accident Dataset Generation
- Title(参考訳): 事故データセット生成のエンドツーエンド自動化のための多モード大言語モデルベースシステムの設計と応用
- Authors: MD Thamed Bin Zaman Chowdhury, Moazzem Hossain,
- Abstract要約: バングラデシュのような発展途上国では、道路交通事故が公共の安全と社会経済的問題となっている。
既存の事故データ収集は大半が手動であり、断片化され、信頼性が低いため、記録が不十分で一貫性がない。
本研究では,これらの課題に対処するために,Large Language Models (LLM) とWebスクレイピング技術を用いた完全自動化システムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Road traffic accidents remain a major public safety and socio-economic issue in developing countries like Bangladesh. Existing accident data collection is largely manual, fragmented, and unreliable, resulting in underreporting and inconsistent records. This research proposes a fully automated system using Large Language Models (LLMs) and web scraping techniques to address these challenges. The pipeline consists of four components: automated web scraping code generation, news collection from online sources, accident news classification with structured data extraction, and duplicate removal. The system uses the multimodal generative LLM Gemini-2.0-Flash for seamless automation. The code generation module classifies webpages into pagination, dynamic, or infinite scrolling categories and generates suitable Python scripts for scraping. LLMs also classify and extract key accident information such as date, time, location, fatalities, injuries, road type, vehicle types, and pedestrian involvement. A deduplication algorithm ensures data integrity by removing duplicate reports. The system scraped 14 major Bangladeshi news sites over 111 days (Oct 1, 2024 - Jan 20, 2025), processing over 15,000 news articles and identifying 705 unique accidents. The code generation module achieved 91.3% calibration and 80% validation accuracy. Chittagong reported the highest number of accidents (80), fatalities (70), and injuries (115), followed by Dhaka, Faridpur, Gazipur, and Cox's Bazar. Peak accident times were morning (8-9 AM), noon (12-1 PM), and evening (6-7 PM). A public repository was also developed with usage instructions. This study demonstrates the viability of an LLM-powered, scalable system for accurate, low-effort accident data collection, providing a foundation for data-driven road safety policymaking in Bangladesh.
- Abstract(参考訳): バングラデシュのような発展途上国では、道路交通事故が公共の安全と社会経済的問題となっている。
既存の事故データ収集は大半が手動であり、断片化され、信頼性が低いため、記録が不十分で一貫性がない。
本研究では,これらの課題に対処するために,Large Language Models (LLM) とWebスクレイピング技術を用いた完全自動化システムを提案する。
パイプラインは、自動Webスクレイピングコード生成、オンラインソースからのニュース収集、構造化データ抽出による事故ニュース分類、重複削除の4つのコンポーネントで構成されている。
このシステムは、シームレスな自動化のためにマルチモーダル生成型LLM Gemini-2.0-Flashを使用する。
コード生成モジュールは、Webページをページ化、動的、無限のスクロールカテゴリに分類し、スクレイピングに適したPythonスクリプトを生成する。
LLMはまた、日付、時間、場所、死亡率、怪我、道路タイプ、車両タイプ、歩行者の関与といった重要な事故情報を分類し、抽出する。
重複処理アルゴリズムは重複レポートを削除することによってデータの完全性を保証する。
このシステムは、バングラデシュの主要ニュースサイト14サイト(2024年1月1日 - 2025年1月20日)を111日間にわたって取り壊し、15,000件以上のニュース記事を処理し、705件のユニークな事故を特定した。
コード生成モジュールは91.3%の校正と80%の検証精度を達成した。
チッタゴンは80人、70人、負傷者115人、ダッカ、ファリドゥプル、ガジプル、コックス・バザールを報告した。
ピーク時の時刻は朝(8-9 AM)、正午(12-1 PM)、夕方(6-7 PM)であった。
パブリックリポジトリも利用指示とともに開発された。
本研究は, バングラデシュにおけるデータ駆動型道路安全政策の基盤となる, 高精度で低便な事故データ収集のための, LLMによるスケーラブルなシステムの実現可能性を示す。
関連論文リスト
- Which Agent Causes Task Failures and When? On Automated Failure Attribution of LLM Multi-Agent Systems [50.29939179830491]
LLMマルチエージェントシステムにおける障害帰属は、まだ調査が過小評価されており、労働集約的である。
本稿では,3つの自動故障帰属手法の開発と評価を行い,その欠点と欠点を要約する。
最良の方法は、障害に応答するエージェントを特定する際に53.5%の精度を達成するが、故障の特定には14.2%しか役に立たない。
論文 参考訳(メタデータ) (2025-04-30T23:09:44Z) - Durghotona GPT: A Web Scraping and Large Language Model Based Framework to Generate Road Accident Dataset Automatically in Bangladesh [0.0]
本稿では,WebスクレイピングとLarge Language Models(LLMs)を統合した新しいフレームワークであるDurghotona GPTを提案する。
このフレームワークは、関連情報を効率的に抽出し、レポートを分類し、詳細なデータセットをコンパイルする。
交通安全分析、都市計画、公衆衛生における重要な応用を支援することができる。
論文 参考訳(メタデータ) (2025-04-23T04:30:42Z) - Towards Vision Zero: The Accid3nD Dataset [18.133662927802614]
我々は、異なる天候と照明条件下での現実の高速道路事故の収集であるAccid3nDデータセットを提示する。
データセットには4台の道路カメラから記録された111,945個のラベル付きフレームと25HzのLiDARが含まれている。
本稿では,ルールに基づくアプローチと学習に基づくアプローチを組み合わせた事故検出モデルを提案する。
論文 参考訳(メタデータ) (2025-03-15T11:42:16Z) - From Accidents to Insights: Leveraging Multimodal Data for Scenario-Driven ADS Testing [3.984220091774453]
本稿では,シナリオベースADSテストケース生成フレームワークであるTRACEを紹介する。
マルチモーダルデータを活用して、現実世界の事故報告から困難なシナリオを抽出することで、TRACEは少ないデータで多数の重要なテストケースを構築します。
ユーザからのフィードバックによると、TRACEはシナリオ再構築の精度が優れており、シナリオの77.5%が"ほぼ"あるいは"完全に"一貫性がある"と評価されている。
論文 参考訳(メタデータ) (2025-02-04T05:21:29Z) - AutoPureData: Automated Filtering of Undesirable Web Data to Update LLM Knowledge [0.0]
最新かつ信頼性の高い言語モデルは、一貫して追求され、様々なアプリケーションに欠かせない。
本稿では,Webデータを自動的に収集・浄化するシステムであるAutoPureDataを提案する。
その結果、安全でないテキストを97%の精度で、望ましくないテキストを86%の精度で除去することができた。
論文 参考訳(メタデータ) (2024-06-27T15:37:57Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Abductive Ego-View Accident Video Understanding for Safe Driving
Perception [75.60000661664556]
マルチモーダル・アクシデント・ビデオ理解のための新しいデータセットMM-AUを提案する。
MM-AUには1,727件の映像が収録されている。
安全運転認識のための誘導型事故映像理解フレームワーク(AdVersa-SD)を提案する。
論文 参考訳(メタデータ) (2024-03-01T10:42:52Z) - CrisisMatch: Semi-Supervised Few-Shot Learning for Fine-Grained Disaster
Tweet Classification [51.58605842457186]
半教師付き, 少数ショットの学習環境下で, 微粒な災害ツイート分類モデルを提案する。
私たちのモデルであるCrisisMatchは、ラベルなしデータと大量のラベルなしデータを用いて、ツイートを関心の細かいクラスに効果的に分類する。
論文 参考訳(メタデータ) (2023-10-23T07:01:09Z) - DeepAccident: A Motion and Accident Prediction Benchmark for V2X
Autonomous Driving [76.29141888408265]
本研究では,現実の運転において頻繁に発生する多様な事故シナリオを含む大規模データセットを提案する。
提案したDeepAccidentデータセットには57Kの注釈付きフレームと285Kの注釈付きサンプルが含まれており、これは大規模なnuScenesデータセットの約7倍である。
論文 参考訳(メタデータ) (2023-04-03T17:37:00Z) - Traffic incident duration prediction via a deep learning framework for
text description encoding [9.424574945499842]
本稿では,限られた情報から入射時間を予測するための新しい融合フレームワークを提案する。
申請地域はサンフランシスコ市であり、交通事故記録と過去の交通渋滞情報の両方が豊富である。
論文 参考訳(メタデータ) (2022-09-19T03:16:13Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。