論文の概要: Enhancing Crash Frequency Modeling Based on Augmented Multi-Type Data by Hybrid VAE-Diffusion-Based Generative Neural Networks
- arxiv url: http://arxiv.org/abs/2501.10017v1
- Date: Fri, 17 Jan 2025 07:53:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-20 13:59:08.245364
- Title: Enhancing Crash Frequency Modeling Based on Augmented Multi-Type Data by Hybrid VAE-Diffusion-Based Generative Neural Networks
- Title(参考訳): ハイブリッドVAE拡散型生成ニューラルネットワークによる拡張型マルチタイプデータに基づく衝突頻度のモデル化
- Authors: Junlan Chen, Qijie He, Pei Liu, Wei Ma, Ziyuan Pu,
- Abstract要約: 衝突頻度モデリングにおける重要な課題は、過剰なゼロ観測の頻度である。
我々は、ゼロ観測を減らすために、ハイブリッドなVAE拡散ニューラルネットワークを提案する。
我々は、類似性、正確性、多様性、構造的整合性といった指標を用いて、このモデルによって生成された合成データ品質を評価する。
- 参考スコア(独自算出の注目度): 13.402051372401822
- License:
- Abstract: Crash frequency modelling analyzes the impact of factors like traffic volume, road geometry, and environmental conditions on crash occurrences. Inaccurate predictions can distort our understanding of these factors, leading to misguided policies and wasted resources, which jeopardize traffic safety. A key challenge in crash frequency modelling is the prevalence of excessive zero observations, caused by underreporting, the low probability of crashes, and high data collection costs. These zero observations often reduce model accuracy and introduce bias, complicating safety decision making. While existing approaches, such as statistical methods, data aggregation, and resampling, attempt to address this issue, they either rely on restrictive assumptions or result in significant information loss, distorting crash data. To overcome these limitations, we propose a hybrid VAE-Diffusion neural network, designed to reduce zero observations and handle the complexities of multi-type tabular crash data (count, ordinal, nominal, and real-valued variables). We assess the synthetic data quality generated by this model through metrics like similarity, accuracy, diversity, and structural consistency, and compare its predictive performance against traditional statistical models. Our findings demonstrate that the hybrid VAE-Diffusion model outperforms baseline models across all metrics, offering a more effective approach to augmenting crash data and improving the accuracy of crash frequency predictions. This study highlights the potential of synthetic data to enhance traffic safety by improving crash frequency modelling and informing better policy decisions.
- Abstract(参考訳): 衝突頻度モデリングは、交通量、道路形状、環境条件などの要因が事故発生に与える影響を分析する。
不正確な予測は、これらの要因の理解を歪め、誤ったポリシーやリソースを浪費し、交通安全を損なう。
衝突頻度モデリングにおける重要な課題は、過度なゼロ観測の頻度であり、過度な報告、衝突の確率の低いこと、データ収集コストが高いことである。
これらのゼロ観測は、しばしばモデルの精度を低下させ、バイアスを導入し、安全性の決定を複雑にする。
統計手法やデータアグリゲーション、再サンプリングといった既存のアプローチはこの問題に対処しようとするが、それらは限定的な仮定に依存するか、あるいは重大な情報損失を引き起こし、クラッシュデータを歪ませる。
これらの制限を克服するため,マルチタイプのタブ型クラッシュデータ(数,順序,名目,実数値変数)の複雑さを考慮し,観測回数をゼロに抑えるハイブリッドなVAE拡散ニューラルネットワークを提案する。
我々は、類似性、正確性、多様性、構造的整合性などの指標を用いて、このモデルによって生成された合成データ品質を評価し、その予測性能を従来の統計モデルと比較する。
以上の結果から,VAE-Diffusionハイブリッドモデルは,すべての指標においてベースラインモデルよりも優れており,クラッシュデータの増大とクラッシュ頻度予測の精度向上に有効なアプローチを提供する。
本研究は、事故頻度モデリングを改善し、より良い政策決定を行うことにより、交通安全を高めるための合成データの可能性を強調した。
関連論文リスト
- Spatiotemporal Prediction of Secondary Crashes by Rebalancing Dynamic and Static Data with Generative Adversarial Networks [6.571659350175123]
二次衝突は交通渋滞を著しく悪化させ、事故の深刻さを増す。
既存のメソッドは、トラフィッククラッシュデータの複雑さ、特に動的および静的な機能の共存に完全に対処できない。
本研究では,二次衝突データ生成の忠実度向上を目的としたハイブリッドモデルであるVarFusiGAN-Transformerを提案する。
論文 参考訳(メタデータ) (2025-01-17T08:56:49Z) - Feature Group Tabular Transformer: A Novel Approach to Traffic Crash Modeling and Causality Analysis [0.40964539027092917]
本研究では,複数のソースから融合した包括的データセットを用いて,衝突のタイプを予測する新しい手法を提案する。
我々のアプローチの中心は、異なるデータを有意な特徴群に整理する特徴群タブラルトランスフォーマー(FGTT)モデルの開発である。
FGTTモデルは、ランダムフォレスト、XGBoost、CatBoostなど、広く使われているツリーアンサンブルモデルと比較され、優れた予測性能を示している。
論文 参考訳(メタデータ) (2024-12-06T20:47:13Z) - Crash Severity Risk Modeling Strategies under Data Imbalance [7.9613232032536745]
本研究では,低重度 (LS) と高重度 (HS) の衝突データ不均衡が存在する場合の大規模車両を含む作業区間における事故重大度リスクモデリング戦略について検討した。
2014年から2018年にかけては、サウスカロライナのワークゾーンで大型車両が衝突し、HSの事故の4倍のLSがクラッシュした。
本研究の結果は,クラス不均衡によるLSのクラッシュと,LSとHSのクラッシュの重複により,HSのクラッシュの精度が低く,LSとHSの予測の相違を浮き彫りにした。
論文 参考訳(メタデータ) (2024-12-03T02:28:35Z) - Using Generative Models to Produce Realistic Populations of the United Kingdom Windstorms [0.0]
論文は、現実的な合成風速データを生成するための生成モデルの適用を探求する。
標準的なGAN、WGAN-GP、U-net拡散モデルを含む3つのモデルを使用して、イギリスの風図を作成した。
その結果、全てのモデルが一般的な空間特性を捉えるのに有効であるが、それぞれのモデルは異なる強みと弱みを示すことが明らかとなった。
論文 参考訳(メタデータ) (2024-09-16T19:53:33Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - A Generative Deep Learning Approach for Crash Severity Modeling with Imbalanced Data [6.169163527464771]
本研究では,条件付きタブラリGANに基づくクラッシュデータ生成手法を提案する。
分類と解釈の性能を推定するために、クラッシュ重大度モデルを用いる。
以上の結果から,CTGAN-RUが生成した合成データを用いた衝突重大度モデリングは,他の再サンプリング法により生成された原データや合成データよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-04-02T16:07:27Z) - The Risk of Federated Learning to Skew Fine-Tuning Features and
Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。
3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。
提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文 参考訳(メタデータ) (2024-01-25T09:18:51Z) - A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。
メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文 参考訳(メタデータ) (2021-02-12T18:17:12Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - Trust but Verify: Assigning Prediction Credibility by Counterfactual
Constrained Learning [123.3472310767721]
予測信頼性尺度は統計学と機械学習において基本的なものである。
これらの措置は、実際に使用される多種多様なモデルを考慮に入れるべきである。
この研究で開発されたフレームワークは、リスクフィットのトレードオフとして信頼性を表現している。
論文 参考訳(メタデータ) (2020-11-24T19:52:38Z) - Unlabelled Data Improves Bayesian Uncertainty Calibration under
Covariate Shift [100.52588638477862]
後続正則化に基づく近似ベイズ推定法を開発した。
前立腺癌の予後モデルを世界規模で導入する上で,本手法の有用性を実証する。
論文 参考訳(メタデータ) (2020-06-26T13:50:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。