Fugu-MT 論文翻訳(概要): Crash Severity Risk Modeling Strategies under Data Imbalance

論文の概要: Crash Severity Risk Modeling Strategies under Data Imbalance

arxiv url: http://arxiv.org/abs/2412.02094v1
Date: Tue, 03 Dec 2024 02:28:35 GMT
ステータス: 翻訳完了
システム内更新日: 2024-12-04 21:11:22.845131
Title: Crash Severity Risk Modeling Strategies under Data Imbalance
Title（参考訳）: データ不均衡下における衝突重大度リスクモデリング戦略
Authors: Abdullah Al Mamun, Abyad Enan, Debbie A. Indah, Judith Mwakalonge, Gurcan Comert, Mashrur Chowdhury,
Abstract要約: 本研究では,低重度 (LS) と高重度 (HS) の衝突データ不均衡が存在する場合の大規模車両を含む作業区間における事故重大度リスクモデリング戦略について検討した。 2014年から2018年にかけては、サウスカロライナのワークゾーンで大型車両が衝突し、HSの事故の4倍のLSがクラッシュした。本研究の結果は,クラス不均衡によるLSのクラッシュと,LSとHSのクラッシュの重複により,HSのクラッシュの精度が低く,LSとHSの予測の相違を浮き彫りにした。
参考スコア（独自算出の注目度）: 7.9613232032536745
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: This study investigates crash severity risk modeling strategies for work zones involving large vehicles (i.e., trucks, buses, and vans) when there are crash data imbalance between low-severity (LS) and high-severity (HS) crashes. We utilized crash data, involving large vehicles in South Carolina work zones for the period between 2014 and 2018, which included 4 times more LS crashes compared to HS crashes. The objective of this study is to explore crash severity prediction performance of various models under different feature selection and data balancing techniques. The findings of this study highlight a disparity between LS and HS predictions, with less-accurate prediction of HS crashes compared to LS crashes due to class imbalance and feature overlaps between LS and HS crashes. Combining features from multiple feature selection techniques: statistical correlation, feature importance, recursive elimination, statistical tests, and mutual information, slightly improves HS crash prediction performance. Data balancing techniques such as NearMiss-1 and RandomUnderSampler, maximize HS recall when paired with certain prediction models, such as Bayesian Mixed Logit (BML), NeuralNet, and RandomForest, making them suitable for HS crash prediction. Conversely, RandomOverSampler, HS Class Weighting, and Kernel-based Synthetic Minority Oversampling (K-SMOTE), used with certain prediction models such as BML, CatBoost, and LightGBM, achieve a balanced performance, defined as achieving an equitable trade-off between LS and HS prediction performance metrics. These insights provide safety analysts with guidance to select models, feature selection techniques, and data balancing techniques that align with their specific safety objectives, offering a robust foundation for enhancing work-zone crash severity prediction.
Abstract（参考訳）: 本研究では,低重度(LS)と高重度(HS)の衝突データ不均衡が存在する場合,大型車両(トラック,バス,バン)を含む作業区域における事故重大度リスクモデリング戦略について検討した。 2014年から2018年にかけては、サウスカロライナのワークゾーンで大型車両が衝突し、HSの事故の4倍のLSがクラッシュした。本研究の目的は,異なる特徴選択およびデータ分散手法による各種モデルの衝突重大度予測性能について検討することである。本研究の結果は,クラス不均衡によるLSのクラッシュと,LSとHSのクラッシュの特徴の重なりから,HSのクラッシュの精度の低い予測を行うことで,LSとHSの予測の相違を浮き彫りにしている。統計相関、特徴重要度、再帰的除去、統計的テスト、相互情報といった複数の特徴選択技術の特徴を組み合わせることで、HSクラッシュ予測性能はわずかに改善される。 NearMiss-1やRandomUnderSamplerのようなデータバランシング技術は、Bayesian Mixed Logit (BML)、NeuralNet、RandomForestといった特定の予測モデルと組み合わせることで、HSクラッシュ予測に適したHSリコールを最大化する。逆に、RandomOverSampler、HS Class Weighting、およびKernelベースのSynthetic Minority Oversampling(K-SMOTE)は、BML、CatBoost、LightGBMといった特定の予測モデルで使用され、LSとHS予測パフォーマンスメトリクスの公平なトレードオフを達成するために定義されたバランスの取れたパフォーマンスを達成する。これらの洞察は、特定の安全目標に沿ったモデル、特徴選択テクニック、データバランス技術を選択するためのガイダンスを提供し、ワークゾーンクラッシュの深刻度予測を強化するための堅牢な基盤を提供する。

関連論文リスト

Noisy Analysis of Quantum SMOTE on Condition Monitoring and Fault Classification in Industrial and Energy Systems [0.5505634045241289]
不均衡機械学習モデルは、産業状況の監視と故障分類パイプラインにおける根本的な問題である。この研究は、クラス不均衡緩和の下での古典的分類器の詳細なベンチマークと調査を示す。その結果,QSMOTEは分布スキューを一貫して補正し,非線形分類器の性能を大幅に向上させることがわかった。
論文参考訳（メタデータ） (2026-01-16T16:44:38Z)
Adaptive Defense against Harmful Fine-Tuning for Large Language Models via Bayesian Data Scheduler [67.24175911858312]
有害な微調整は、大規模な言語モデルのための微調整・アズ・ア・サービスに重大な安全性のリスクをもたらす。 Bayesian Data Scheduler (BDS) は、アタックシミュレーションを必要としない適応型チューニングステージ防衛戦略である。 BDSは、微調整データセットとアライメントデータセットに基づいて、各データポイントの安全属性の後方分布を学習する。
論文参考訳（メタデータ） (2025-10-31T04:49:37Z)
FedAWA: Adaptive Optimization of Aggregation Weights in Federated Learning Using Client Vectors [50.131271229165165]
Federated Learning (FL)は、分散機械学習のための有望なフレームワークとして登場した。ユーザの行動、好み、デバイス特性の相違から生じるデータの異質性は、連合学習にとって重要な課題である。本稿では,学習過程におけるクライアントベクトルに基づくアダプティブ重み付けを適応的に調整する手法であるAdaptive Weight Aggregation (FedAWA)を提案する。
論文参考訳（メタデータ） (2025-03-20T04:49:40Z)
Crash Severity Analysis of Child Bicyclists using Arm-Net and MambaNet [0.17476232824732776]
児童自転車(14歳以下)が最も脆弱な道路利用者である。この研究は、2017年から2022年にかけてテキサス州で2394人の児童自転車事故を分析した。
論文参考訳（メタデータ） (2025-03-14T02:02:14Z)
Inverse Reinforcement Learning for Minimum-Exposure Paths in Spatiotemporally Varying Scalar Fields [49.1574468325115]
このようなパスのトレーニングデータセットに類似した最小露出パスのデータセットを合成する問題を考える。本論文の主な貢献は、この問題を解決するための逆強化学習(IRL)モデルである。提案したIRLモデルは,トレーニングデータセットにない初期条件から経路を合成する際の優れた性能を提供する。
論文参考訳（メタデータ） (2025-03-09T13:30:11Z)
Spatiotemporal Prediction of Secondary Crashes by Rebalancing Dynamic and Static Data with Generative Adversarial Networks [6.571659350175123]
二次衝突は交通渋滞を著しく悪化させ、事故の深刻さを増す。既存のメソッドは、トラフィッククラッシュデータの複雑さ、特に動的および静的な機能の共存に完全に対処できない。本研究では,二次衝突データ生成の忠実度向上を目的としたハイブリッドモデルであるVarFusiGAN-Transformerを提案する。
論文参考訳（メタデータ） (2025-01-17T08:56:49Z)
Enhancing Crash Frequency Modeling Based on Augmented Multi-Type Data by Hybrid VAE-Diffusion-Based Generative Neural Networks [13.402051372401822]
衝突頻度モデリングにおける重要な課題は、過剰なゼロ観測の頻度である。我々は、ゼロ観測を減らすために、ハイブリッドなVAE拡散ニューラルネットワークを提案する。我々は、類似性、正確性、多様性、構造的整合性といった指標を用いて、このモデルによって生成された合成データ品質を評価する。
論文参考訳（メタデータ） (2025-01-17T07:53:27Z)
Predictive Models in Sequential Recommendations: Bridging Performance Laws with Data Quality Insights [104.48511402784763]
本稿では,モデル性能とデータ品質の関係を理論的に検討し,モデル化することを目的としたSRモデルの性能法則を紹介する。データ品質を評価するために、従来のデータ量メトリクスと比較して、より曖昧なアプローチを示すために、近似エントロピー(ApEn)を提案する。
論文参考訳（メタデータ） (2024-11-30T10:56:30Z)
SEAL: Safety-enhanced Aligned LLM Fine-tuning via Bilevel Data Selection [92.38300626647342]
SEALは、二段階最適化に基づいてデータローカを学習し、安全で高品質な微調整データをランク付けし、安全でないものや低品質なものをランク付けする。 SEALで訓練されたモデルは、複数のベースラインよりも優れた品質を示し、ランダム選択に比べて8.5%と9.7%の勝利率が上昇した。
論文参考訳（メタデータ） (2024-10-09T22:24:22Z)
Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文参考訳（メタデータ） (2024-06-16T03:10:16Z)
Advancing the Robustness of Large Language Models through Self-Denoised Smoothing [50.54276872204319]
大規模言語モデル(LLM)は大きな成功を収めたが、敵の摂動に対する脆弱性は大きな懸念を引き起こしている。本稿では,LLMのマルチタスク特性を活用して,まずノイズの入力を識別し,次にこれらの復号化バージョンに基づいて予測を行う。 LLMのロバスト性を高めるために個別のモデルを訓練する必要がある従来のコンピュータビジョンのスムース化技術とは異なり、本手法は効率と柔軟性を著しく向上させる。
論文参考訳（メタデータ） (2024-04-18T15:47:00Z)
A Generative Deep Learning Approach for Crash Severity Modeling with Imbalanced Data [6.169163527464771]
本研究では,条件付きタブラリGANに基づくクラッシュデータ生成手法を提案する。分類と解釈の性能を推定するために、クラッシュ重大度モデルを用いる。以上の結果から,CTGAN-RUが生成した合成データを用いた衝突重大度モデリングは,他の再サンプリング法により生成された原データや合成データよりも優れていたことが示唆された。
論文参考訳（メタデータ） (2024-04-02T16:07:27Z)
Multi-class real-time crash risk forecasting using convolutional neural network: Istanbul case study [0.0]
本稿では,事故リスク予測におけるニューラルネットワーク(ANN)の性能について述べる。提案したCNNモデルは、記録、処理、分類された入力特性から学習することができる。本研究は,CNNモデルをリアルタイムの事故リスク予測のためのマルチクラス予測モデルとして適用することを提案する。
論文参考訳（メタデータ） (2024-02-09T10:51:09Z)
The Risk of Federated Learning to Skew Fine-Tuning Features and Underperform Out-of-Distribution Robustness [50.52507648690234]
フェデレートされた学習は、微調整された特徴をスキイングし、モデルの堅牢性を損なうリスクがある。 3つのロバスト性指標を導入し、多様なロバストデータセットで実験を行う。提案手法は,パラメータ効率のよい微調整手法を含む多種多様なシナリオにまたがるロバスト性を著しく向上させる。
論文参考訳（メタデータ） (2024-01-25T09:18:51Z)
Heterogeneous Ensemble Learning for Enhanced Crash Forecasts -- A Frequentest and Machine Learning based Stacking Framework [0.803552105641624]
本研究では,都市および郊外の5車線未分割セグメント(5T)の衝突頻度をモデル化するために,重要なHEM手法の1つ,スタックリングを適用した。 Stackingの予測性能は、パラメトリック統計モデル(Poissonと負二項法)と機械学習技術の3つの状態(決定木、ランダム森林、勾配上昇)と比較される。
論文参考訳（メタデータ） (2022-07-21T19:15:53Z)
Causal Analysis and Classification of Traffic Crash Injury Severity Using Machine Learning Algorithms [0.0]
この調査で使用されたデータは、2014年から2019年までの6年間にテキサス州のすべての州間高速道路で交通事故が発生した際に得られたものです。提案手法は,致命的・重傷(KA),非重傷(BC),財産被害(PDO)の3つのクラスを含む。 Grangerの因果関係分析の結果、速度制限、表面および気象条件、交通量、ワークゾーンの存在、ワークゾーンの労働者、高占有車線(HOV)が事故の深刻度に影響を及ぼす最も重要な要因として特定された。
論文参考訳（メタデータ） (2021-11-30T20:32:31Z)
A model for traffic incident prediction using emergency braking data [77.34726150561087]
道路交通事故予測におけるデータ不足の根本的な課題を、事故の代わりに緊急ブレーキイベントをトレーニングすることで解決します。メルセデス・ベンツ車両の緊急ブレーキデータに基づくドイツにおける交通事故予測モデルを実装したプロトタイプを提案する。
論文参考訳（メタデータ） (2021-02-12T18:17:12Z)
Learning while Respecting Privacy and Robustness to Distributional Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文参考訳（メタデータ） (2020-07-07T18:25:25Z)
Chance-Constrained Trajectory Optimization for Safe Exploration and Learning of Nonlinear Systems [81.7983463275447]
学習に基づく制御アルゴリズムは、訓練のための豊富な監督を伴うデータ収集を必要とする。本稿では,機会制約付き最適制御と動的学習とフィードバック制御を統合した安全な探索による最適動作計画のための新しいアプローチを提案する。
論文参考訳（メタデータ） (2020-05-09T05:57:43Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。