論文の概要: Overcoming Imbalanced Safety Data Using Extended Accident Triangle
- arxiv url: http://arxiv.org/abs/2408.07094v1
- Date: Mon, 12 Aug 2024 00:36:17 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 15:07:25.902374
- Title: Overcoming Imbalanced Safety Data Using Extended Accident Triangle
- Title(参考訳): 拡張事故トライアングルを用いた不均衡安全データの克服
- Authors: Kailai Sun, Tianxiang Lan, Yang Miang Goh, Yueng-Hsiang Huang,
- Abstract要約: 既存の安全分析研究は目覚ましい進歩を遂げているが、不均衡なデータセットに悩まされている。
我々は,事故の重大度,事故頻度,事故タイプといった特徴に基づいて,データサンプルの重要性を主張するために,事故三角形の理論を拡張した。
さまざまな機械学習アルゴリズムの間で、堅牢な改善が見られます。
- 参考スコア(独自算出の注目度): 1.1249583407496222
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: There is growing interest in using safety analytics and machine learning to support the prevention of workplace incidents, especially in high-risk industries like construction and trucking. Although existing safety analytics studies have made remarkable progress, they suffer from imbalanced datasets, a common problem in safety analytics, resulting in prediction inaccuracies. This can lead to management problems, e.g., incorrect resource allocation and improper interventions. To overcome the imbalanced data problem, we extend the theory of accident triangle to claim that the importance of data samples should be based on characteristics such as injury severity, accident frequency, and accident type. Thus, three oversampling methods are proposed based on assigning different weights to samples in the minority class. We find robust improvements among different machine learning algorithms. For the lack of open-source safety datasets, we are sharing three imbalanced datasets, e.g., a 9-year nationwide construction accident record dataset, and their corresponding codes.
- Abstract(参考訳): 安全分析と機械学習を使って職場事故の防止、特に建設やトラックなどのリスクの高い産業への関心が高まっている。
既存の安全分析研究は目覚ましい進歩を遂げているが、安全分析の一般的な問題である不均衡なデータセットに悩まされ、予測の不正確な結果となった。
これは、例えば、誤ったリソース割り当てや不適切な介入といった管理上の問題を引き起こす可能性がある。
不均衡なデータ問題を克服するため,事故の重大度,事故頻度,事故タイプといった特徴に基づいて,データサンプルの重要性を主張するために,事故三角形の理論を拡張した。
そこで, マイノリティクラスにおけるサンプルに異なる重みを割り当てることで, 3つのオーバーサンプリング手法を提案する。
さまざまな機械学習アルゴリズムの間で、堅牢な改善が見られます。
オープンソースの安全データセットがないため、私たちは3つの不均衡なデータセット、例えば、全国9年間の建設事故記録データセット、およびそれらのコードを共有しています。
関連論文リスト
- Ultra-imbalanced classification guided by statistical information [24.969543903532664]
我々は,エンフルトラ不均衡分類(UIC)と呼ばれる新しい定式化を提案することによって,不均衡学習に対する集団レベルのアプローチをとる。
UICでは、無限のトレーニングサンプルが利用可能であっても、損失関数は異なる振る舞いをする。
UIC下でのデータ不均衡に対して確実に抵抗できる新しい学習目標であるTunable Boosting Lossを開発した。
論文 参考訳(メタデータ) (2024-09-06T08:07:09Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - A Generative Deep Learning Approach for Crash Severity Modeling with Imbalanced Data [6.169163527464771]
本研究では,条件付きタブラリGANに基づくクラッシュデータ生成手法を提案する。
分類と解釈の性能を推定するために、クラッシュ重大度モデルを用いる。
以上の結果から,CTGAN-RUが生成した合成データを用いた衝突重大度モデリングは,他の再サンプリング法により生成された原データや合成データよりも優れていたことが示唆された。
論文 参考訳(メタデータ) (2024-04-02T16:07:27Z) - Analyzing Adversarial Inputs in Deep Reinforcement Learning [53.3760591018817]
本稿では, 正当性検証のレンズを用いて, 逆入力の特性を包括的に解析する。
このような摂動に対する感受性に基づいてモデルを分類するために、新しい計量である逆数率(Adversarial Rate)を導入する。
本分析は, 直交入力が所定のDRLシステムの安全性にどのように影響するかを実証的に示す。
論文 参考訳(メタデータ) (2024-02-07T21:58:40Z) - Neural Collapse Terminus: A Unified Solution for Class Incremental
Learning and Its Variants [166.916517335816]
本稿では,3つの課題における不整合ジレンマに対する統一解を提案する。
ラベル空間全体の最大等角的クラス間分離を有する固定構造である神経崩壊終端を提案する。
本手法は,データ不均衡やデータ不足にかかわらず,神経崩壊最適度を漸進的に保持する。
論文 参考訳(メタデータ) (2023-08-03T13:09:59Z) - Predicting Seriousness of Injury in a Traffic Accident: A New Imbalanced
Dataset and Benchmark [62.997667081978825]
本稿では,交通事故における傷害の重大性を予測するために,機械学習アルゴリズムの性能を評価する新しいデータセットを提案する。
データセットは、英国運輸省から公開されているデータセットを集約することで作成される。
論文 参考訳(メタデータ) (2022-05-20T21:15:26Z) - Prediction of motor insurance claims occurrence as an imbalanced machine
learning problem [0.0]
巨大なデータセットを持つ保険業界は、ビッグデータソリューションを使用する自然な場所です。
この研究の主な目的は、不均衡なデータセットを扱う様々な方法を提示し、適用することである。
また,自動車保険におけるクレーム発生予測の文脈において,これらの手法を用いて機械学習アルゴリズムの結果を比較した。
論文 参考訳(メタデータ) (2022-04-12T22:41:47Z) - Risk Minimization from Adaptively Collected Data: Guarantees for
Supervised and Policy Learning [57.88785630755165]
経験的リスク最小化(Empirical Risk Minimization, ERM)は、機械学習のワークホースであるが、適応的に収集されたデータを使用すると、そのモデルに依存しない保証が失敗する可能性がある。
本研究では,仮説クラス上での損失関数の平均値を最小限に抑えるため,適応的に収集したデータを用いた一般的な重み付きERMアルゴリズムについて検討する。
政策学習では、探索がゼロになるたびに既存の文献のオープンギャップを埋める率-最適後悔保証を提供する。
論文 参考訳(メタデータ) (2021-06-03T09:50:13Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。