論文の概要: Building Safer Sites: A Large-Scale Multi-Level Dataset for Construction Safety Research
- arxiv url: http://arxiv.org/abs/2508.09203v1
- Date: Sat, 09 Aug 2025 01:26:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-14 20:42:00.611734
- Title: Building Safer Sites: A Large-Scale Multi-Level Dataset for Construction Safety Research
- Title(参考訳): 建設安全研究のための大規模マルチレベルデータセット
- Authors: Zhenhui Ou, Dawei Li, Zhen Tan, Wenlin Li, Huan Liu, Siyuan Song,
- Abstract要約: 建設安全研究は土木工学の重要な分野であり、リスクを軽減し、怪我を防ぐことを目的としている。
既存の建設安全データセットの量の制限と多様性の欠如は、詳細な分析を行う上で大きな課題となる。
本稿では,十分に整理された総合的マルチレベルデータセットであるCSDatasetについて紹介する。
- 参考スコア(独自算出の注目度): 14.491137898035996
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Construction safety research is a critical field in civil engineering, aiming to mitigate risks and prevent injuries through the analysis of site conditions and human factors. However, the limited volume and lack of diversity in existing construction safety datasets pose significant challenges to conducting in-depth analyses. To address this research gap, this paper introduces the Construction Safety Dataset (CSDataset), a well-organized comprehensive multi-level dataset that encompasses incidents, inspections, and violations recorded sourced from the Occupational Safety and Health Administration (OSHA). This dataset uniquely integrates structured attributes with unstructured narratives, facilitating a wide range of approaches driven by machine learning and large language models. We also conduct a preliminary approach benchmarking and various cross-level analyses using our dataset, offering insights to inform and enhance future efforts in construction safety. For example, we found that complaint-driven inspections were associated with a 17.3% reduction in the likelihood of subsequent incidents. Our dataset and code are released at https://github.com/zhenhuiou/Construction-Safety-Dataset-CSDataset.
- Abstract(参考訳): 建設安全研究は土木工学の重要な分野であり、現場の状況や人的要因の分析を通じてリスクを軽減し、怪我を防ぐことを目的としている。
しかし、既存の建設安全データセットの量の制限と多様性の欠如は、詳細な分析を行う上で大きな課題となる。
本研究のギャップに対処するため,Occupational Safety and Health Administration (OSHA) から得られたインシデント,検査,違反を包括的に包括的に包括した総合的多段階データセットである,CSDataset(Constructment Safety Dataset)を紹介した。
このデータセットは構造化属性と構造化されていない物語を一意に統合し、機械学習と大規模言語モデルによって駆動される幅広いアプローチを促進する。
また,我々のデータセットを用いたベンチマークおよび各種クロスレベル分析の予備的手法も実施し,建設安全における今後の取り組みを示唆し,促進するための洞察を提供する。
例えば、苦情駆動検査は、その後の事故の可能性を17.3%減らすことに関係していることがわかった。
データセットとコードはhttps://github.com/zhenhuiou/Construction-Safety-Dataset-CSDataset.comで公開されています。
関連論文リスト
- Cross-Dataset Semantic Segmentation Performance Analysis: Unifying NIST Point Cloud City Datasets for 3D Deep Learning [49.1574468325115]
本研究では、公共安全アプリケーションに関連する異種ラベル付きポイントクラウドデータセット間のセマンティックセマンティックセマンティクス性能を解析する。
主な課題は、ラベル付きデータ不足、データセット間でクラスラベルを統一することの難しさ、標準化の必要性である。
論文 参考訳(メタデータ) (2025-08-01T17:59:02Z) - Overcoming Imbalanced Safety Data Using Extended Accident Triangle [1.1249583407496222]
既存の安全分析研究は目覚ましい進歩を遂げているが、不均衡なデータセットに悩まされている。
我々は,事故の重大度,事故頻度,事故タイプといった特徴に基づいて,データサンプルの重要性を主張するために,事故三角形の理論を拡張した。
さまざまな機械学習アルゴリズムの間で、堅牢な改善が見られます。
論文 参考訳(メタデータ) (2024-08-12T00:36:17Z) - Learning Traffic Crashes as Language: Datasets, Benchmarks, and What-if Causal Analyses [76.59021017301127]
我々は,CrashEventという大規模トラフィッククラッシュ言語データセットを提案し,実世界のクラッシュレポート19,340を要約した。
さらに,クラッシュイベントの特徴学習を,新たなテキスト推論問題として定式化し,さらに様々な大規模言語モデル(LLM)を微調整して,詳細な事故結果を予測する。
実験の結果, LLMに基づくアプローチは事故の重大度を予測できるだけでなく, 事故の種類を分類し, 損害を予測できることがわかった。
論文 参考訳(メタデータ) (2024-06-16T03:10:16Z) - Multiple-input, multiple-output modal testing of a Hawk T1A aircraft: A new full-scale dataset for structural health monitoring [0.32326259807823027]
本稿では, 解体されたBAEシステムホークT1Aの動的応答を計測する新しいベンチマークデータセットを提案する。
単純な実験室の試験構造とサービス内構造の間に重要な足場を提供する。
このデータセットを用いて、構造中の非線形性や、異なるタイプの損傷に対する構造物の感度を示す。
論文 参考訳(メタデータ) (2024-06-07T13:53:24Z) - Object Detectors in the Open Environment: Challenges, Solutions, and Outlook [95.3317059617271]
オープン環境のダイナミックで複雑な性質は、オブジェクト検出器に新しくて恐ろしい挑戦をもたらす。
本稿では,オープン環境におけるオブジェクト検出器の総合的なレビューと解析を行う。
データ/ターゲットの変化の次元に基づいて、4つの四分法(ドメイン外、カテゴリ外、堅牢な学習、漸進的な学習)を含むフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-24T19:32:39Z) - Towards Safer Operations: An Expert-involved Dataset of High-Pressure
Gas Incidents for Preventing Future Failures [4.61913477588949]
本稿では,安全対策のための新しいインシデントAIデータセットを提案する。
データセットは、名前付きエンティティ認識、原因効果抽出、情報検索の3つのタスクから構成される。
安全対策のシナリオにおけるデータセットの貢献を検証した。
論文 参考訳(メタデータ) (2023-10-18T16:07:13Z) - A Review of Topological Data Analysis for Cybersecurity [1.0878040851638]
トポロジカルデータ解析(TDA)は、代数的トポロジの技法を用いて、データの高レベル構造を研究する。
我々は、サイバーセキュリティデータサイエンスを改善する強力な可能性を持つ、有望な新しい領域について、研究者に強調したい。
論文 参考訳(メタデータ) (2022-02-16T13:03:52Z) - Predicting Themes within Complex Unstructured Texts: A Case Study on
Safeguarding Reports [66.39150945184683]
本稿では,教師付き分類手法を用いた保護レポートにおいて,主テーマの自動識別の問題に焦点をあてる。
この結果から,ラベル付きデータに制限のある複雑なタスクであっても,深層学習モデルが対象知識の振る舞いをシミュレートする可能性が示唆された。
論文 参考訳(メタデータ) (2020-10-27T19:48:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。