論文の概要: Listening to the Workforce: Measuring Construction Worker Safety Attitudes from Social Media Discourse Using LLMs
- arxiv url: http://arxiv.org/abs/2606.04450v1
- Date: Wed, 03 Jun 2026 04:54:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-04 20:44:18.553734
- Title: Listening to the Workforce: Measuring Construction Worker Safety Attitudes from Social Media Discourse Using LLMs
- Title(参考訳): ワークフォースの聴取:LLMを用いたソーシャルメディア談話からの建設作業者の安全態度の測定
- Authors: Farouq Sammour, Yuxin Zhang, Zhenyu Zhang,
- Abstract要約: 安全姿勢は多次元的であり、話題によって異なり、労働者自身の会話の中で最も率直に表れている。
本研究は,建設安全姿勢枠組み(CSAF)の作成と検証を行った。
CSAFをRedditのr/Constructionコミュニティから250の投稿やコメントに適用すると、訓練されたコーダーは強い合意に達した。
- 参考スコア(独自算出の注目度): 14.954283279019817
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Worker safety attitudes are key determinants of whether protective practices are applied or bypassed on construction sites. Yet measuring them at scale has remained out of reach. Safety attitudes are multidimensional, vary across topics, and surface most candidly in workers' own conversations. This study created and validated the Construction Safety Attitude Framework (CSAF), which integrates two components: a theory-grounded structure that characterizes safety attitudes along eight dimensions, and an operational codebook for measuring them in worker naturalistic discourse. Applying CSAF to 250 posts and comments from the r/Construction community on Reddit, trained coders reached strong agreement (Krippendorff's α = 0.85). Pairwise lift and conditional probability confirmed that the eight dimensions are related yet distinct. To apply the framework across large volumes of discourse, CSAF was operationalized through a large language model (LLM) classifier. On 450 r/Construction contributions, the classifier reproduced expert human coding (Cohen's \k{appa} = 0.90, precision = 0.98, recall = 0.98), and on 400 contributions from r/Roofing it retained that accuracy after transfer to a different trade community (\k{appa} = 0.89, precision = 0.98, recall = 0.97). A proof-of-value case study then applied the validated classifier to 10,346 contributions from r/Roofing, demonstrating that CSAF can distinguish multidimensional attitudes by safety topic, track how they shift over time, and trace the reasoning behind unfavorable ones. The study therefore provides a theoretically grounded, empirically vetted instrument for examining safety attitudes, offering a basis for targeted interventions that address the attitudes underlying unsafe practices.
- Abstract(参考訳): 労働者の安全姿勢は、建設現場で保護措置が適用されるか、バイパスされるかの重要な決定要因である。
しかし、それらを大規模に測定することは、まだ手の届かないままだ。
安全姿勢は多次元的であり、話題によって異なり、労働者自身の会話の中で最も率直に表れている。
本研究は,8次元に沿った安全姿勢を特徴付ける理論的基盤構造と,作業者の自然主義的言論においてそれらを測定するための運用コードブックという,2つの構成要素を統合した建設安全姿勢フレームワーク(CSAF)を作成した。
CSAFをRedditのr/Constructionコミュニティから250の投稿やコメントに適用すると、訓練されたプログラマは強い合意に達した(Krippendorffのα = 0.85)。
ペアワイズリフトと条件付き確率は、8つの次元がまだ関係していないことを確認した。
CSAF は大規模言語モデル (LLM) 分類器で運用された。
450 r/コンストラクションのコントリビューションにおいて、分類器は専門家の人間のコーディングを再現し(コーエンの「k{appa} = 0.90」、精度 = 0.98、リコール = 0.98)、r/Roofingからの400のコントリビューションでは、異なる貿易共同体への移転後の精度を維持した(\k{appa} = 0.89、精度 = 0.98、リコール = 0.97)。
その後、検証済みの分類器をr/Roofingから10,346のコントリビューションに適用し、CSAFが安全トピックによって多次元の姿勢を区別し、時間とともにどのように変化するかを追跡し、好ましくないものの背後にある推論を追跡できることを実証した。
この研究は、理論的に根拠があり、実証的に検証された、安全姿勢を調べるための手段を提供し、安全でない慣行の根底にある態度に対処する目的の介入の基礎を提供する。
関連論文リスト
- Reducing the Safety Tax in LLM Safety Alignment with On-Policy Self-Distillation [22.972195366680694]
安全アライメントは、しばしば推論能力の犠牲で有害なクエリに対する堅牢性を改善する。
OPSAと呼ばれる安全アライメントのための自己蒸留法について検討した。
OPSAは、外部の自己蒸留や外部のティーチンガー蒸留よりも安全性の高いトレードオフを実現している。
論文 参考訳(メタデータ) (2026-05-14T03:40:07Z) - SafeSci: Safety Evaluation of Large Language Models in Science Domains and Beyond [134.43113804188195]
安全評価と科学的文脈の強化のための包括的枠組みであるSafeSciを紹介する。
SafeSciには、0.25Mサンプルを持つマルチディシプリナのベンチマークであるSafeSciBenchと、安全性向上のための1.5Mサンプルを含む大規模データセットであるSafeSciTrainが含まれている。
論文 参考訳(メタデータ) (2026-03-02T08:16:04Z) - SafeWork-R1: Coevolving Safety and Intelligence under the AI-45$^{\circ}$ Law [91.33824439029533]
我々は,機能と安全性の共進化を示す最先端のマルチモーダル推論モデルであるSafeWork-R1を紹介する。
大規模でプログレッシブで安全指向の強化学習をポストトレーニングに取り入れたSafeLadderフレームワークを開発した。
さらに,SafeWork-R1-InternVL3-78B,SafeWork-R1-DeepSeek-70B,SafeWork-R1-Qwen2.5VL-7Bを開発した。
論文 参考訳(メタデータ) (2025-07-24T16:49:19Z) - Safety Subspaces are Not Linearly Distinct: A Fine-Tuning Case Study [10.17362679822278]
大規模言語モデルは社会的に許容できる応答を生成するために安全アライメントに依存している。
増大する作業体は、アライメントが重量空間における識別可能な方向に対応する可能性があることを示唆している。
安全性はモデルの一般的な学習要素と強く結びついていることが示される。
論文 参考訳(メタデータ) (2025-05-20T10:41:49Z) - ALERT: A Comprehensive Benchmark for Assessing Large Language Models' Safety through Red Teaming [64.86326523181553]
ALERTは、新しいきめ細かいリスク分類に基づいて安全性を評価するための大規模なベンチマークである。
脆弱性を特定し、改善を通知し、言語モデルの全体的な安全性を高めることを目的としている。
論文 参考訳(メタデータ) (2024-04-06T15:01:47Z) - Fail-Safe Adversarial Generative Imitation Learning [9.594432031144716]
本稿では, 安全な生成連続ポリシー, エンドツーエンドの生成逆トレーニング, 最悪の場合の安全性保証を, クローズドフォームの確率密度/勾配で実現する安全層を提案する。
安全層は、すべてのアクションを安全なアクションの集合にマッピングし、変量式と密度の測定値の加算率を使用する。
実世界のドライバーのインタラクションデータに関する実験では,提案手法のトラクタビリティ,安全性,模倣性能を実証的に実証した。
論文 参考訳(メタデータ) (2022-03-03T13:03:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。