論文の概要: ErgoChat: a Visual Query System for the Ergonomic Risk Assessment of Construction Workers
- arxiv url: http://arxiv.org/abs/2412.19954v1
- Date: Fri, 27 Dec 2024 23:25:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-31 16:07:43.826180
- Title: ErgoChat: a Visual Query System for the Ergonomic Risk Assessment of Construction Workers
- Title(参考訳): ErgoChat - 建設作業者のエルゴノミクスリスクアセスメントのためのビジュアルクエリシステム
- Authors: Chao Fan, Qipei Mei, Xiaonan Wang, Xinming Li,
- Abstract要約: 本研究では, 作業者の姿勢のエルゴノミクスリスクを評価するために, 対話型ビジュアルクエリシステムを提案する。
システムには視覚的質問応答 (VQA) があり、作業者の姿勢エルゴノミクスリスクへの露出に関する視覚的クエリに応答する。
- 参考スコア(独自算出の注目度): 6.1016815111849345
- License:
- Abstract: In the construction sector, workers often endure prolonged periods of high-intensity physical work and prolonged use of tools, resulting in injuries and illnesses primarily linked to postural ergonomic risks, a longstanding predominant health concern. To mitigate these risks, researchers have applied various technological methods to identify the ergonomic risks that construction workers face. However, traditional ergonomic risk assessment (ERA) techniques do not offer interactive feedback. The rapidly developing vision-language models (VLMs), capable of generating textual descriptions or answering questions about ergonomic risks based on image inputs, have not yet received widespread attention. This research introduces an interactive visual query system tailored to assess the postural ergonomic risks of construction workers. The system's capabilities include visual question answering (VQA), which responds to visual queries regarding workers' exposure to postural ergonomic risks, and image captioning (IC), which generates textual descriptions of these risks from images. Additionally, this study proposes a dataset designed for training and testing such methodologies. Systematic testing indicates that the VQA functionality delivers an accuracy of 96.5%. Moreover, evaluations using nine metrics for IC and assessments from human experts indicate that the proposed approach surpasses the performance of a method using the same architecture trained solely on generic datasets. This study sets a new direction for future developments in interactive ERA using generative artificial intelligence (AI) technologies.
- Abstract(参考訳): 建設業では、労働者は、高強度の身体的作業の長い期間を耐え、道具の使用の長い期間を過ごすことがあり、その結果、主に術後のエルゴノミクスのリスクと関連する怪我や病気が発生し、健康上の懸念は長く続いた。
これらのリスクを軽減するために、研究者は、建設労働者が直面する人間工学的リスクを特定するために、様々な技術手法を適用した。
しかし、従来の人間工学的リスクアセスメント(ERA)技術は、対話的なフィードバックを提供していない。
画像入力に基づいてテキスト記述や人間工学的リスクに関する質問に回答できる視覚言語モデル(VLM)は、まだ広く注目を集めていない。
本研究では, 作業者の姿勢の人間工学的リスクを評価するために, 対話型ビジュアルクエリシステムを提案する。
システムには視覚的質問応答 (VQA) があり、作業者の姿勢のエルゴノミクスリスクへの暴露に関する視覚的クエリに応答する。
さらに,本研究では,そのような方法論を訓練し,テストするためのデータセットを提案する。
システムテストは、VQA機能が96.5%の精度を提供することを示している。
さらに、ICの9つの指標を用いた評価や、人間の専門家による評価は、提案手法がジェネリックデータセットのみにトレーニングされた同じアーキテクチャを用いた手法の性能を上回ることを示唆している。
本研究は,生成人工知能(AI)技術を用いた対話型ERAの今後の発展に向けての新たな方向性を定めている。
関連論文リスト
- Computational Safety for Generative AI: A Signal Processing Perspective [65.268245109828]
計算安全性は、GenAIにおける安全性の定量的評価、定式化、研究を可能にする数学的枠組みである。
ジェイルブレイクによる悪意のあるプロンプトを検出するために, 感度解析と損失景観解析がいかに有効かを示す。
我々は、AIの安全性における信号処理の鍵となる研究課題、機会、そして重要な役割について論じる。
論文 参考訳(メタデータ) (2025-02-18T02:26:50Z) - Real-Time Posture Monitoring and Risk Assessment for Manual Lifting Tasks Using MediaPipe and LSTM [1.675857332621569]
筋骨格障害(英: Musculoskeletal disorders、MSD)は、手動浮揚に関わる労働者にとって重要な問題である。
従来の姿勢補正法は、フィードバックの遅れやパーソナライズされた評価の欠如により、しばしば不十分である。
提案手法は,AIによる姿勢検出,詳細なキーポイント分析,リスクレベル決定,ユーザフレンドリーなWebインターフェースによるリアルタイムフィードバックを統合した。
論文 参考訳(メタデータ) (2024-08-23T02:19:52Z) - Risks and NLP Design: A Case Study on Procedural Document QA [52.557503571760215]
より具体的なアプリケーションやユーザに対して分析を専門化すれば,ユーザに対するリスクや害の明確な評価が可能になる,と我々は主張する。
リスク指向のエラー分析を行い、リスクの低減とパフォーマンスの向上を図り、将来のシステムの設計を通知する。
論文 参考訳(メタデータ) (2024-08-16T17:23:43Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - Reporting Risks in AI-based Assistive Technology Research: A Systematic Review [2.928964540437144]
視覚障害者のためのAIベースの支援技術に関する研究について,系統的な文献レビューを行った。
本研究は, 実証可能なプロトタイプを用いたほとんどの技術が, 観光コミュニティのメンバーによる人間による研究では評価されていないことを示す。
論文 参考訳(メタデータ) (2024-07-01T05:22:44Z) - Human Uncertainty in Concept-Based AI Systems [37.82747673914624]
概念に基づくAIシステムのコンテキストにおける人間の不確実性について検討する。
不確実な概念ラベルによるトレーニングは、概念ベースシステムにおける弱点を軽減するのに役立つ可能性がある。
論文 参考訳(メタデータ) (2023-03-22T19:17:57Z) - Robot Navigation in Risky, Crowded Environments: Understanding Human
Preferences [6.1364879462585185]
リスクと混み合った環境(RCE)は、人間によって異なる知覚されるリスクと不確実性の抽象的な源を含んでいる。
本研究では,より優れたナビゲーション説明可能なAI(XAI)の設計を支援するために,人間の行動と知覚に関する斬新で批判的な洞察を提供する。
論文 参考訳(メタデータ) (2023-03-15T00:11:39Z) - Informing clinical assessment by contextualizing post-hoc explanations
of risk prediction models in type-2 diabetes [50.8044927215346]
本研究は, 合併症リスク予測のシナリオを考察し, 患者の臨床状態に関する文脈に焦点を当てる。
我々は、リスク予測モデル推論に関する文脈を提示し、その受容性を評価するために、最先端のLLMをいくつか採用する。
本論文は,実世界における臨床症例における文脈説明の有効性と有用性を明らかにする最初のエンドツーエンド分析の1つである。
論文 参考訳(メタデータ) (2023-02-11T18:07:11Z) - A Survey on Computer Vision based Human Analysis in the COVID-19 Era [58.79053747159797]
新型コロナウイルスの出現は、社会全体だけでなく、個人の生活にも大きく影響している。
マスクやソーシャルディスタンシングの義務、公共空間での定期消毒、スクリーニングアプリケーションの使用など、さまざまな予防策が世界中で導入されている。
これらの発展は、(i)視覚データの自動解析による予防対策の支援、(ii)生体認証などの既存の視覚ベースのサービスの正常な操作を容易にする、新しいコンピュータビジョン技術の必要性を喚起した。
論文 参考訳(メタデータ) (2022-11-07T17:20:39Z) - Characterizing Human Explanation Strategies to Inform the Design of
Explainable AI for Building Damage Assessment [10.447869130396624]
説明可能なAI(XAI)は、高度な視覚的検出タスクのための人間とAIのコラボレーションをサポートするための有望な手段である。
衛星画像に基づく建物被害の深刻度を評価する際に, 利用者の自己評価の方法を理解するために, クラウドソーシングによるオンライン調査を行った。
60人のクラウドワーカーによる調査を通じて、人間の視覚的損傷評価を説明するために活用される6つの主要な戦略を明らかにした。
論文 参考訳(メタデータ) (2021-11-04T04:53:57Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。