論文の概要: Safe-Construct: Redefining Construction Safety Violation Recognition as 3D Multi-View Engagement Task
- arxiv url: http://arxiv.org/abs/2504.10880v1
- Date: Tue, 15 Apr 2025 05:21:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:09:59.600534
- Title: Safe-Construct: Redefining Construction Safety Violation Recognition as 3D Multi-View Engagement Task
- Title(参考訳): セーフコンストラクション:3次元マルチビューエンゲージメントタスクとして建設安全違反認識を再定義する
- Authors: Aviral Chharia, Tianyu Ren, Tomotake Furuhata, Kenji Shimada,
- Abstract要約: 違反認識を3次元多視点エンゲージメントタスクとして再構成するフレームワークであるSafe-Constructを紹介する。
Safe-Constructは、4つの違反タイプにわたる最先端メソッドよりも7.6%改善されている。
- 参考スコア(独自算出の注目度): 2.0811729303868005
- License:
- Abstract: Recognizing safety violations in construction environments is critical yet remains underexplored in computer vision. Existing models predominantly rely on 2D object detection, which fails to capture the complexities of real-world violations due to: (i) an oversimplified task formulation treating violation recognition merely as object detection, (ii) inadequate validation under realistic conditions, (iii) absence of standardized baselines, and (iv) limited scalability from the unavailability of synthetic dataset generators for diverse construction scenarios. To address these challenges, we introduce Safe-Construct, the first framework that reformulates violation recognition as a 3D multi-view engagement task, leveraging scene-level worker-object context and 3D spatial understanding. We also propose the Synthetic Indoor Construction Site Generator (SICSG) to create diverse, scalable training data, overcoming data limitations. Safe-Construct achieves a 7.6% improvement over state-of-the-art methods across four violation types. We rigorously evaluate our approach in near-realistic settings, incorporating four violations, four workers, 14 objects, and challenging conditions like occlusions (worker-object, worker-worker) and variable illumination (back-lighting, overexposure, sunlight). By integrating 3D multi-view spatial understanding and synthetic data generation, Safe-Construct sets a new benchmark for scalable and robust safety monitoring in high-risk industries. Project Website: https://Safe-Construct.github.io/Safe-Construct
- Abstract(参考訳): 建設環境における安全違反の認識は重要であるが、コンピュータビジョンでは未解明のままである。
既存のモデルは、主に2Dオブジェクト検出に依存しており、これは現実世界の違反の複雑さを捉えるのに失敗する。
一 違反認識を単に物検出として処理する過度に単純化されたタスク定式化
(二 現実的な条件下での検証が不十分であること。)
三 基準基準の定めがないこと、及び
(4) 多様な構築シナリオのための合成データセットジェネレータが利用できないことによるスケーラビリティの制限。
これらの課題に対処するために,3次元多視点エンゲージメントタスクとして違反認識を再構成する最初のフレームワークであるSafe-Constructを導入し,シーンレベルの作業対象コンテキストと3次元空間理解を活用する。
また,Synthetic Indoor Construction Site Generator (SICSG) を提案し,データ制限を克服し,多様なスケーラブルなトレーニングデータを作成する。
Safe-Constructは、4つの違反タイプにわたる最先端メソッドよりも7.6%改善されている。
4件の違反、4件の労働者、4件の作業物、14件の作業物、およびオクルージョン(作業者、作業者、作業者)、可変照明(バックライト、過剰露光、日光)といった困難な条件を取り入れて、我々のアプローチをほぼ現実的に評価した。
3次元の空間的理解と合成データ生成を統合することで、Safe-Constructは、高リスク産業におけるスケーラブルで堅牢な安全監視のための新しいベンチマークを設定できる。
Project Webサイト: https://Safe-Construct.github.io/Safe-Construct
関連論文リスト
- Generalizing Safety Beyond Collision-Avoidance via Latent-Space Reachability Analysis [6.267574471145217]
Hamilton-Jacobi (J) は、ロボットが安全でない状態を同時に検出し、アクションを生成するための厳格なフレームワークである。
生観測データを直接操作するハミルトン・ヤコビ到達可能性の一般化であるLa-space Safety Filtersを提案する。
論文 参考訳(メタデータ) (2025-02-02T22:00:20Z) - Safety Without Semantic Disruptions: Editing-free Safe Image Generation via Context-preserving Dual Latent Reconstruction [88.18235230849554]
大規模で未処理のデータセットでマルチモーダル生成モデルをトレーニングすることで、ユーザは有害で安全でない、議論の余地のない、文化的に不適切なアウトプットにさらされる可能性がある。
我々は、安全な埋め込みと、より安全な画像を生成するために、潜伏空間の重み付け可能な総和による修正拡散プロセスを活用する。
安全と検閲のトレードオフを特定し、倫理的AIモデルの開発に必要な視点を提示します。
論文 参考訳(メタデータ) (2024-11-21T09:47:13Z) - Vision Language Model for Interpretable and Fine-grained Detection of Safety Compliance in Diverse Workplaces [5.993182776695029]
多様な職場安全コンプライアンスのための解釈可能な検出フレームワークであるClip2Safetyを紹介する。
このフレームワークは、シーン認識、視覚的プロンプト、安全アイテムの検出、きめ細かい検証の4つの主要なモジュールで構成されている。
その結果, Clip2Safetyは, 最先端の質問応答に基づくVLMよりも精度が向上するだけでなく, 推測時間も200倍高速であることがわかった。
論文 参考訳(メタデータ) (2024-08-13T18:32:06Z) - Safe Inputs but Unsafe Output: Benchmarking Cross-modality Safety Alignment of Large Vision-Language Model [73.8765529028288]
我々は、モダリティ間の安全アライメントを評価するために、セーフインプットとアンセーフアウトプット(SIUO)と呼ばれる新しい安全アライメントの課題を導入する。
この問題を実証的に調査するため,我々はSIUOを作成した。SIUOは,自己修復,違法行為,プライバシー侵害など,9つの重要な安全領域を含むクロスモダリティベンチマークである。
以上の結果から, クローズドおよびオープンソース両方のLVLMの安全性上の重大な脆弱性が明らかとなり, 複雑で現実的なシナリオを確実に解釈し, 応答する上で, 現行モデルが不十分であることが示唆された。
論文 参考訳(メタデータ) (2024-06-21T16:14:15Z) - Enhancing Generalizability of Representation Learning for Data-Efficient 3D Scene Understanding [50.448520056844885]
本研究では,実世界のパターンを持つ多様な合成シーンを生成可能なベイズネットワークを提案する。
一連の実験は、既存の最先端の事前学習手法に比べて、我々の手法が一貫した優位性を示す。
論文 参考訳(メタデータ) (2024-06-17T07:43:53Z) - Calib3D: Calibrating Model Preferences for Reliable 3D Scene Understanding [55.32861154245772]
Calib3Dは3Dシーン理解モデルの信頼性をベンチマークし精査する先駆的な試みである。
10の異なる3Dデータセットにまたがる28の最先端モデルを総合的に評価する。
本稿では,3次元モデルのキャリブレーション向上を目的とした,深度対応のスケーリング手法であるDeptSを紹介する。
論文 参考訳(メタデータ) (2024-03-25T17:59:59Z) - SimMining-3D: Altitude-Aware 3D Object Detection in Complex Mining
Environments: A Novel Dataset and ROS-Based Automatic Annotation Pipeline [0.9790236766474201]
鉱業環境における3次元物体検出に特化して設計された合成データセットSimMining 3Dを提案する。
このデータセットは、鉱山のベンチ内のさまざまな高さに位置する物体やセンサーを捉え、正確な採掘シナリオを正確に反映している。
本研究では,センサ対オブジェクトの高さ変化と点雲密度を考慮した評価指標を提案し,正確なモデル評価を可能にする。
論文 参考訳(メタデータ) (2023-12-11T04:33:45Z) - Embodied Task Planning with Large Language Models [86.63533340293361]
本研究では,現場制約を考慮した地上計画のための具体的タスクにおけるTAsk Planing Agent (TaPA)を提案する。
推論の際には,オープンボキャブラリオブジェクト検出器を様々な場所で収集された多視点RGB画像に拡張することにより,シーン内の物体を検出する。
実験の結果,我々のTaPAフレームワークから生成されたプランは,LLaVAやGPT-3.5よりも大きなマージンで高い成功率が得られることがわかった。
論文 参考訳(メタデータ) (2023-07-04T17:58:25Z) - Robo3D: Towards Robust and Reliable 3D Perception against Corruptions [58.306694836881235]
我々は,3次元検出器とセグメンタのロバスト性を,アウト・オブ・ディストリビューションのシナリオで検証するための,最初の総合的なベンチマークであるRobo3Dを紹介する。
気象条件の悪化,外乱,センサの故障などに起因する8種類の汚職について検討した。
本稿では,モデルレジリエンスを高めるための簡易なフレキシブルなボキセル化戦略とともに,密度に敏感なトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T17:59:17Z) - USC: Uncompromising Spatial Constraints for Safety-Oriented 3D Object Detectors in Autonomous Driving [7.355977594790584]
自律運転における3次元物体検出器の安全性指向性能について考察する。
本稿では,単純だが重要な局所化要件を特徴付ける空間的制約 (USC) について述べる。
既存のモデルに対する安全性指向の微調整を可能にするために,定量的な測定値を共通損失関数に組み込む。
論文 参考訳(メタデータ) (2022-09-21T14:03:08Z) - Safety-Aware Hardening of 3D Object Detection Neural Network Systems [0.0]
単一段パイプラインを用いた3次元物体検出のための最先端ニューラルネットワークの安全性について検討した。
この概念は、鳥の目視で物体の境界ボックスを点雲からの入力で生成する最先端のPIXOR検出器を拡張して詳述している。
論文 参考訳(メタデータ) (2020-03-25T07:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。