論文の概要: GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection
- arxiv url: http://arxiv.org/abs/2407.00906v1
- Date: Mon, 1 Jul 2024 02:15:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 01:07:34.826955
- Title: GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection
- Title(参考訳): GSO-YOLO:建設現場検出のためのグローバル安定性最適化YOLO
- Authors: Yuming Zhang, Dongzhi Guan, Shouxin Zhang, Junhao Su, Yunzhi Han, Jiabin Liu,
- Abstract要約: 本研究では,GSO-YOLO(Global stability Optimization YOLO)モデルを用いて,複雑な建設現場の課題に対処する。
このモデルはグローバル・オプティマイズ・モジュール(GOM)とステアディ・キャプチャ・モジュール(SCM)を統合し、グローバル・コンテクスト情報取得と検出安定性を向上させる。
SODA、MOCS、CISといったデータセットの実験では、GSO-YOLOが既存のメソッドよりも優れており、SOTAのパフォーマンスが達成されている。
- 参考スコア(独自算出の注目度): 4.2114456503277315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety issues at construction sites have long plagued the industry, posing risks to worker safety and causing economic damage due to potential hazards. With the advancement of artificial intelligence, particularly in the field of computer vision, the automation of safety monitoring on construction sites has emerged as a solution to this longstanding issue. Despite achieving impressive performance, advanced object detection methods like YOLOv8 still face challenges in handling the complex conditions found at construction sites. To solve these problems, this study presents the Global Stability Optimization YOLO (GSO-YOLO) model to address challenges in complex construction sites. The model integrates the Global Optimization Module (GOM) and Steady Capture Module (SCM) to enhance global contextual information capture and detection stability. The innovative AIoU loss function, which combines CIoU and EIoU, improves detection accuracy and efficiency. Experiments on datasets like SODA, MOCS, and CIS show that GSO-YOLO outperforms existing methods, achieving SOTA performance.
- Abstract(参考訳): 建設現場の安全問題は長年業界を悩ませており、労働者の安全を脅かし、潜在的な危険による経済被害を引き起こしている。
人工知能の進歩、特にコンピュータビジョンの分野では、この長年にわたる問題の解決策として、建設現場における安全監視の自動化が出現している。
優れたパフォーマンスにもかかわらず、YOLOv8のような高度なオブジェクト検出手法は、建設現場で見つかった複雑な条件を扱う上で依然として課題に直面している。
そこで本研究では, 複雑な建設現場における課題を解決するため, グローバル安定度最適化 YOLO (GSO-YOLO) モデルを提案する。
このモデルはグローバル・オプティマイズ・モジュール(GOM)とステアディ・キャプチャ・モジュール(SCM)を統合し、グローバル・コンテクスト情報取得と検出安定性を向上させる。
CIoUとEIoUを組み合わせた革新的なAIoU損失関数は、検出精度と効率を向上させる。
SODA、MOCS、CISといったデータセットの実験では、GSO-YOLOが既存のメソッドよりも優れており、SOTAのパフォーマンスが達成されている。
関連論文リスト
- Towards Robust Stability Prediction in Smart Grids: GAN-based Approach under Data Constraints and Adversarial Challenges [53.2306792009435]
本稿では,安定したデータのみを用いて,スマートグリッドの不安定性を検出する新しいフレームワークを提案する。
ジェネレータはGAN(Generative Adversarial Network)に依存しており、ジェネレータは不安定なデータを生成するために訓練される。
我々の解は、実世界の安定と不安定なサンプルからなるデータセットでテストされ、格子安定性の予測において最大97.5%、敵攻撃の検出において最大98.9%の精度を達成する。
論文 参考訳(メタデータ) (2025-01-27T20:48:25Z) - Enhanced PEC-YOLO for Detecting Improper Safety Gear Wearing Among Power Line Workers [0.0]
本稿では,PEC-YOLOオブジェクト検出アルゴリズムを提案する。
この手法は、深層認識とマルチスケール特徴融合を統合する。
CPCAアテンションメカニズムはSPPFモジュールに組み込まれ、重要な情報にフォーカスするモデルの能力を向上させる。
論文 参考訳(メタデータ) (2025-01-23T04:40:08Z) - Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - CIB-SE-YOLOv8: Optimized YOLOv8 for Real-Time Safety Equipment Detection on Construction Sites [4.028949797830281]
本研究では、リアルタイムヘルメット検出にYOLOを用いたコンピュータビジョンベースのソリューションを提案する。
提案したCIB-SE-YOLOv8モデルでは,SEアテンション機構と修正C2fブロックが組み込まれ,検出精度と効率が向上した。
論文 参考訳(メタデータ) (2024-10-28T03:07:03Z) - An Adaptive End-to-End IoT Security Framework Using Explainable AI and LLMs [1.9662978733004601]
本稿では,機械学習(ML),説明可能なAI(XAI),大規模言語モデル(LLM)を活用した,リアルタイムIoT攻撃検出および応答のための革新的なフレームワークを提案する。
私たちのエンドツーエンドフレームワークは、モデル開発からデプロイメントへのシームレスな移行を促進するだけでなく、既存の研究でしばしば欠落している現実世界のアプリケーション機能も表しています。
論文 参考訳(メタデータ) (2024-09-20T03:09:23Z) - DS MYOLO: A Reliable Object Detector Based on SSMs for Driving Scenarios [2.615648035076649]
我々は,マンバの卓越した性能にインスパイアされた,新しいリアルタイム物体検出器DS MYOLOを提案する。
この検出器は、単純化された選択的走査型融合ブロック(SimVSS Block)を通してグローバルな特徴情報をキャプチャし、ネットワークの深い特徴を効果的に統合する。
CCTSDB 2021とVLD-45の駆動シナリオの実験は、DS MYOLOが大きな可能性と競争上の優位性を示すことを示した。
論文 参考訳(メタデータ) (2024-09-02T09:22:33Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - Enhanced Model Robustness to Input Corruptions by Per-corruption Adaptation of Normalization Statistics [22.876222327262596]
本稿では,視覚システムのモデルロバスト性を高めるために,正規化統計のPer-corruption Adaptation(PAN)を導入する。
提案手法は, 汚職型識別モジュール, (ii) 特定汚職型に基づく正規化層統計の動的調整, (iii) 入力データに基づくこれらの統計のリアルタイム更新の3つの重要な要素を包含する。
論文 参考訳(メタデータ) (2024-07-08T23:20:18Z) - Highlighting the Safety Concerns of Deploying LLMs/VLMs in Robotics [54.57914943017522]
本稿では,大規模言語モデル (LLMs) と視覚言語モデル (VLMs) をロボティクスアプリケーションに統合する際のロバスト性と安全性に関する重要な課題を強調する。
論文 参考訳(メタデータ) (2024-02-15T22:01:45Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。