論文の概要: GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection
- arxiv url: http://arxiv.org/abs/2407.00906v1
- Date: Mon, 1 Jul 2024 02:15:27 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 01:07:34.826955
- Title: GSO-YOLO: Global Stability Optimization YOLO for Construction Site Detection
- Title(参考訳): GSO-YOLO:建設現場検出のためのグローバル安定性最適化YOLO
- Authors: Yuming Zhang, Dongzhi Guan, Shouxin Zhang, Junhao Su, Yunzhi Han, Jiabin Liu,
- Abstract要約: 本研究では,GSO-YOLO(Global stability Optimization YOLO)モデルを用いて,複雑な建設現場の課題に対処する。
このモデルはグローバル・オプティマイズ・モジュール(GOM)とステアディ・キャプチャ・モジュール(SCM)を統合し、グローバル・コンテクスト情報取得と検出安定性を向上させる。
SODA、MOCS、CISといったデータセットの実験では、GSO-YOLOが既存のメソッドよりも優れており、SOTAのパフォーマンスが達成されている。
- 参考スコア(独自算出の注目度): 4.2114456503277315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Safety issues at construction sites have long plagued the industry, posing risks to worker safety and causing economic damage due to potential hazards. With the advancement of artificial intelligence, particularly in the field of computer vision, the automation of safety monitoring on construction sites has emerged as a solution to this longstanding issue. Despite achieving impressive performance, advanced object detection methods like YOLOv8 still face challenges in handling the complex conditions found at construction sites. To solve these problems, this study presents the Global Stability Optimization YOLO (GSO-YOLO) model to address challenges in complex construction sites. The model integrates the Global Optimization Module (GOM) and Steady Capture Module (SCM) to enhance global contextual information capture and detection stability. The innovative AIoU loss function, which combines CIoU and EIoU, improves detection accuracy and efficiency. Experiments on datasets like SODA, MOCS, and CIS show that GSO-YOLO outperforms existing methods, achieving SOTA performance.
- Abstract(参考訳): 建設現場の安全問題は長年業界を悩ませており、労働者の安全を脅かし、潜在的な危険による経済被害を引き起こしている。
人工知能の進歩、特にコンピュータビジョンの分野では、この長年にわたる問題の解決策として、建設現場における安全監視の自動化が出現している。
優れたパフォーマンスにもかかわらず、YOLOv8のような高度なオブジェクト検出手法は、建設現場で見つかった複雑な条件を扱う上で依然として課題に直面している。
そこで本研究では, 複雑な建設現場における課題を解決するため, グローバル安定度最適化 YOLO (GSO-YOLO) モデルを提案する。
このモデルはグローバル・オプティマイズ・モジュール(GOM)とステアディ・キャプチャ・モジュール(SCM)を統合し、グローバル・コンテクスト情報取得と検出安定性を向上させる。
CIoUとEIoUを組み合わせた革新的なAIoU損失関数は、検出精度と効率を向上させる。
SODA、MOCS、CISといったデータセットの実験では、GSO-YOLOが既存のメソッドよりも優れており、SOTAのパフォーマンスが達成されている。
関連論文リスト
- Transforming the Hybrid Cloud for Emerging AI Workloads [81.15269563290326]
このホワイトペーパーでは、AIワークロードの複雑さの増大に対応するために、ハイブリッドクラウドシステムを変革することを想定している。
提案したフレームワークは、エネルギー効率、性能、コスト効率において重要な課題に対処する。
この共同イニシアチブは、ハイブリッドクラウドをセキュアで効率的で持続可能なプラットフォームとして確立することを目的としています。
論文 参考訳(メタデータ) (2024-11-20T11:57:43Z) - CIB-SE-YOLOv8: Optimized YOLOv8 for Real-Time Safety Equipment Detection on Construction Sites [4.028949797830281]
本研究では、リアルタイムヘルメット検出にYOLOを用いたコンピュータビジョンベースのソリューションを提案する。
提案したCIB-SE-YOLOv8モデルでは,SEアテンション機構と修正C2fブロックが組み込まれ,検出精度と効率が向上した。
論文 参考訳(メタデータ) (2024-10-28T03:07:03Z) - An Adaptive End-to-End IoT Security Framework Using Explainable AI and LLMs [1.9662978733004601]
本稿では,機械学習(ML),説明可能なAI(XAI),大規模言語モデル(LLM)を活用した,リアルタイムIoT攻撃検出および応答のための革新的なフレームワークを提案する。
私たちのエンドツーエンドフレームワークは、モデル開発からデプロイメントへのシームレスな移行を促進するだけでなく、既存の研究でしばしば欠落している現実世界のアプリケーション機能も表しています。
論文 参考訳(メタデータ) (2024-09-20T03:09:23Z) - DS MYOLO: A Reliable Object Detector Based on SSMs for Driving Scenarios [2.615648035076649]
我々は,マンバの卓越した性能にインスパイアされた,新しいリアルタイム物体検出器DS MYOLOを提案する。
この検出器は、単純化された選択的走査型融合ブロック(SimVSS Block)を通してグローバルな特徴情報をキャプチャし、ネットワークの深い特徴を効果的に統合する。
CCTSDB 2021とVLD-45の駆動シナリオの実験は、DS MYOLOが大きな可能性と競争上の優位性を示すことを示した。
論文 参考訳(メタデータ) (2024-09-02T09:22:33Z) - EAIRiskBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [47.69642609574771]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
EAIRiskBenchは、EAIシナリオにおける自動物理的リスクアセスメントのための新しいフレームワークである。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - Enhanced Model Robustness to Input Corruptions by Per-corruption Adaptation of Normalization Statistics [22.876222327262596]
本稿では,視覚システムのモデルロバスト性を高めるために,正規化統計のPer-corruption Adaptation(PAN)を導入する。
提案手法は, 汚職型識別モジュール, (ii) 特定汚職型に基づく正規化層統計の動的調整, (iii) 入力データに基づくこれらの統計のリアルタイム更新の3つの重要な要素を包含する。
論文 参考訳(メタデータ) (2024-07-08T23:20:18Z) - Mamba YOLO: SSMs-Based YOLO For Object Detection [9.879086222226617]
Mamba-YOLOはステートスペースモデルに基づく新しい物体検出モデルである。
本報告では,マンバヨロが既存のYOLOシリーズモデルを上回る性能と競争性を示す。
論文 参考訳(メタデータ) (2024-06-09T15:56:19Z) - Generative AI Agents with Large Language Model for Satellite Networks via a Mixture of Experts Transmission [74.10928850232717]
本稿では、モデル定式化のための生成人工知能(AI)エージェントを開発し、送信戦略の設計に専門家(MoE)の混合を適用した。
具体的には,大規模言語モデル(LLM)を活用して対話型モデリングパラダイムを構築する。
定式化問題の解法として, MoE-proximal Policy Optimization (PPO) アプローチを提案する。
論文 参考訳(メタデータ) (2024-04-14T03:44:54Z) - Highlighting the Safety Concerns of Deploying LLMs/VLMs in Robotics [54.57914943017522]
本稿では,大規模言語モデル (LLMs) と視覚言語モデル (VLMs) をロボティクスアプリケーションに統合する際のロバスト性と安全性に関する重要な課題を強調する。
論文 参考訳(メタデータ) (2024-02-15T22:01:45Z) - Filling the Missing: Exploring Generative AI for Enhanced Federated
Learning over Heterogeneous Mobile Edge Devices [72.61177465035031]
ローカルデータのFIMI(FIlling the MIssing)部分を活用することにより,これらの課題に対処する,AIを活用した創発的なフェデレーション学習を提案する。
実験の結果,FIMIはデバイス側エネルギーの最大50%を節約し,目標とするグローバルテスト精度を達成できることがわかった。
論文 参考訳(メタデータ) (2023-10-21T12:07:04Z) - Robust Single Image Dehazing Based on Consistent and Contrast-Assisted
Reconstruction [95.5735805072852]
画像復調モデルのロバスト性を改善するための新しい密度変分学習フレームワークを提案する。
具体的には、デハジングネットワークは、一貫性の規則化されたフレームワークの下で最適化されている。
我々の手法は最先端のアプローチを大きく上回っている。
論文 参考訳(メタデータ) (2022-03-29T08:11:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。