Fugu-MT 論文翻訳(概要): Real-Time Object Detection in Occluded Environment with Background Cluttering Effects Using Deep Learning

論文の概要: Real-Time Object Detection in Occluded Environment with Background Cluttering Effects Using Deep Learning

arxiv url: http://arxiv.org/abs/2401.00986v1
Date: Tue, 2 Jan 2024 01:30:03 GMT
ステータス: 翻訳完了
システム内更新日: 2024-01-03 14:58:48.108119
Title: Real-Time Object Detection in Occluded Environment with Background Cluttering Effects Using Deep Learning
Title（参考訳）: 深層学習による背景クラッタ効果を考慮した環境中リアルタイム物体検出
Authors: Syed Muhammad Aamir, Hongbin Ma, Malak Abid Ali Khan, Muhammad Aaqib
Abstract要約: 混在した環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中する。開発した手法は、カスタムデータセットを作成し、ノイズの多いデータセットをきれいにするために前処理技術を使用する。 SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。
参考スコア（独自算出の注目度）: 0.8192907805418583
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Detection of small, undetermined moving objects or objects in an occluded environment with a cluttered background is the main problem of computer vision. This greatly affects the detection accuracy of deep learning models. To overcome these problems, we concentrate on deep learning models for real-time detection of cars and tanks in an occluded environment with a cluttered background employing SSD and YOLO algorithms and improved precision of detection and reduce problems faced by these models. The developed method makes the custom dataset and employs a preprocessing technique to clean the noisy dataset. For training the developed model we apply the data augmentation technique to balance and diversify the data. We fine-tuned, trained, and evaluated these models on the established dataset by applying these techniques and highlighting the results we got more accurately than without applying these techniques. The accuracy and frame per second of the SSD-Mobilenet v2 model are higher than YOLO V3 and YOLO V4. Furthermore, by employing various techniques like data enhancement, noise reduction, parameter optimization, and model fusion we improve the effectiveness of detection and recognition. We further added a counting algorithm, and target attributes experimental comparison, and made a graphical user interface system for the developed model with features of object counting, alerts, status, resolution, and frame per second. Subsequently, to justify the importance of the developed method analysis of YOLO V3, V4, and SSD were incorporated. Which resulted in the overall completion of the proposed method.
Abstract（参考訳）: ぼろぼろの背景を持つ閉ざされた環境における小型で未決定の移動物体や物体の検出は、コンピュータビジョンの主要な問題である。これはディープラーニングモデルの検出精度に大きな影響を及ぼす。これらの問題を解決するため,SSDとYOLOアルゴリズムを併用した乱雑な背景環境下での車やタンクのリアルタイム検出のためのディープラーニングモデルに集中し,検出精度の向上と,これらのモデルが直面する問題点の低減を図る。提案手法はカスタムデータセットを作成し、ノイズの多いデータセットをきれいにするためにプリプロセッシング技術を用いる。開発したモデルのトレーニングには,データのバランスと多様化にデータ拡張技術を適用する。これらのテクニックを適用することで、確立したデータセット上でこれらのモデルを微調整し、訓練し、評価しました。 SSD-Mobilenet v2モデルの精度とフレームは、YOLO V3やYOLO V4よりも高い。さらに,データ強化,ノイズ低減,パラメータ最適化,モデル融合といった様々な手法を用いて,検出と認識の有効性を向上させる。さらに計数アルゴリズムと目標属性を実験的に比較し,オブジェクトの計数,警告,ステータス,解像度,フレーム毎のフレームを特徴とするグラフィカルユーザインタフェースシステムを構築した。その後, YOLO V3, V4, SSDの手法解析の重要性を検証した。その結果,提案手法全体の完成が得られた。

関連論文リスト

Explaining raw data complexity to improve satellite onboard processing [0.815557531820863]
本研究では,物体検出および分類タスクの深層学習モデルに対する生データの利用効果について検討した。 2つのオブジェクト検出モデル(YOLOv11nとYOLOX-S)は、生データとL1データセットの両方でトレーニングされる。その結果,両モデルが低信頼度,中信頼度でも同様に機能する一方で,生データに基づいてトレーニングしたモデルでは,高い信頼度でオブジェクト境界の識別に苦慮していることがわかった。
論文参考訳（メタデータ） (2025-10-08T10:26:02Z)
LiDAR Point Cloud Image-based Generation Using Denoising Diffusion Probabilistic Models [0.2809622746998686]
現実世界のLiDARデータは時間がかかり、悪天候やセンサーの制限によってノイズや空間に影響を受けることが多い。本研究は, 拡散確率モデル (DDPM) を適用して, 改良のための高品質な合成データを生成する。
論文参考訳（メタデータ） (2025-09-23T12:35:07Z)
RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。 HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文参考訳（メタデータ） (2025-07-12T01:58:04Z)
Exploring Machine Learning Engineering for Object Detection and Tracking by Unmanned Aerial Vehicle (UAV) [3.600782980481468]
この研究は、自動化の増大に伴う保証手法の導入を強調した機械学習パイプラインの開発に焦点を当てている。新しいデータセットは、ルンバの掃除機のような移動物体のビデオを収集し、屋内環境の探索・救助(SAR)をエミュレートすることで作成されている。データセットの改良後、第2のYOLOv4とMask R-CNNモデルでトレーニングされた。
論文参考訳（メタデータ） (2024-12-19T19:27:31Z)
Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文参考訳（メタデータ） (2024-12-16T09:14:32Z)
Understanding and Improving Training-Free AI-Generated Image Detections with Vision Foundation Models [68.90917438865078]
顔合成と編集のためのディープフェイク技術は、生成モデルに重大なリスクをもたらす。本稿では,モデルバックボーン,タイプ,データセット間で検出性能がどう変化するかを検討する。本稿では、顔画像のパフォーマンスを向上させるContrastive Blurと、ノイズタイプのバイアスに対処し、ドメイン間のパフォーマンスのバランスをとるMINDERを紹介する。
論文参考訳（メタデータ） (2024-11-28T13:04:45Z)
Optimizing YOLO Architectures for Optimal Road Damage Detection and Classification: A Comparative Study from YOLOv7 to YOLOv10 [0.0]
本稿では,ディープラーニングモデルを用いた道路損傷検出のための総合ワークフローを提案する。ハードウェアの制約を満たすため、大きな画像が収穫され、軽量モデルが利用される。提案手法では,コーディネートアテンションレイヤを備えたカスタムYOLOv7モデルや,Tiny YOLOv7モデルなど,複数のモデルアーキテクチャを採用している。
論文参考訳（メタデータ） (2024-10-10T22:55:12Z)
SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients [0.8873228457453465]
空中画像における小さな物体検出は、コンピュータビジョンにおいて重要な課題である。トランスフォーマーベースのモデルを用いた従来の手法は、特殊データベースの欠如に起因する制限に直面していることが多い。本稿では,小型空中物体の検出とセグメンテーション機能を大幅に向上する2つの革新的なアプローチを紹介する。
論文参考訳（メタデータ） (2024-05-02T19:47:08Z)
FILP-3D: Enhancing 3D Few-shot Class-incremental Learning with Pre-trained Vision-Language Models [62.663113296987085]
クラス増分学習(class-incremental learning)は、モデルが限られたデータに基づいて漸進的にトレーニングされている場合、破滅的な忘れの問題を軽減することを目的としている。冗長特徴除去器(RFE)と空間ノイズ補償器(SNC)の2つの新しいコンポーネントを紹介する。既存の3次元データセットの不均衡を考慮し、3次元FSCILモデルのより微妙な評価を提供する新しい評価指標を提案する。
論文参考訳（メタデータ） (2023-12-28T14:52:07Z)
Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。提案手法は平均精度(MAP)を約45.7%向上させる。この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文参考訳（メタデータ） (2023-11-21T19:49:13Z)
Randomize to Generalize: Domain Randomization for Runway FOD Detection [1.4249472316161877]
細い物体検出は、小型化、低解像度化、オクルージョン化、背景クラッタ、照明条件、被写体対画像比の小さいため困難である。本稿では,SRIA(Synthetic Image Augmentation)の新たな2段階手法を提案する。検出精度は初期41%からOODテストセットの92%に改善した。
論文参考訳（メタデータ） (2023-09-23T05:02:31Z)
YOLO v3: Visual and Real-Time Object Detection Model for Smart Surveillance Systems(3s) [0.0]
本稿では,スマートサーベイランスシステム(Smart Surveillance Systems, 3s)と呼ばれるサイバー物理システムの物体検出モデルを提案する。本研究は, 学習時間と計算資源を削減するため, 転送学習手法を実装した。提案モデルの結果は, 監視映像中の物体の検出において極めて良好であった。
論文参考訳（メタデータ） (2022-09-26T06:34:12Z)
SSMTL++: Revisiting Self-Supervised Multi-Task Learning for Video Anomaly Detection [108.57862846523858]
自己教師型マルチタスク学習フレームワークを再考し、元の手法にいくつかのアップデートを提案する。マルチヘッド・セルフアテンション・モジュールを導入することで3次元畳み込みバックボーンを近代化する。モデルをさらに改良するために,セグメントマップの予測などの自己指導型学習タスクについて検討した。
論文参考訳（メタデータ） (2022-07-16T19:25:41Z)
Learning-based Point Cloud Registration for 6D Object Pose Estimation in the Real World [55.7340077183072]
我々は、ポイントクラウドデータからオブジェクトの6Dポーズを推定するタスクに取り組む。この課題に対処する最近の学習ベースのアプローチは、合成データセットにおいて大きな成功を収めている。これらの障害の原因を分析し、ソースとターゲットポイントの雲の特徴分布の違いに遡る。
論文参考訳（メタデータ） (2022-03-29T07:55:04Z)
RandomRooms: Unsupervised Pre-training from Synthetic Shapes and Randomized Layouts for 3D Object Detection [138.2892824662943]
有望な解決策は、CADオブジェクトモデルで構成される合成データセットをよりよく利用して、実際のデータセットでの学習を促進することである。最近の3次元事前学習の研究は、合成物体から他の実世界の応用へ学習した伝達特性が失敗することを示している。本研究では,この目的を達成するためにRandomRoomsという新しい手法を提案する。
論文参考訳（メタデータ） (2021-08-17T17:56:12Z)
Secrets of 3D Implicit Object Shape Reconstruction in the Wild [92.5554695397653]
コンピュータビジョン、ロボティクス、グラフィックスの様々な用途において、高精細な3Dオブジェクトをスパースから再構築することは重要です。最近の神経暗黙的モデリング法は、合成データセットまたは高密度データセットで有望な結果を示す。しかし、粗末でノイズの多い実世界のデータではパフォーマンスが悪い。本論文では, 一般的な神経暗黙モデルの性能低下の根本原因を解析する。
論文参考訳（メタデータ） (2021-01-18T03:24:48Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。