論文の概要: Research on road object detection algorithm based on improved YOLOX
- arxiv url: http://arxiv.org/abs/2302.08156v1
- Date: Thu, 16 Feb 2023 08:58:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-17 14:24:54.935321
- Title: Research on road object detection algorithm based on improved YOLOX
- Title(参考訳): 改良ヨロックスを用いた道路物体検出アルゴリズムに関する研究
- Authors: Tao Yang, Youyu Wu, Yangxintai Tang
- Abstract要約: 道路物体検出においては,小型物体と閉塞物体の除去が重要な問題である。
本稿では,予測ボックスと実ボックスの形状整合性を改善するために,DecIoU境界ボックス回帰損失関数を提案し,Push Lossを導入して境界ボックス回帰損失関数をさらに最適化する。
KITTIデータセットに対する多数の実験により,提案手法の有効性が示された。
- 参考スコア(独自算出の注目度): 3.5539647094032705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Road object detection is an important branch of automatic driving technology,
The model with higher detection accuracy is more conducive to the safe driving
of vehicles. In road object detection, the omission of small objects and
occluded objects is an important problem. therefore, reducing the missed rate
of the object is of great significance for safe driving. In the work of this
paper, based on the YOLOX object detection algorithm to improve, proposes
DecIoU boundary box regression loss function to improve the shape consistency
of the predicted and real box, and Push Loss is introduced to further optimize
the boundary box regression loss function, in order to detect more occluded
objects. In addition, the dynamic anchor box mechanism is also used to improve
the accuracy of the confidence label, improve the label inaccuracy of object
detection model without anchor box. A large number of experiments on KITTI
dataset demonstrate the effectiveness of the proposed method, the improved
YOLOX-s achieved 88.9% mAP and 91.0% mAR on the KITTI dataset, compared to the
baseline version improvements of 2.77% and 4.24%; the improved YOLOX-m achieved
89.1% mAP and 91.4% mAR, compared to the baseline version improvements of 2.30%
and 4.10%.
- Abstract(参考訳): 道路物体検出は自動走行技術の重要な分野であり、高い検出精度を持つモデルは車両の安全運転により寄与する。
道路物体検出において,小型物体と閉塞物体の欠落は重要な問題である。
したがって 物体の欠落率を減らすことは 安全な運転にとって 非常に重要なことです
本稿では,YOLOXオブジェクト検出アルゴリズムをベースとして,予測ボックスと実ボックスの形状整合性を改善するため,DecIoU境界ボックス回帰損失関数を提案する。
さらに、動的アンカーボックス機構は、信頼性ラベルの精度を向上させ、アンカーボックスなしでオブジェクト検出モデルのラベル不正確性を改善するためにも用いられる。
KITTIデータセットの多くの実験は、提案手法の有効性を示し、改良されたYOLOX-sは2.77%と4.24%のベースラインバージョンの改善と比較して88.9%のmAPと91.0%のmARを、改良されたYOLOX-mは2.30%と4.10%のベースラインバージョンの改善に比べて89.1%のmAPと91.4%のmARを達成した。
関連論文リスト
- Uncertainty Estimation for 3D Object Detection via Evidential Learning [63.61283174146648]
本稿では,3次元検出器における鳥の視線表示における明らかな学習損失を利用して,3次元物体検出の不確かさを定量化するためのフレームワークを提案する。
本研究では,これらの不確実性評価の有効性と重要性を,分布外シーンの特定,局所化の不十分な物体の発見,および(偽陰性)検出の欠如について示す。
論文 参考訳(メタデータ) (2024-10-31T13:13:32Z) - YOLO-ELA: Efficient Local Attention Modeling for High-Performance Real-Time Insulator Defect Detection [0.0]
無人航空機からの絶縁体欠陥検出のための既存の検出方法は、複雑な背景や小さな物体と競合する。
本稿では,この課題に対処するため,新しい注目基盤アーキテクチャであるYOLO-ELAを提案する。
高分解能UAV画像による実験結果から,本手法は96.9% mAP0.5,リアルタイム検出速度74.63フレーム/秒を実現した。
論文 参考訳(メタデータ) (2024-10-15T16:00:01Z) - SOD-YOLOv8 -- Enhancing YOLOv8 for Small Object Detection in Traffic Scenes [1.3812010983144802]
Small Object Detection YOLOv8 (SOD-YOLOv8) は、多数の小さなオブジェクトを含むシナリオ用に設計されている。
SOD-YOLOv8は小さなオブジェクト検出を大幅に改善し、様々なメトリクスで広く使われているモデルを上回っている。
ダイナミックな現実世界の交通シーンでは、SOD-YOLOv8は様々な状況で顕著な改善を示した。
論文 参考訳(メタデータ) (2024-08-08T23:05:25Z) - KAN-RCBEVDepth: A multi-modal fusion algorithm in object detection for autonomous driving [2.382388777981433]
本稿では, 自律走行における3次元物体検出の高速化を目的としたkan-RCBEVDepth法を提案する。
我々のユニークなBird’s Eye Viewベースのアプローチは、検出精度と効率を大幅に改善します。
コードはurlhttps://www.laitiamo.com/laitiamo/RCBEVDepth-KANでリリースされる。
論文 参考訳(メタデータ) (2024-08-04T16:54:49Z) - Research on target detection method of distracted driving behavior based on improved YOLOv8 [6.405098280736171]
本研究では,BOTNetモジュール,GAMアテンション機構,EIoU損失関数を統合することで,従来のYOLOv8モデルに基づく改良されたYOLOv8検出手法を提案する。
実験の結果, 精度は99.4%であり, 検出速度, 精度ともに良好であった。
論文 参考訳(メタデータ) (2024-07-02T00:43:41Z) - YOLO9tr: A Lightweight Model for Pavement Damage Detection Utilizing a Generalized Efficient Layer Aggregation Network and Attention Mechanism [0.0]
本稿では,舗装損傷検出のための軽量物体検出モデルYOLO9trを提案する。
YOLO9trはYOLOv9アーキテクチャに基づいており、機能抽出とアテンション機構を強化する部分的なアテンションブロックを備えている。
このモデルは、最大136FPSのフレームレートを実現し、ビデオ監視や自動検査システムなどのリアルタイムアプリケーションに適合する。
論文 参考訳(メタデータ) (2024-06-17T06:31:43Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Detecting Rotated Objects as Gaussian Distributions and Its 3-D
Generalization [81.29406957201458]
既存の検出方法は、パラメータ化バウンディングボックス(BBox)を使用して(水平)オブジェクトをモデル化し、検出する。
このような機構は回転検出に有効な回帰損失を構築するのに基本的な限界があると主張する。
回転した物体をガウス分布としてモデル化することを提案する。
2次元から3次元へのアプローチを、方向推定を扱うアルゴリズム設計により拡張する。
論文 参考訳(メタデータ) (2022-09-22T07:50:48Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z) - Improving 3D Object Detection through Progressive Population Based
Augmentation [91.56261177665762]
本稿では3次元オブジェクト検出のためのデータ拡張ポリシーの設計を自動化するための最初の試みを示す。
このアルゴリズムは,探索空間を狭め,過去の反復で発見された最良のパラメータを採用することで,拡張戦略の最適化を学習する。
PPBAは, 拡張のないベースライン3次元検出モデルよりも最大10倍のデータ効率が高く, ラベル付きモデルよりもはるかに少ない精度で3次元検出モデルが競合精度を達成できる可能性が示唆された。
論文 参考訳(メタデータ) (2020-04-02T05:57:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。