論文の概要: Perception Reinforcement Using Auxiliary Learning Feature Fusion: A
Modified Yolov8 for Head Detection
- arxiv url: http://arxiv.org/abs/2310.09492v1
- Date: Sat, 14 Oct 2023 04:52:35 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-17 20:13:22.889622
- Title: Perception Reinforcement Using Auxiliary Learning Feature Fusion: A
Modified Yolov8 for Head Detection
- Title(参考訳): 補助学習機能融合による知覚強化:頭部検出のための修正yolov8
- Authors: Jiezhou Chen, Guankun Wang, Weixiang Liu, Xiaopin Zhong, Yibin Tian,
ZongZe Wu
- Abstract要約: ターゲット認識による頭部検出性能を向上させる改良型Yolov8を提案する。
補助タスクとして、LSTMと畳み込みブロックからなる補助学習特徴融合(ALFF)モジュールを用いる。
さらに, 配電損失にノイズを導入し, モデルフィッティングを容易にし, 検出精度を向上させる。
- 参考スコア(独自算出の注目度): 8.065947209864646
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Head detection provides distribution information of pedestrian, which is
crucial for scene statistical analysis, traffic management, and risk assessment
and early warning. However, scene complexity and large-scale variation in the
real world make accurate detection more difficult. Therefore, we present a
modified Yolov8 which improves head detection performance through reinforcing
target perception. An Auxiliary Learning Feature Fusion (ALFF) module comprised
of LSTM and convolutional blocks is used as the auxiliary task to help the
model perceive targets. In addition, we introduce Noise Calibration into
Distribution Focal Loss to facilitate model fitting and improve the accuracy of
detection. Considering the requirements of high accuracy and speed for the head
detection task, our method is adapted with two kinds of backbone, namely
Yolov8n and Yolov8m. The results demonstrate the superior performance of our
approach in improving detection accuracy and robustness.
- Abstract(参考訳): 頭部検出は歩行者の分布情報を提供し、シーン統計分析、交通管理、リスクアセスメント、早期警戒に不可欠である。
しかし、実世界のシーンの複雑さと大規模な変動により、正確な検出がより困難になる。
そこで本研究では,目標知覚の強化により頭部検出性能を向上させる改良型Yolov8を提案する。
LSTMと畳み込みブロックで構成される補助学習機能融合(ALFF)モジュールが、モデルがターゲットを認識するのを助ける補助タスクとして使用される。
また,分散焦点損失にノイズ校正を導入することで,モデルフィッティングの容易化と検出精度の向上を図る。
本手法は,頭部検出タスクの精度と速度を考慮し,Yolov8nとYolov8mの2種類のバックボーンに適応する。
その結果,検出精度とロバスト性の向上に有効な手法が得られた。
関連論文リスト
- What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。
モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文 参考訳(メタデータ) (2024-11-12T09:52:40Z) - Localized Gaussians as Self-Attention Weights for Point Clouds Correspondence [92.07601770031236]
本稿では,エンコーダのみのトランスフォーマーアーキテクチャのアテンションヘッドにおける意味的意味パターンについて検討する。
注意重みの修正はトレーニングプロセスの促進だけでなく,最適化の安定性の向上にも寄与する。
論文 参考訳(メタデータ) (2024-09-20T07:41:47Z) - Open-Set Deepfake Detection: A Parameter-Efficient Adaptation Method with Forgery Style Mixture [58.60915132222421]
本稿では,顔偽造検出に汎用的かつパラメータ効率の高い手法を提案する。
フォージェリー・ソース・ドメインの多様性を増大させるフォージェリー・ミックス・フォーミュレーションを設計する。
設計したモデルは、トレーニング可能なパラメータを著しく減らし、最先端の一般化性を実現する。
論文 参考訳(メタデータ) (2024-08-23T01:53:36Z) - Research on target detection method of distracted driving behavior based on improved YOLOv8 [6.405098280736171]
本研究では,BOTNetモジュール,GAMアテンション機構,EIoU損失関数を統合することで,従来のYOLOv8モデルに基づく改良されたYOLOv8検出手法を提案する。
実験の結果, 精度は99.4%であり, 検出速度, 精度ともに良好であった。
論文 参考訳(メタデータ) (2024-07-02T00:43:41Z) - Efficient Meta-Learning Enabled Lightweight Multiscale Few-Shot Object Detection in Remote Sensing Images [15.12889076965307]
YOLOv7ワンステージ検出器は、新しいメタラーニングトレーニングフレームワークが組み込まれている。
この変換により、検出器はFSODのタスクに十分対応できると同時に、その固有の軽量化の利点を活かすことができる。
提案検出器の有効性を検証するため, 現状の検出器と性能比較を行った。
論文 参考訳(メタデータ) (2024-04-29T04:56:52Z) - HANet: A Hierarchical Attention Network for Change Detection With Bitemporal Very-High-Resolution Remote Sensing Images [6.890268321645873]
本研究では,変化情報の追加を含まないことに基づく,段階的前景バランスサンプリング戦略を提案する。
この戦略は、初期のトレーニングプロセス中に変更したピクセルの特徴を正確に学習するのに役立つ。
また,階層型注意ネットワーク(HANet)を設計し,マルチスケール機能の統合と詳細機能の改良を図る。
論文 参考訳(メタデータ) (2024-04-14T08:01:27Z) - Unsupervised Domain Adaptation for Self-Driving from Past Traversal
Features [69.47588461101925]
本研究では,新しい運転環境に3次元物体検出器を適応させる手法を提案する。
提案手法は,空間的量子化履歴特徴を用いたLiDARに基づく検出モデルを強化する。
実世界のデータセットの実験では、大幅な改善が示されている。
論文 参考訳(メタデータ) (2023-09-21T15:00:31Z) - Enhancing Infrared Small Target Detection Robustness with Bi-Level
Adversarial Framework [61.34862133870934]
本稿では,異なる汚職の存在下での検出の堅牢性を促進するために,二段階の対向的枠組みを提案する。
我々の手法は広範囲の汚職で21.96%のIOUを著しく改善し、特に一般ベンチマークで4.97%のIOUを推進している。
論文 参考訳(メタデータ) (2023-09-03T06:35:07Z) - Domain Adaptive Synapse Detection with Weak Point Annotations [63.97144211520869]
弱点アノテーションを用いたドメイン適応型シナプス検出のためのフレームワークであるAdaSynを提案する。
I SBI 2023のWASPSYNチャレンジでは、我々の手法が第1位にランクインした。
論文 参考訳(メタデータ) (2023-08-31T05:05:53Z) - Rule-Based Error Detection and Correction to Operationalize Movement Trajectory Classification [1.192247515575942]
動作軌跡プラットフォームに組み込むためのモデルの誤り訂正と検出を行う,ニューロシンボリックなルールベースのフレームワークを提供する。
最大0.984の誤差を予測するためのF1スコア、分布外精度の大幅な向上(ゼロショット精度のSOTAよりも8.51%向上)、SOTAモデルよりも精度の向上を示す。
論文 参考訳(メタデータ) (2023-08-28T01:57:38Z) - Improved YOLOv5 network for real-time multi-scale traffic sign detection [4.5598087061051755]
本稿では,アダプティブアテンションモジュール (AAM) と機能拡張モジュール (FEM) を利用して特徴マップ生成の過程での情報損失を低減する機能ピラミッドモデル AF-FPN を提案する。
YOLOv5の本来の特徴ピラミッドネットワークをAF-FPNに置き換え、YOLOv5ネットワークのマルチスケールターゲットの検出性能を向上させる。
論文 参考訳(メタデータ) (2021-12-16T11:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。