論文の概要: CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization
- arxiv url: http://arxiv.org/abs/2602.07523v1
- Date: Sat, 07 Feb 2026 12:38:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.667118
- Title: CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization
- Title(参考訳): CA-YOLO:バイオミメティック・ローカライゼーションのためのクロスアテンション型YOLO
- Authors: Zhen Zhang, Qing Zhao, Xiuhe Li, Cheng Wang, Guoqiang Zhu, Yu Zhang, Yining Huo, Hongyi Yu, Yi Zhang,
- Abstract要約: 本稿では,CA-YOLOに基づくバイオニック安定化ローカライゼーションシステムを提案する。
このシステムは、目標位置決め精度と小さな目標認識能力を両立させるように設計されている。
実験の結果,CA-YOLOは標準データセットの原モデルよりも優れていた。
- 参考スコア(独自算出の注目度): 11.196426470911161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In modern complex environments, achieving accurate and efficient target localization is essential in numerous fields. However, existing systems often face limitations in both accuracy and the ability to recognize small targets. In this study, we propose a bionic stabilized localization system based on CA-YOLO, designed to enhance both target localization accuracy and small target recognition capabilities. Acting as the "brain" of the system, the target detection algorithm emulates the visual focusing mechanism of animals by integrating bionic modules into the YOLO backbone network. These modules include the introduction of a small target detection head and the development of a Characteristic Fusion Attention Mechanism (CFAM). Furthermore, drawing inspiration from the human Vestibulo-Ocular Reflex (VOR), a bionic pan-tilt tracking control strategy is developed, which incorporates central positioning, stability optimization, adaptive control coefficient adjustment, and an intelligent recapture function. The experimental results show that CA-YOLO outperforms the original model on standard datasets (COCO and VisDrone), with average accuracy metrics improved by 3.94%and 4.90%, respectively.Further time-sensitive target localization experiments validate the effectiveness and practicality of this bionic stabilized localization system.
- Abstract(参考訳): 現代の複雑な環境では、多くの分野において、正確かつ効率的なターゲットローカライゼーションを達成することが不可欠である。
しかし、既存のシステムは、精度と小さなターゲットを認識する能力の両方に制限に直面していることが多い。
本研究では,CA-YOLOをベースとした生体音像定位システムを提案する。
システムの「脳」として機能するターゲット検出アルゴリズムは、バイオニックモジュールをYOLOバックボーンネットワークに統合することにより、動物の視覚的集中機構をエミュレートする。
これらのモジュールには、小さなターゲット検出ヘッドの導入や、特性核融合注意機構(CFAM)の開発が含まれる。
さらに,人間のVOR(Vestibulo-Ocular Reflex)からインスピレーションを得て,中央位置決め,安定性最適化,適応制御係数調整,インテリジェント再キャプチャ機能を備えたバイオニックパンティルトトラッキング制御戦略を開発した。
実験の結果,CA-YOLOは標準データセット(COCO)およびVisDrone(VisDrone)において,それぞれ平均精度を3.94%,4.90%改善した。
関連論文リスト
- YOLO-IOD: Towards Real Time Incremental Object Detection [57.862742461237055]
本稿では、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介する。
YOLO-IODは3つの主要な構成要素を含む: 1) 衝突を意識した擬似ラベルリファインメント(CPR)は、前景と背景の混乱を緩和する。
また, クロスステージ非対称な知識蒸留法 (CAKD) を導入する。
論文 参考訳(メタデータ) (2025-12-28T15:35:26Z) - Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - MS-YOLO: A Multi-Scale Model for Accurate and Efficient Blood Cell Detection [6.8030283745347155]
本研究は, YOLOv11フレームワークに基づく血液細胞検出モデルであるマルチスケールYOLO (MS-YOLO) を提案する。
MS-YOLOは検出性能を高めるために3つの重要なアーキテクチャ革新を取り入れている。
論文 参考訳(メタデータ) (2025-06-04T14:02:24Z) - YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。