論文の概要: CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization
- arxiv url: http://arxiv.org/abs/2602.07523v1
- Date: Sat, 07 Feb 2026 12:38:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-10 20:26:24.667118
- Title: CA-YOLO: Cross Attention Empowered YOLO for Biomimetic Localization
- Title(参考訳): CA-YOLO:バイオミメティック・ローカライゼーションのためのクロスアテンション型YOLO
- Authors: Zhen Zhang, Qing Zhao, Xiuhe Li, Cheng Wang, Guoqiang Zhu, Yu Zhang, Yining Huo, Hongyi Yu, Yi Zhang,
- Abstract要約: 本稿では,CA-YOLOに基づくバイオニック安定化ローカライゼーションシステムを提案する。
このシステムは、目標位置決め精度と小さな目標認識能力を両立させるように設計されている。
実験の結果,CA-YOLOは標準データセットの原モデルよりも優れていた。
- 参考スコア(独自算出の注目度): 11.196426470911161
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In modern complex environments, achieving accurate and efficient target localization is essential in numerous fields. However, existing systems often face limitations in both accuracy and the ability to recognize small targets. In this study, we propose a bionic stabilized localization system based on CA-YOLO, designed to enhance both target localization accuracy and small target recognition capabilities. Acting as the "brain" of the system, the target detection algorithm emulates the visual focusing mechanism of animals by integrating bionic modules into the YOLO backbone network. These modules include the introduction of a small target detection head and the development of a Characteristic Fusion Attention Mechanism (CFAM). Furthermore, drawing inspiration from the human Vestibulo-Ocular Reflex (VOR), a bionic pan-tilt tracking control strategy is developed, which incorporates central positioning, stability optimization, adaptive control coefficient adjustment, and an intelligent recapture function. The experimental results show that CA-YOLO outperforms the original model on standard datasets (COCO and VisDrone), with average accuracy metrics improved by 3.94%and 4.90%, respectively.Further time-sensitive target localization experiments validate the effectiveness and practicality of this bionic stabilized localization system.
- Abstract(参考訳): 現代の複雑な環境では、多くの分野において、正確かつ効率的なターゲットローカライゼーションを達成することが不可欠である。
しかし、既存のシステムは、精度と小さなターゲットを認識する能力の両方に制限に直面していることが多い。
本研究では,CA-YOLOをベースとした生体音像定位システムを提案する。
システムの「脳」として機能するターゲット検出アルゴリズムは、バイオニックモジュールをYOLOバックボーンネットワークに統合することにより、動物の視覚的集中機構をエミュレートする。
これらのモジュールには、小さなターゲット検出ヘッドの導入や、特性核融合注意機構(CFAM)の開発が含まれる。
さらに,人間のVOR(Vestibulo-Ocular Reflex)からインスピレーションを得て,中央位置決め,安定性最適化,適応制御係数調整,インテリジェント再キャプチャ機能を備えたバイオニックパンティルトトラッキング制御戦略を開発した。
実験の結果,CA-YOLOは標準データセット(COCO)およびVisDrone(VisDrone)において,それぞれ平均精度を3.94%,4.90%改善した。
関連論文リスト
- YOLO-DS: Fine-Grained Feature Decoupling via Dual-Statistic Synergy Operator for Object Detection [55.58092342624062]
DSO(Dual-Statistic Synergy Operator)を中心に構築されたYOLO-DSを提案する。
YOLO-DSは、チャネル平均とピーク平均差を共同でモデル化することにより、オブジェクトの特徴を分離する。
MS-COCOベンチマークでは、YOLO-DSは5つのモデルスケールでYOLOv8を上回っている。
論文 参考訳(メタデータ) (2026-01-26T05:50:32Z) - YOLO-IOD: Towards Real Time Incremental Object Detection [57.862742461237055]
本稿では、事前訓練されたYOLO-Worldモデルに基づいて構築されたリアルタイムインクリメンタルオブジェクト検出(IOD)フレームワークであるYOLO-IODを紹介する。
YOLO-IODは3つの主要な構成要素を含む: 1) 衝突を意識した擬似ラベルリファインメント(CPR)は、前景と背景の混乱を緩和する。
また, クロスステージ非対称な知識蒸留法 (CAKD) を導入する。
論文 参考訳(メタデータ) (2025-12-28T15:35:26Z) - Generative MIMO Beam Map Construction for Location Recovery and Beam Tracking [67.65578956523403]
本稿では,スパースチャネル状態情報(CSI)から位置ラベルを直接復元する生成フレームワークを提案する。
生のCSIを直接格納する代わりに、小型の低次元無線地図の埋め込みを学び、生成モデルを利用して高次元CSIを再構築する。
数値実験により,NLOSシナリオにおける局所化精度が30%以上向上し,20%のキャパシティゲインが得られることが示された。
論文 参考訳(メタデータ) (2025-11-21T07:25:49Z) - Rethinking Evaluation of Infrared Small Target Detection [105.59753496831739]
本稿では,画素レベルと目標レベルのパフォーマンスを取り入れたハイブリッドレベルのメトリクスを導入し,システム的エラー解析手法を提案し,クロスデータセット評価の重要性を強調した。
標準化されたベンチマークを容易にするオープンソースツールキットがリリースされた。
論文 参考訳(メタデータ) (2025-09-21T02:45:07Z) - RoHOI: Robustness Benchmark for Human-Object Interaction Detection [84.78366452133514]
ヒューマン・オブジェクト・インタラクション(HOI)検出は、コンテキスト認識支援を可能にするロボット・ヒューマン・アシストに不可欠である。
HOI検出のための最初のベンチマークを導入し、様々な課題下でモデルのレジリエンスを評価する。
我々のベンチマークであるRoHOIは、HICO-DETとV-COCOデータセットに基づく20の汚職タイプと、新しいロバストネスにフォーカスしたメトリクスを含んでいる。
論文 参考訳(メタデータ) (2025-07-12T01:58:04Z) - VR-YOLO: Enhancing PCB Defect Detection with Viewpoint Robustness Based on YOLO [1.9861949351136194]
YOLOv8モデルに基づくVR-YOLOと呼ばれるPCB欠陥検出アルゴリズムを提案する。
本アルゴリズムは,現実的なアプリケーションシナリオにおいて,モデルの一般化性能を改善し,視点の堅牢性を高めることを目的としている。
論文 参考訳(メタデータ) (2025-06-30T10:50:04Z) - MS-YOLO: A Multi-Scale Model for Accurate and Efficient Blood Cell Detection [6.8030283745347155]
本研究は, YOLOv11フレームワークに基づく血液細胞検出モデルであるマルチスケールYOLO (MS-YOLO) を提案する。
MS-YOLOは検出性能を高めるために3つの重要なアーキテクチャ革新を取り入れている。
論文 参考訳(メタデータ) (2025-06-04T14:02:24Z) - YOLO-RS: Remote Sensing Enhanced Crop Detection Methods [0.32985979395737786]
既存のターゲット検出手法は、リモートセンシング画像において、小さなターゲットを扱う際の性能が劣っている。
YOLO-RSは、小さなターゲットの検出を大幅に強化した最新のYolov11に基づいている。
リモートセンシング画像における小目標検出作業におけるYOLO-RSの有効性と適用可能性を検証する実験を行った。
論文 参考訳(メタデータ) (2025-04-15T13:13:22Z) - DEAL-YOLO: Drone-based Efficient Animal Localization using YOLO [0.0]
本研究は,無人航空機(UAV)画像における小型物体検出を改善する新しい手法を提案する。
Deal-YOLO は Wise IoU (WIoU) や Normalized Wasserstein Distance (NWD) のような多目的損失関数を採用しており、バウンディングボックスの中央付近のピクセルを優先している。
このモデルはLinear Deformable (LD)畳み込みによる効率的な特徴抽出により最適化され、計算効率を維持しながら精度を向上する。
論文 参考訳(メタデータ) (2025-03-06T18:46:10Z) - LAM-YOLO: Drones-based Small Object Detection on Lighting-Occlusion Attention Mechanism YOLO [0.9062164411594178]
LAM-YOLOは、ドローンベースの画像に特化して設計されたオブジェクト検出モデルである。
我々は、異なる照明条件下での小さな目標の視認性を高めるために、光遮断注意機構を導入する。
次に、回帰損失関数として改良されたSIB-IoUを用いてモデル収束を加速し、局所化精度を向上させる。
論文 参考訳(メタデータ) (2024-11-01T10:00:48Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。