論文の概要: TY-RIST: Tactical YOLO Tricks for Real-time Infrared Small Target Detection
- arxiv url: http://arxiv.org/abs/2509.22909v1
- Date: Fri, 26 Sep 2025 20:36:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:18.933411
- Title: TY-RIST: Tactical YOLO Tricks for Real-time Infrared Small Target Detection
- Title(参考訳): TY-RIST:リアルタイム赤外小ターゲット検出のための戦術的YOLOトリップ
- Authors: Abdulkarim Atrash, Omar Moured, Yufan Chen, Jiaming Zhang, Seyda Ertekin, Omur Ugur,
- Abstract要約: 赤外線小目標検出(IRSTD)は、防衛と監視に重要であるが、依然として困難である。
我々は、ストライド対応のバックボーンと微粒な受容場を統合した、最適化されたYOLOv12nアーキテクチャであるTY-RISTを提案する。
4つのベンチマークと20の異なるモデルの実験では、最先端のパフォーマンスを示し、0.5 IoUでmAPを+7.9%、精度を+3%、リコールを+10.2%改善した。
- 参考スコア(独自算出の注目度): 6.0340092200636475
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Infrared small target detection (IRSTD) is critical for defense and surveillance but remains challenging due to (1) target loss from minimal features, (2) false alarms in cluttered environments, (3) missed detections from low saliency, and (4) high computational costs. To address these issues, we propose TY-RIST, an optimized YOLOv12n architecture that integrates (1) a stride-aware backbone with fine-grained receptive fields, (2) a high-resolution detection head, (3) cascaded coordinate attention blocks, and (4) a branch pruning strategy that reduces computational cost by about 25.5% while marginally improving accuracy and enabling real-time inference. We also incorporate the Normalized Gaussian Wasserstein Distance (NWD) to enhance regression stability. Extensive experiments on four benchmarks and across 20 different models demonstrate state-of-the-art performance, improving mAP at 0.5 IoU by +7.9%, Precision by +3%, and Recall by +10.2%, while achieving up to 123 FPS on a single GPU. Cross-dataset validation on a fifth dataset further confirms strong generalization capability. Additional results and resources are available at https://www.github.com/moured/TY-RIST
- Abstract(参考訳): 赤外線小目標検出(IRSTD)は防御・監視において重要であるが,(1)最小限の特徴による目標の喪失,(2)散在環境における誤報,(3)低塩濃度からの誤検知,(4)高計算コストにより依然として困難である。
これらの問題に対処するために,(1)細かな受容場を持つストライド対応バックボーン,(2)高分解能検出ヘッド,(3)カスケードされた座標注意ブロック,(4)計算コストを25.5%削減し,精度を極端に向上し,リアルタイム推論を可能にするブランチプルーニング戦略を統合する,最適化されたYOLOv12nアーキテクチャであるTY-RISTを提案する。
また、回帰安定性を高めるために正規化ガウスワッサーシュタイン距離(NWD)も組み込んだ。
4つのベンチマークと20の異なるモデルに対する大規模な実験は、最先端のパフォーマンスを示し、0.5 IoUでmAPを+7.9%、Precisionで+3%、Recallで+10.2%改善し、1つのGPUで最大123 FPSを達成する。
5番目のデータセットにおけるデータセット間の検証は、さらに強力な一般化能力を確認する。
追加の結果とリソースはhttps://www.github.com/moured/TY-RISTで入手できる。
関連論文リスト
- A Comprehensive Evaluation of YOLO-based Deer Detection Performance on Edge Devices [6.486957474966142]
鹿の侵入による農業の経済的損失は、アメリカで毎年数億ドルに上っていると推定され、伝統的な緩和戦略の不適切さを浮き彫りにした。
正確で効率的な鹿検出を必要とするインテリジェントで自律的なソリューションには、重要なニーズがある。
本研究では,シカ検出のための最先端深層学習モデルの総合的評価を行う。
論文 参考訳(メタデータ) (2025-09-24T17:01:50Z) - ANROT-HELANet: Adverserially and Naturally Robust Attention-Based Aggregation Network via The Hellinger Distance for Few-Shot Classification [4.283774189998499]
ANROT-HELANet, Adversarially and Naturally RObusT Hellinger Aggregation Networkを紹介する。
提案手法は, 逆向きかつ自然に頑健なヘリンジャー距離に基づく特徴クラスアグリゲーション方式を実装している。
FIDスコアは2.75で、従来のVAE (3.43) とWAE (3.38) よりも優れている。
論文 参考訳(メタデータ) (2025-09-14T11:44:43Z) - LEGNet: Lightweight Edge-Gaussian Driven Network for Low-Quality Remote Sensing Image Object Detection [18.804394986840887]
本稿では,新しいエッジ・ガウス・アグリゲーション(EGA)モジュールを備えた軽量バックボーンネットワークであるLEGNetを紹介する。
EGAモジュールは、(a)低コントラストやぼやけたオブジェクトでしばしば失われる重要なエッジの詳細を鋭くするために、方向対応のScharrフィルタと、(b)ノイズを抑え、あいまいな特徴応答を規則化するガウス的特徴改善を統合している。
5つのベンチマークの総合的な評価は、LEGNetが最先端のパフォーマンス、特に低品質なオブジェクトの検出を達成していることを示している。
論文 参考訳(メタデータ) (2025-03-18T08:20:24Z) - A Recurrent YOLOv8-based framework for Event-Based Object Detection [4.866548300593921]
本研究では、時間的モデリング機能を備えたフレームベース検出システムを強化する高度なオブジェクト検出フレームワークであるReYOLOv8を紹介する。
イベントデータを符号化する低レイテンシでメモリ効率の手法を実装し,システムの性能を向上する。
また、イベントデータのユニークな属性を利用するように調整された新しいデータ拡張手法を開発し、検出精度を向上した。
論文 参考訳(メタデータ) (2024-08-09T20:00:16Z) - Sense Less, Generate More: Pre-training LiDAR Perception with Masked Autoencoders for Ultra-Efficient 3D Sensing [0.6340101348986665]
本稿では,環境の広範囲なトレーニングに基づいて予測可能か,あるいは全体的な予測精度に限界がある環境の一部ではなく,環境の一部を生成する,破壊的かつフラグアルなLiDAR知覚データフローを提案する。
この目的のために提案した生成前訓練戦略であるR-MAE(Radially masked autoencoding)は、オンフィールド操作中にランダムに生成された角状領域のレーザパワーを選択的に活性化制御することにより、典型的なLiDARシステムでも容易に実装できる。
論文 参考訳(メタデータ) (2024-06-12T03:02:54Z) - SIRST-5K: Exploring Massive Negatives Synthesis with Self-supervised
Learning for Robust Infrared Small Target Detection [53.19618419772467]
単一フレーム赤外線小ターゲット検出(SIRST)は、乱雑な背景から小さなターゲットを認識することを目的としている。
Transformerの開発に伴い、SIRSTモデルのスケールは常に増大している。
赤外線小ターゲットデータの多彩な多様性により,本アルゴリズムはモデル性能と収束速度を大幅に改善する。
論文 参考訳(メタデータ) (2024-03-08T16:14:54Z) - SpirDet: Towards Efficient, Accurate and Lightweight Infrared Small
Target Detector [60.42293239557962]
我々は、赤外線小ターゲットの効率的な検出のための新しいアプローチであるSpirDetを提案する。
新しいデュアルブランチスパースデコーダを用いて特徴写像を復元する。
大規模な実験により、提案されたSpirDetは最先端モデルよりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2024-02-08T05:06:14Z) - A lightweight and accurate YOLO-like network for small target detection
in Aerial Imagery [94.78943497436492]
小型ターゲット検出のためのシンプルで高速で効率的なネットワークであるYOLO-Sを提案する。
YOLO-SはDarknet20をベースとした小さな特徴抽出器と、バイパスと連結の両方を通じて接続をスキップする。
YOLO-Sはパラメータサイズが87%減少し、約半分のFLOPがYOLOv3となり、低消費電力の産業用アプリケーションに実用化された。
論文 参考訳(メタデータ) (2022-04-05T16:29:49Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。