論文の概要: TinyFormer: Preserving Tiny Objects in YOLO-DETRHybridReal-time Detectors
- arxiv url: http://arxiv.org/abs/2605.25046v1
- Date: Sun, 24 May 2026 12:42:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.6728
- Title: TinyFormer: Preserving Tiny Objects in YOLO-DETRHybridReal-time Detectors
- Title(参考訳): TinyFormer: YOLO-DETRHybridReal-time Detector内のTinyオブジェクトを保存する
- Authors: Jun-Wei Hsieh, Meng-Yu Kao, Ghufron Wahyu Kurniawan, Kuan-Chuan Peng,
- Abstract要約: YOLOシリーズとDETRベースの検出器は、小さな物体検出に苦労する。
TinyFormerは、ViT表現、NMSなしのセット予測、YOLOスタイルのピラミッドネックを組み合わせたリアルタイム検出器である。
TinyFormerは、最近のYOLOシリーズ検出器と強力なDEIMv2ベースラインを一貫して上回っている。
- 参考スコア(独自算出の注目度): 16.413336628781064
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: YOLO-series and DETR-based detectors struggle with tiny-object detection. YOLO-style models benefit from efficient dense prediction, but their large-stride backbones may suppress tiny instances in deep feature maps and make grid assignment ambiguous. DETR-based models remove hand-crafted post-processing through set prediction, yet they reason over coarse token grids, where tiny objects occupy only a few weak tokens and are easily overlooked during matching. To address these limitations, we propose TinyFormer, a unified YOLO--DETR hybrid real-time detector that combines ViT representations, NMS-free set prediction, and a YOLO-style pyramid neck for accurate small-object detection. TinyFormer introduces a Parallel Bi-fusion Module (PBM), which builds high-resolution shortcuts from shallow stages to the feature pyramid, preserving fine spatial details during multi-scale fusion. We further design a Spatial Semantic Adapter (SSA) to compensate for the spatial loss caused by coarse tokenization. SSA extracts high-resolution cues from early stages and injects them into transformer token embeddings, improving tiny-object localization without sacrificing the global modeling ability of DETR. Experiments on MS COCO show that TinyFormer consistently outperforms recent YOLO-series detectors and the strong DEIMv2 baseline. TinyFormer-X achieves 58.4% AP even without PBM, while adding PBM improves the overall AP to 58.5% and brings a 1.6% AP gain on small objects. With Objects365 pre-training, TinyFormer-X-PBM reaches 60.2% AP, surpassing RF-DETR and other Objects365-pretrained detectors with fewer parameters and lower computation. These results demonstrate that TinyFormer bridges dense YOLO-style feature fusion and DETR-style set prediction, providing a strong accuracy-efficiency trade-off for real-time tiny-object detection. Code is available at https://github.com/mmpmmpmmpjosh/TinyFormer.
- Abstract(参考訳): YOLOシリーズとDETRベースの検出器は、小さな物体検出に苦労する。
YOLOスタイルのモデルは効率的な密度予測の恩恵を受けるが、その大きなストライドバックボーンは、深い特徴写像の小さなインスタンスを抑圧し、グリッドの割り当てを曖昧にする可能性がある。
DETRベースのモデルは、設定された予測を通じて手作りのポストプロセッシングを除去するが、小さなオブジェクトがいくつかの弱いトークンを占有し、マッチング中に容易に見落としてしまう粗いトークングリッドを優先する。
これらの制約に対処するために,VET表現,NMSフリーなセット予測,高精度な小物体検出のためのYOLOスタイルのピラミッドネックを組み合わせた統合型YOLO-DETRハイブリッドリアルタイム検出器TinyFormerを提案する。
TinyFormerはParallel Bi-fusion Module (PBM)を導入し、浅いステージから特徴ピラミッドへ高解像度のショートカットを構築する。
さらに、粗いトークン化による空間損失を補償する空間意味適応器(SSA)を設計する。
SSAは、早期から高分解能のキューを抽出し、トランスフォーマートークンの埋め込みに注入し、DETRのグローバルモデリング能力を犠牲にすることなく、小さなオブジェクトのローカライゼーションを改善する。
MS COCOの実験では、TinyFormerは最近のYOLOシリーズ検出器と強力なDEIMv2ベースラインを一貫して上回っている。
TinyFormer-X は PBM を使わずに 58.4% AP を達成し、PBM を追加することで AP 全体の 58.5% が改善され、小さなオブジェクトに対して 1.6% AP が上昇する。
Objects365の事前トレーニングでは、TinyFormer-X-PBMは60.2%APに達し、RF-DETRや他のObjects365プリトレーニングされた検出器を上回り、パラメータが少なく、計算量も少ない。
これらの結果から,TinyFormerは高密度YOLOスタイルの特徴融合とDETRスタイルのセット予測を橋渡しし,リアルタイムの微小物体検出に強い精度・効率のトレードオフをもたらすことが示された。
コードはhttps://github.com/mmpmpmmpjosh/TinyFormer.comで入手できる。
関連論文リスト
- Generalized Small Object Detection:A Point-Prompted Paradigm and Benchmark [54.91847070147244]
小さい物体検出(SOD)は、非常に限られたピクセルとあいまいな物体の境界のために難しいままである。
これらの特徴は、挑戦的なアノテーション、大規模な高品質データセットの可用性の制限、そして本質的に小さなオブジェクトに対する弱いセマンティック表現をもたらす。
本研究では,小型オブジェクト検出のための大規模マルチドメインデータセットTinySet-9Mを導入することで,データ制限に対処する。
論文 参考訳(メタデータ) (2026-04-03T06:32:18Z) - Scale-Aware Relay and Scale-Adaptive Loss for Tiny Object Detection in Aerial Images [22.70176024890317]
本稿では,SARL(Scale-Aware Relay Layer)とSAL(Scale-Adaptive Loss)を提案する。
SARLは、各層の有意義な特徴を徐々に豊かにするために、空間チャネルを横断的に注意する。
SALは、バニラIoUベースの損失を補足して、より大きなオブジェクトに低重量を動的に割り当てる。
論文 参考訳(メタデータ) (2025-11-13T02:54:58Z) - A lightweight model FDM-YOLO for small target improvement based on YOLOv8 [0.0]
小さいターゲットは、低いピクセル数、複雑な背景、様々な射撃角度のために検出が困難である。
本稿では,小目標検出に焦点をあて,低計算制約下での物体検出手法について検討する。
論文 参考訳(メタデータ) (2025-03-06T14:06:35Z) - SL-YOLO: A Stronger and Lighter Drone Target Detection Model [0.0]
本稿では,小型目標検出のボトルネックを解消する革命モデルSL-YOLO(Stronger and Lighter YOLO)を提案する。
本稿では,最も難易度の高い環境においても,非並列検出精度を確保することのできる,大規模機能融合の先駆的手法を提案する。
VisDrone 2019データセットの実験結果によると,mAP@0.5が43.0%から46.9%に向上した。
モデルパラメータは 11.1M から 9.6M に減少し、FPS は 132 に到達し、資源制約のある環境でのリアルタイムの小さな物体検出に理想的な解となる。
論文 参考訳(メタデータ) (2024-11-18T11:26:11Z) - Visible and Clear: Finding Tiny Objects in Difference Map [50.54061010335082]
本稿では,検出モデルに自己再構成機構を導入し,それと微小物体との強い相関関係を明らかにする。
具体的には、再構成画像と入力の差分マップを構築して、検出器の首の内側に再構成ヘッドを配置し、小さな物体に対して高い感度を示す。
さらに、小さな特徴表現をより明確にするために、差分マップガイド機能拡張(DGFE)モジュールを開発する。
論文 参考訳(メタデータ) (2024-05-18T12:22:26Z) - YOLO-TLA: An Efficient and Lightweight Small Object Detection Model based on YOLOv5 [19.388112026410045]
YOLO-TLAは、YOLOv5上に構築された高度な物体検出モデルである。
まず、ネックネットワークピラミッドアーキテクチャにおいて、小さなオブジェクトに対する検出層を新たに導入する。
このモジュールはスライディングウィンドウの特徴抽出を使い、計算要求とパラメータ数の両方を効果的に最小化する。
論文 参考訳(メタデータ) (2024-02-22T05:55:17Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - EdgeYOLO: An Edge-Real-Time Object Detector [69.41688769991482]
本稿では, 最先端のYOLOフレームワークをベースとした, 効率的で低複雑さかつアンカーフリーな物体検出器を提案する。
我々は,訓練中の過剰適合を効果的に抑制する拡張データ拡張法を開発し,小型物体の検出精度を向上させるためにハイブリッドランダム損失関数を設計する。
私たちのベースラインモデルは、MS 2017データセットで50.6%のAP50:95と69.8%のAP50、VisDrone 2019-DETデータセットで26.4%のAP50と44.8%のAP50に達し、エッジコンピューティングデバイスNvidia上でリアルタイム要求(FPS>=30)を満たす。
論文 参考訳(メタデータ) (2023-02-15T06:05:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。