論文の概要: Don't let the information slip away
- arxiv url: http://arxiv.org/abs/2602.22595v1
- Date: Thu, 26 Feb 2026 03:58:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-27 18:41:22.518528
- Title: Don't let the information slip away
- Title(参考訳): 情報を逃がすな。
- Authors: Taozhe Li,
- Abstract要約: YOLOシリーズの検出器は、CNNベースの物体検出モデルの中で最もよく知られている。
変圧器を用いた物体検出モデルは優れた性能を示した。
本稿では,最先端の成果を得られるアソシエーションDETRと呼ばれるオブジェクト検出モデルを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Real-time object detection has advanced rapidly in recent years. The YOLO series of detectors is among the most well-known CNN-based object detection models and cannot be overlooked. The latest version, YOLOv26, was recently released, while YOLOv12 achieved state-of-the-art (SOTA) performance with 55.2 mAP on the COCO val2017 dataset. Meanwhile, transformer-based object detection models, also known as DEtection TRansformer (DETR), have demonstrated impressive performance. RT-DETR is an outstanding model that outperformed the YOLO series in both speed and accuracy when it was released. Its successor, RT-DETRv2, achieved 53.4 mAP on the COCO val2017 dataset. However, despite their remarkable performance, all these models let information to slip away. They primarily focus on the features of foreground objects while neglecting the contextual information provided by the background. We believe that background information can significantly aid object detection tasks. For example, cars are more likely to appear on roads rather than in offices, while wild animals are more likely to be found in forests or remote areas rather than on busy streets. To address this gap, we propose an object detection model called Association DETR, which achieves state-of-the-art results compared to other object detection models on the COCO val2017 dataset.
- Abstract(参考訳): 近年,リアルタイム物体検出が急速に進歩している。
YOLOシリーズの検出器は、CNNベースで最も有名な物体検出モデルの一つであり、見落とせない。
最新バージョンのYOLOv26が最近リリースされ、YOLOv12はCOCO val2017データセットで55.2mAPで最先端(SOTA)のパフォーマンスを達成した。
一方, トランスを用いた物体検出モデルは, DETR(Detection TRansformer)としても知られており, 優れた性能を示している。
RT-DETR(RT-DETR)は、YOLOシリーズがリリースされたときの速度と精度の両方で優れたモデルである。
RT-DETRv2はCOCO val2017データセットで53.4mAPを達成した。
しかし、優れた性能にもかかわらず、これらのモデルはすべて情報を漏らした。
主に、背景から提供されるコンテキスト情報を無視しながら、前景オブジェクトの特徴に焦点を当てる。
背景情報は、オブジェクト検出タスクに大いに役立つと信じている。
例えば、自動車はオフィスではなく道路に現れる傾向があり、野生動物は繁華街よりも森や遠隔地で見られる傾向にある。
このギャップに対処するために、COCO val2017データセット上の他のオブジェクト検出モデルと比較して最先端の結果が得られるAsociation DETRと呼ばれるオブジェクト検出モデルを提案する。
関連論文リスト
- Replication Study and Benchmarking of Real-Time Object Detection Models [0.4499833362998488]
複数のグラフィクスカードにおける物体検出モデルの精度と推論速度を比較した。
本稿では,MMDetectionの機能に基づく統合トレーニングと評価パイプラインを提案し,モデルの比較を改良する。
結果は精度と速度の間に強いトレードオフを示し、アンカーフリーモデルが優勢である。
論文 参考訳(メタデータ) (2024-05-11T04:47:50Z) - From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution [3.5044007821404635]
空中物体検出は、小さな物体の大きさ、高密度クラスタリング、距離や動きのぼかしによる画質劣化などの課題を提示する。
B2BDetは、推論中にドメイン固有の超解像を適用し、拡張されたYOLOv5アーキテクチャを使って検出する2段階のフレームワークでこの問題に対処する。
このアプローチは、航空最適化SRGAN微調整とEAM(Efficient Attention Module)やCLFPN(Cross-Layer Feature Pyramid Network)といったアーキテクチャ革新を組み合わせる。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - Innovative Horizons in Aerial Imagery: LSKNet Meets DiffusionDet for
Advanced Object Detection [55.2480439325792]
本稿では,LSKNetのバックボーンをDiffusionDetヘッドに統合したオブジェクト検出モデルの詳細な評価を行う。
提案手法は平均精度(MAP)を約45.7%向上させる。
この進歩は、提案された修正の有効性を強調し、航空画像解析の新しいベンチマークを設定する。
論文 参考訳(メタデータ) (2023-11-21T19:49:13Z) - YOLO-MS: Rethinking Multi-Scale Representation Learning for Real-time Object Detection [63.36722419180875]
YOLO-MSと呼ばれる効率的かつ高性能な物体検出器を提供する。
私たちは、他の大規模なデータセットに頼ることなく、MS COCOデータセット上でYOLO-MSをスクラッチからトレーニングします。
私たちの作業は、他のYOLOモデルのプラグイン・アンド・プレイモジュールとしても機能します。
論文 参考訳(メタデータ) (2023-08-10T10:12:27Z) - Exploring the Effectiveness of Dataset Synthesis: An application of
Apple Detection in Orchards [68.95806641664713]
本研究では,リンゴ樹の合成データセットを生成するための安定拡散2.1-baseの有用性について検討する。
我々は、現実世界のリンゴ検出データセットでリンゴを予測するために、YOLOv5mオブジェクト検出モデルを訓練する。
その結果、実世界の画像でトレーニングされたベースラインモデルと比較して、生成データでトレーニングされたモデルはわずかに性能が劣っていることがわかった。
論文 参考訳(メタデータ) (2023-06-20T09:46:01Z) - DORT: Modeling Dynamic Objects in Recurrent for Multi-Camera 3D Object
Detection and Tracking [67.34803048690428]
本稿では、この問題を解決するためにRecurrenT(DORT)の動的オブジェクトをモデル化することを提案する。
DORTは、重い計算負担を軽減する動き推定のために、オブジェクトワイズローカルボリュームを抽出する。
フレキシブルで実用的で、ほとんどのカメラベースの3Dオブジェクト検出器に差し込むことができる。
論文 参考訳(メタデータ) (2023-03-29T12:33:55Z) - Evaluation of YOLO Models with Sliced Inference for Small Object
Detection [0.0]
この研究は、小さなオブジェクト検出のためにYOLOv5とYOLOXモデルをベンチマークすることを目的としている。
スライスされた微調整とスライスされた推論が組み合わさって全てのモデルに大幅な改善をもたらした。
論文 参考訳(メタデータ) (2022-03-09T15:24:30Z) - YOLO-Z: Improving small object detection in YOLOv5 for autonomous
vehicles [5.765622319599904]
本研究は, YOLOv5物体検出器を改良して, 小型物体の検出性能を向上させる方法について検討した。
我々は, YOLO-Z'と命名し, 50%IOUで小さな物体を検出する場合に, 最大6.9%のmAP向上を示すモデルを提案する。
本研究の目的は、YOLOv5などの一般的な検出器を調整して特定のタスクに対処する可能性について、今後の研究を知らせることである。
論文 参考訳(メタデータ) (2021-12-22T11:03:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。