論文の概要: FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection
- arxiv url: http://arxiv.org/abs/2508.19565v1
- Date: Wed, 27 Aug 2025 04:49:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-28 19:07:41.491629
- Title: FlowDet: Overcoming Perspective and Scale Challenges in Real-Time End-to-End Traffic Detection
- Title(参考訳): FlowDet: リアルタイムエンドツーエンドトラフィック検出における展望とスケールアップの課題
- Authors: Yuhang Zhao, Zixing Wang,
- Abstract要約: FlowDetはDreTRアーキテクチャに適用された分離エンコーダ最適化戦略を備えた高速検出器である。
FlowDetは、トラフィック対応の幾何モデリングに新しい幾何学的変形ユニット(GDU)を採用している。
AP(test)を1.5%改善し、AP50(test)を1.6%改善し、同時にGFLOPを63.2%削減し、推論速度を16.2%向上させた。
- 参考スコア(独自算出の注目度): 4.183936640596278
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: End-to-end object detectors offer a promising NMS-free paradigm for real-time applications, yet their high computational cost remains a significant barrier, particularly for complex scenarios like intersection traffic monitoring. To address this challenge, we propose FlowDet, a high-speed detector featuring a decoupled encoder optimization strategy applied to the DETR architecture. Specifically, FlowDet employs a novel Geometric Deformable Unit (GDU) for traffic-aware geometric modeling and a Scale-Aware Attention (SAA) module to maintain high representational power across extreme scale variations. To rigorously evaluate the model's performance in environments with severe occlusion and high object density, we collected the Intersection-Flow-5k dataset, a new challenging scene for this task. Evaluated on Intersection-Flow-5k, FlowDet establishes a new state-of-the-art. Compared to the strong RT-DETR baseline, it improves AP(test) by 1.5% and AP50(test) by 1.6%, while simultaneously reducing GFLOPs by 63.2% and increasing inference speed by 16.2%. Our work demonstrates a new path towards building highly efficient and accurate detectors for demanding, real-world perception systems. The Intersection-Flow-5k dataset is available at https://github.com/AstronZh/Intersection-Flow-5K.
- Abstract(参考訳): エンドツーエンドのオブジェクト検出器は、リアルタイムアプリケーションには有望なNMSフリーパラダイムを提供しますが、特に交差点トラフィック監視のような複雑なシナリオでは、高い計算コストが大きな障壁になります。
この課題に対処するため,DTRアーキテクチャに適用した分離エンコーダ最適化戦略を特徴とする高速検出器であるFlowDetを提案する。
特に、FlowDetでは、トラフィック認識幾何モデリングのための新しい幾何学的変形ユニット(GDU)と、極端なスケールのバリエーションを越えて高い表現力を維持するためのスケール・アウェア・アテンション(SAA)モジュールを採用している。
厳密な閉塞と高対象密度の環境下でのモデルの性能を評価するため,我々はIntersection-Flow-5kデータセットを収集した。
Intersection-Flow-5kで評価されたFlowDetは、新しい最先端技術を確立している。
強力なRT-DETRベースラインと比較して、AP(test)を1.5%改善し、AP50(test)を1.6%改善し、同時にGFLOPを63.2%削減し、推論速度を16.2%向上させた。
我々の研究は、需要の高い現実世界の知覚システムのために、高効率で正確な検出器を構築するための新しい道を示す。
Intersection-Flow-5kデータセットはhttps://github.com/AstronZh/Intersection-Flow-5Kで公開されている。
関連論文リスト
- High-Frequency Semantics and Geometric Priors for End-to-End Detection Transformers in Challenging UAV Imagery [4.833513511627847]
無人航空機による物体検出(UAV-OD)は、小型の目標サイズ、高密度分布、UAV画像の散在した背景など、重大な課題に直面している。
本稿では,UAVに適した拡張リアルタイム検出トランスフォーマフレームワークHEGS-DETRを提案する。
VisDroneデータセットの実験では、HEGS-DETRはベースライン上で5.1%のAP50と3.8%のAP増加を達成する一方で、リアルタイム速度を維持し、パラメータ数を4M削減している。
論文 参考訳(メタデータ) (2025-07-01T14:56:56Z) - Learning Traffic Anomalies from Generative Models on Real-Time Observations [49.1574468325115]
トラフィックデータの複雑な空間的および時間的依存関係をキャプチャするために,時空間生成適応ネットワーク(STGAN)フレームワークを用いる。
スウェーデンのヨーテボリで2020年に収集された42台の交通カメラから、STGANをリアルタイムで分単位でリアルタイムで観測する。
その結果, 精度が高く, 偽陽性率の低い交通異常を効果的に検出できることが示唆された。
論文 参考訳(メタデータ) (2025-02-03T14:23:23Z) - FlowTS: Time Series Generation via Rectified Flow [67.41208519939626]
FlowTSは、確率空間における直線輸送を伴う整流フローを利用するODEベースのモデルである。
非条件設定では、FlowTSは最先端のパフォーマンスを達成し、コンテキストFIDスコアはStockとETThデータセットで0.019と0.011である。
条件設定では、太陽予測において優れた性能を達成している。
論文 参考訳(メタデータ) (2024-11-12T03:03:23Z) - From Blurry to Brilliant Detection: YOLO-Based Aerial Object Detection with Super Resolution [3.5044007821404635]
空中物体検出は、小さな物体の大きさ、高密度クラスタリング、距離や動きのぼかしによる画質劣化などの課題を提示する。
B2BDetは、推論中にドメイン固有の超解像を適用し、拡張されたYOLOv5アーキテクチャを使って検出する2段階のフレームワークでこの問題に対処する。
このアプローチは、航空最適化SRGAN微調整とEAM(Efficient Attention Module)やCLFPN(Cross-Layer Feature Pyramid Network)といったアーキテクチャ革新を組み合わせる。
論文 参考訳(メタデータ) (2024-01-26T05:50:58Z) - Improved YOLOv5 network for real-time multi-scale traffic sign detection [4.5598087061051755]
本稿では,アダプティブアテンションモジュール (AAM) と機能拡張モジュール (FEM) を利用して特徴マップ生成の過程での情報損失を低減する機能ピラミッドモデル AF-FPN を提案する。
YOLOv5の本来の特徴ピラミッドネットワークをAF-FPNに置き換え、YOLOv5ネットワークのマルチスケールターゲットの検出性能を向上させる。
論文 参考訳(メタデータ) (2021-12-16T11:02:12Z) - Anchor Retouching via Model Interaction for Robust Object Detection in
Aerial Images [15.404024559652534]
本稿では,新しいトレーニングサンプルジェネレータを構築するために,動的拡張アンカー(DEA)ネットワークを提案する。
提案手法は,適度な推論速度とトレーニングの計算オーバーヘッドを伴って,最先端の性能を精度良く達成する。
論文 参考訳(メタデータ) (2021-12-13T14:37:20Z) - FastFlowNet: A Lightweight Network for Fast Optical Flow Estimation [81.76975488010213]
ディセンス光学フロー推定は、多くのロボットビジョンタスクで重要な役割を果たしています。
現在のネットワークはしばしば多くのパラメータを占有し、計算コストがかかる。
提案したFastFlowNetは、周知の粗大なやり方で、以下のイノベーションで機能する。
論文 参考訳(メタデータ) (2021-03-08T03:09:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。