論文の概要: CF-DETR: Coarse-to-Fine Transformer for Real-Time Object Detection
- arxiv url: http://arxiv.org/abs/2505.23317v1
- Date: Thu, 29 May 2025 10:23:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-30 18:14:07.810134
- Title: CF-DETR: Coarse-to-Fine Transformer for Real-Time Object Detection
- Title(参考訳): CF-DETR:リアルタイム物体検出用粗大変換器
- Authors: Woojin Shin, Donghwa Kang, Byeongyun Park, Brent Byunghoon Kang, Jinkyu Lee, Hyeongboo Baek,
- Abstract要約: CF-DETRは、新しい粗大なトランスフォーマーアーキテクチャと専用のリアルタイムスケジューリングフレームワークNPFP**を備えた統合システムである。
それぞれのDETRタスクを、期限内に重要なオブジェクト検出を保証するための安全クリティカルな粗いサブタスクと、全体的な正確性を高めるためのオプションのファインサブタスクに分割する(R2)。
NPFP*ポリシーの下では、CF-DETRはクリティカルオペレーションの厳密なタイミング保証を達成し、様々なAVワークロードにおける既存のベースラインと比較して、全体的なおよび重要なオブジェクト検出精度を大幅に向上させる。
- 参考スコア(独自算出の注目度): 3.002784388635573
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Detection Transformers (DETR) are increasingly adopted in autonomous vehicle (AV) perception systems due to their superior accuracy over convolutional networks. However, concurrently executing multiple DETR tasks presents significant challenges in meeting firm real-time deadlines (R1) and high accuracy requirements (R2), particularly for safety-critical objects, while navigating the inherent latency-accuracy trade-off under resource constraints. Existing real-time DNN scheduling approaches often treat models generically, failing to leverage Transformer-specific properties for efficient resource allocation. To address these challenges, we propose CF-DETR, an integrated system featuring a novel coarse-to-fine Transformer architecture and a dedicated real-time scheduling framework NPFP**. CF-DETR employs three key strategies (A1: coarse-to-fine inference, A2: selective fine inference, A3: multi-level batch inference) that exploit Transformer properties to dynamically adjust patch granularity and attention scope based on object criticality, aiming to satisfy R2. The NPFP** scheduling framework (A4) orchestrates these adaptive mechanisms A1-A3. It partitions each DETR task into a safety-critical coarse subtask for guaranteed critical object detection within its deadline (ensuring R1), and an optional fine subtask for enhanced overall accuracy (R2), while managing individual and batched execution. Our extensive evaluations on server, GPU-enabled embedded platforms, and actual AV platforms demonstrate that CF-DETR, under an NPFP** policy, successfully meets strict timing guarantees for critical operations and achieves significantly higher overall and critical object detection accuracy compared to existing baselines across diverse AV workloads.
- Abstract(参考訳): 検出トランスフォーマー(DETR)は、畳み込みネットワークよりも精度が高いため、自律走行車(AV)知覚システムにおいてますます採用されている。
しかし、複数のDETRタスクを同時に実行することは、リソース制約の下で本質的に遅延精度のトレードオフをナビゲートしながら、特に安全クリティカルなオブジェクトに対して、確固たるリアルタイム期限(R1)と高精度要件(R2)を満たす上で大きな課題となる。
既存のリアルタイムDNNスケジューリングアプローチは、しばしばモデルを汎用的に扱うが、効率的なリソース割り当てのためにTransformer固有のプロパティを利用できない。
これらの課題に対処するために,新しい粗大なトランスフォーマーアーキテクチャと専用リアルタイムスケジューリングフレームワークNPFP**を備えた統合システムCF-DETRを提案する。
CF-DETRは3つの重要な戦略(A1:粗粒度推論、A2:選択的細粒度推論、A3:マルチレベルバッチ推論)を採用している。
NPFP*スケジューリングフレームワーク(A4)は、これらの適応機構A1〜A3を編成する。
各DETRタスクを、期限内で重要なオブジェクト検出を保証するための安全クリティカルな粗いサブタスク(R1の保証)と、個別およびバッチ実行を管理しながら、全体的な正確性(R2)を高めるためのオプションの微調整サブタスク(R2)に分割する。
サーバ,GPU対応組込みプラットフォーム,および実際のAVプラットフォームに対する広範な評価は,CF-DETRがNPFP*ポリシーの下で,クリティカルオペレーションの厳格なタイミング保証を達成し,さまざまなAVワークロードの既存のベースラインと比較して,総合的かつ重要なオブジェクト検出精度を著しく向上することを示した。
関連論文リスト
- DriveTransformer: Unified Transformer for Scalable End-to-End Autonomous Driving [62.62464518137153]
DriveTransformerは、スケールアップを簡単にするためのシンプルなE2E-ADフレームワークである。
タスク・セルフ・アテンション、センサー・クロス・アテンション、時間的クロス・アテンションという3つの統合された操作で構成されている。
シミュレーションされたクローズドループベンチマークBench2Driveと、FPSの高い実世界のオープンループベンチマークnuScenesの両方で、最先端のパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-07T11:41:18Z) - Fractional Correspondence Framework in Detection Transformer [13.388933240897492]
Detection Transformer (DETR) はオブジェクト検出タスクのマッチングプロセスを大幅に単純化した。
このアルゴリズムは、予測された有界箱とトレーニング中の接地的アノテーションとの最適な1対1マッチングを容易にする。
本稿では,予測と地上の真実を整合させるコストを捉え,最も正確な対応を見つけるためのフレキシブルマッチング戦略を提案する。
論文 参考訳(メタデータ) (2025-03-06T05:29:20Z) - Distribution-Aware Continual Test-Time Adaptation for Semantic Segmentation [33.75630514826721]
実世界の応用において, セマンティックセグメンテーションCTTAを効率的かつ実用的なものにするための分散対応チューニング(DAT)手法を提案する。
DATは、連続的な適応プロセス中にデータ分布に基づいて、トレーニング可能なパラメータの2つの小さなグループを適応的に選択し、更新する。
我々は2つの広く使われているセマンティックセマンティックセマンティクスCTTAベンチマークで実験を行い、従来の最先端手法と比較して有望な性能を実現した。
論文 参考訳(メタデータ) (2023-09-24T10:48:20Z) - RegFormer: An Efficient Projection-Aware Transformer Network for
Large-Scale Point Cloud Registration [73.69415797389195]
本稿では,大規模クラウドアライメントのためのエンドツーエンドトランス (RegFormer) ネットワークを提案する。
具体的には、プロジェクション対応階層変換器を提案し、長距離依存を捕捉し、外乱をフィルタする。
我々の変圧器は線形複雑であり、大規模シーンでも高い効率が保証される。
論文 参考訳(メタデータ) (2023-03-22T08:47:37Z) - Miti-DETR: Object Detection based on Transformers with Mitigatory
Self-Attention Convergence [17.854940064699985]
本稿では,緩和的自己認識機構を備えたトランスフォーマーアーキテクチャを提案する。
Miti-DETRは、各注意層の入力をそのレイヤの出力に予約し、「非注意」情報が注意伝播に関与するようにします。
Miti-DETRは、既存のDETRモデルに対する平均検出精度と収束速度を大幅に向上させる。
論文 参考訳(メタデータ) (2021-12-26T03:23:59Z) - Adaptive Anomaly Detection for Internet of Things in Hierarchical Edge
Computing: A Contextual-Bandit Approach [81.5261621619557]
階層エッジコンピューティング(HEC)を用いた適応型異常検出手法を提案する。
まず,複雑性を増した複数のDNNモデルを構築し,それぞれを対応するHEC層に関連付ける。
そこで我々は、文脈帯域問題として定式化され、強化学習ポリシーネットワークを用いて解決される適応モデル選択スキームを設計する。
論文 参考訳(メタデータ) (2021-08-09T08:45:47Z) - Higher Performance Visual Tracking with Dual-Modal Localization [106.91097443275035]
Visual Object Tracking (VOT)は、堅牢性と正確性の両方に同期性を必要とする。
ONRによるロバストなローカリゼーション抑制器とOFCによるターゲットセンターへの正確なローカリゼーションにより、ターゲットローカリゼーションのためのデュアルモーダルフレームワークを提案します。
論文 参考訳(メタデータ) (2021-03-18T08:47:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。