論文の概要: End-to-End Lane detection with One-to-Several Transformer
- arxiv url: http://arxiv.org/abs/2305.00675v4
- Date: Sat, 13 May 2023 04:42:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-16 20:43:07.633233
- Title: End-to-End Lane detection with One-to-Several Transformer
- Title(参考訳): 1対1変圧器によるエンド・ツー・エンド車線検出
- Authors: Kunyang Zhou and Rui Zhou
- Abstract要約: O2SFormerはResNet18バックボーンのDETRよりも12.5倍高速に収束する。
ResNet50のバックボーンを持つO2SFormerは、CULaneデータセット上で77.83%のF1スコアを獲得し、既存のTransformerベースおよびCNNベースの検出器を上回っている。
- 参考スコア(独自算出の注目度): 6.79236957488334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Although lane detection methods have shown impressive performance in
real-world scenarios, most of methods require post-processing which is not
robust enough. Therefore, end-to-end detectors like DEtection TRansformer(DETR)
have been introduced in lane detection.However, one-to-one label assignment in
DETR can degrade the training efficiency due to label semantic conflicts.
Besides, positional query in DETR is unable to provide explicit positional
prior, making it difficult to be optimized. In this paper, we present the
One-to-Several Transformer(O2SFormer). We first propose the one-to-several
label assignment, which combines one-to-many and one-to-one label assignment to
solve label semantic conflicts while keeping end-to-end detection. To overcome
the difficulty in optimizing one-to-one assignment. We further propose the
layer-wise soft label which dynamically adjusts the positive weight of positive
lane anchors in different decoder layers. Finally, we design the dynamic
anchor-based positional query to explore positional prior by incorporating lane
anchors into positional query. Experimental results show that O2SFormer with
ResNet50 backbone achieves 77.83% F1 score on CULane dataset, outperforming
existing Transformer-based and CNN-based detectors. Futhermore, O2SFormer
converges 12.5x faster than DETR for the ResNet18 backbone.
- Abstract(参考訳): レーン検出手法は実世界のシナリオで印象的な性能を示したが、ほとんどの方法は十分に堅牢ではない後処理を必要とする。
したがって、車線検出にはDetection TRansformer(DETR)のようなエンドツーエンド検出器が導入されたが、DTRにおける1対1のラベル割り当ては、ラベルセマンティックコンフリクトによるトレーニング効率の低下を招いている。
さらに、detrにおける位置クエリは明示的な位置優先を提供することができないため、最適化が難しい。
本稿では,1-to-Several Transformer(O2SFormer)を提案する。
まず,1対1のラベル代入と1対1のラベル代入を組み合わせた1対1のラベル代入を提案する。
1対1の割り当てを最適化する難しさを克服する。
さらに,異なるデコーダ層において正のレーンアンカーの正の重みを動的に調整する層別ソフトラベルを提案する。
最後に,動的アンカーに基づく位置問合せの設計を行い,位置問合せにレーンアンカーを組み込むことにより位置先行を探索する。
実験の結果、resnet50 backboneのo2sformerはculaneデータセットで77.83%のf1スコアを獲得し、既存のtransformerベースおよびcnnベースの検出器よりも優れていた。
さらにO2SFormerはResNet18バックボーンのDETRよりも12.5倍高速に収束する。
関連論文リスト
- Salience DETR: Enhancing Detection Transformer with Hierarchical Salience Filtering Refinement [19.277560848076984]
2段階の選択戦略は、選択したクエリとオブジェクトのミスマッチによるスケールバイアスと冗長性をもたらす。
本稿では,フィルタされた識別クエリのみにトランスフォーマーを符号化する階層型サリエンスフィルタリング精細化を提案する。
提案されたSalience DETRは、課題固有の3つのデータセットに対して、+4.0% AP、+0.2% AP、+4.4% APを大幅に改善する。
論文 参考訳(メタデータ) (2024-03-24T13:01:57Z) - ASAG: Building Strong One-Decoder-Layer Sparse Detectors via Adaptive
Sparse Anchor Generation [50.01244854344167]
適応スパースアンカージェネレータ(ASAG)の提案により、スパース検出器と密度検出器のパフォーマンスギャップを橋渡しする。
ASAGは、グリッドではなくパッチの動的なアンカーを予測することで、機能競合の問題を軽減する。
提案手法は高密度な手法より優れ,高速かつ高精度なトレードオフを実現する。
論文 参考訳(メタデータ) (2023-08-18T02:06:49Z) - Semi-DETR: Semi-Supervised Object Detection with Detection Transformers [105.45018934087076]
半教師付き物体検出(SSOD)におけるDETRに基づくフレームワークの解析
本報告では,第1次変圧器を用いたエンド・ツー・エンド半教師対象検出器であるSemi-DETRについて述べる。
我々の手法は、最先端の手法をクリアマージンで上回る。
論文 参考訳(メタデータ) (2023-07-16T16:32:14Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - Bridging the Gap Between End-to-end and Non-End-to-end Multi-Object
Tracking [27.74953961900086]
既存のエンドツーエンドのマルチオブジェクト追跡(e2e-MOT)手法は、非エンドツーエンドのトラッキング・バイ・検出手法を超えていない。
本稿では,e2e-MOT をシャドウ概念を用いた新しいラベル割り当てにより,簡便かつ効果的な方法である Co-MOT を提案する。
論文 参考訳(メタデータ) (2023-05-22T05:18:34Z) - StageInteractor: Query-based Object Detector with Cross-stage
Interaction [21.84964476813102]
そこで本稿では,StageInteractorと呼ばれる,複数段階間相互作用を持つ新しいクエリベースのオブジェクト検出器を提案する。
我々のモデルはベースラインを2.2 AP改善し、ResNet-50をバックボーンとして44.8 APを達成した。
トレーニング時間と300クエリにより、StageInteractorは51.1 APと52.2 APをそれぞれResNeXt-101-DCNとSwin-Sで達成している。
論文 参考訳(メタデータ) (2023-04-11T04:50:13Z) - Detection Transformer with Stable Matching [48.963171068785435]
もっとも重要な設計は, 肯定的な事例の分類スコアを監督するために, 位置測定値のみを使用することである。
本原理では,DTRの分類損失とマッチングコストに位置測定値を統合することで,簡易かつ効果的な2つの修正を提案する。
12エポックおよび24エポックのトレーニング設定の下でResNet-50バックボーンを用いてCOCO検出ベンチマークで50.4および51.5APを達成する。
論文 参考訳(メタデータ) (2023-04-10T17:55:37Z) - Cross-domain Speech Recognition with Unsupervised Character-level
Distribution Matching [60.8427677151492]
2つの領域における各文字間の微粒化適応を行うための文字レベルの分布マッチング手法であるCMatchを提案する。
Libri-Adaptデータセットを用いた実験の結果,提案手法はクロスデバイスとクロス環境の両方で14.39%,16.50%の単語誤り率(WER)を低減できることがわかった。
論文 参考訳(メタデータ) (2021-04-15T14:36:54Z) - End-to-End Object Detection with Transformers [88.06357745922716]
本稿では,オブジェクト検出を直接セット予測問題とみなす新しい手法を提案する。
我々のアプローチは検出パイプラインを合理化し、手作業で設計された多くのコンポーネントの必要性を効果的に除去する。
この新しいフレームワークの主な構成要素は、Detection TRansformerまたはDETRと呼ばれ、セットベースのグローバルな損失である。
論文 参考訳(メタデータ) (2020-05-26T17:06:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。