論文の概要: DT-LSD: Deformable Transformer-based Line Segment Detection
- arxiv url: http://arxiv.org/abs/2411.13005v1
- Date: Wed, 20 Nov 2024 03:02:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-21 16:12:19.114505
- Title: DT-LSD: Deformable Transformer-based Line Segment Detection
- Title(参考訳): DT-LSD:変形可能な変圧器を用いた線分検出
- Authors: Sebastian Janampa, Marios Pattichis,
- Abstract要約: そこで我々は,Deformable Transformer-based Line Segment Detector (DT-LSD)を導入した。
DT-LSDは従来の変換器ベースモデル(LETR)よりも高速で精度が高く,CNNベースモデルよりも精度が高いことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Line segment detection is a fundamental low-level task in computer vision, and improvements in this task can impact more advanced methods that depend on it. Most new methods developed for line segment detection are based on Convolutional Neural Networks (CNNs). Our paper seeks to address challenges that prevent the wider adoption of transformer-based methods for line segment detection. More specifically, we introduce a new model called Deformable Transformer-based Line Segment Detection (DT-LSD) that supports cross-scale interactions and can be trained quickly. This work proposes a novel Deformable Transformer-based Line Segment Detector (DT-LSD) that addresses LETR's drawbacks. For faster training, we introduce Line Contrastive DeNoising (LCDN), a technique that stabilizes the one-to-one matching process and speeds up training by 34$\times$. We show that DT-LSD is faster and more accurate than its predecessor transformer-based model (LETR) and outperforms all CNN-based models in terms of accuracy. In the Wireframe dataset, DT-LSD achieves 71.7 for $sAP^{10}$ and 73.9 for $sAP^{15}$; while 33.2 for $sAP^{10}$ and 35.1 for $sAP^{15}$ in the YorkUrban dataset.
- Abstract(参考訳): ラインセグメント検出はコンピュータビジョンにおける基本的な低レベルタスクであり、このタスクの改善はそれに依存するより高度なメソッドに影響を与える可能性がある。
線分検出のために開発されたほとんどの新しい手法は、畳み込みニューラルネットワーク(CNN)に基づいている。
本稿では,線分検出のための変圧器を用いた手法の広範化を未然に防ぐための課題について検討する。
具体的には、Deformable Transformer-based Line Segment Detection (DT-LSD)と呼ばれる新しいモデルを導入する。
本研究は、LETRの欠点に対処する、変形可能なトランスフォーマーベースラインセグメント検出器(DT-LSD)を提案する。
1対1のマッチングプロセスを安定化し,34$\times$のトレーニングを高速化する技術であるLine Contrastive DeNoising(LCDN)を導入する。
DT-LSDは従来の変換器ベースモデル(LETR)よりも高速で精度が高く,CNNベースモデルよりも精度が高いことを示す。
Wireframeデータセットでは、DT-LSDは$sAP^{10}$で71.7、$sAP^{15}$で73.9、$sAP^{10}$で33.2、$sAP^{15}$で35.1となる。
関連論文リスト
- Pretrained transformer efficiently learns low-dimensional target functions in-context [40.77319247558742]
勾配降下により最適化された非線形変換器は、ターゲット関数の分布の次元にのみ依存するプロンプト長を持つ、$f_*$ in-contextを学習する。
本結果は,事前学習した変換器の関数クラスの低次元構造への適応性を強調し,サンプル効率の良いICLを実現する。
論文 参考訳(メタデータ) (2024-11-04T19:24:39Z) - Reinforcement Learning Gradients as Vitamin for Online Finetuning Decision Transformers [111.78179839856293]
オフライン強化学習(RL)のための魅力的なパラダイムとして、決定変換器が登場している。
オンラインの意思決定の微調整は驚くほど過小評価されている。
ODTの微調整プロセスにTD3勾配を加えるだけで、ODTのオンライン微調整性能が向上することがわかった。
論文 参考訳(メタデータ) (2024-10-31T16:38:51Z) - DeepLSD: Line Segment Detection and Refinement with Deep Image Gradients [105.25109274550607]
ラインセグメントは、視覚タスクでますます使われています。
画像勾配に基づく従来の線検出器は非常に高速で精度が高いが、ノイズの多い画像や困難な条件では頑丈さに欠ける。
我々は、両方の世界を最大限に活用するために、伝統的なアプローチと学習されたアプローチを組み合わせることを提案する。
論文 参考訳(メタデータ) (2022-12-15T12:36:49Z) - Multidimensional analysis using sensor arrays with deep learning for
high-precision and high-accuracy diagnosis [0.0]
本研究では,DNN(Deep Neural Network)を低コストで高精度なセンサアレイのデータに入力することにより,測定精度と精度を大幅に向上させることが実証された。
データ収集は、32個の温度センサーで構成され、16個のアナログと16個のデジタルセンサーで構成されている。
論文 参考訳(メタデータ) (2022-11-30T16:14:55Z) - LSDNet: Trainable Modification of LSD Algorithm for Real-Time Line
Segment Detection [0.0]
我々は、軽量CNNを古典的なLCD検出器に組み込むことで、正確かつ高速なCNNベースの検出器であるLSDNetを構築した。
標準的なWireframeデータセット上のいくつかの現代の線分検出器と比較して、LSDNetは競争精度78 Fhの214 FPSの最高速度(CNNベースの検出器)を提供する。
論文 参考訳(メタデータ) (2022-09-10T11:46:21Z) - Efficient Decoder-free Object Detection with Transformers [75.00499377197475]
視覚変換器(ViT)は、物体検出アプローチのランドスケープを変化させている。
本稿では,デコーダフリー完全トランス(DFFT)オブジェクト検出器を提案する。
DFFT_SMALLは、トレーニングおよび推論段階で高い効率を達成する。
論文 参考訳(メタデータ) (2022-06-14T13:22:19Z) - Self-Supervised Pre-Training for Transformer-Based Person
Re-Identification [54.55281692768765]
トランスフォーマーに基づく教師付き事前訓練は、人物再識別(ReID)において大きなパフォーマンスを達成する
ImageNetとReIDデータセットのドメインギャップのため、通常、パフォーマンスを高めるために、より大きなトレーニング済みデータセットが必要です。
この研究は、データとモデル構造の観点から、事前トレーニングデータセットとReIDデータセットのギャップを軽減することを目的としている。
論文 参考訳(メタデータ) (2021-11-23T18:59:08Z) - Towards Real-time and Light-weight Line Segment Detection [15.834865037833875]
そこで本稿では,Mobile LSD という資源制約環境に対するリアルタイムかつ軽量な線分検出手法を提案する。
線形セグメント増分と幾何学的学習スキームのセグメンテーションという,新しいトレーニングスキームを提案する。
我々のモデル(M-LSD-tiny)は、GPUにおけるモデルサイズ2.5%、推論速度130.5%の競争性能を達成する。
論文 参考訳(メタデータ) (2021-06-01T02:28:08Z) - TP-LSD: Tri-Points Based Line Segment Detector [31.722196464420144]
本稿では,画像中の線分をリアルタイムに検出する新しい深部畳み込みモデルであるTri-Points Based Line Segment Detector (TP-LSD)を提案する。
より高速でコンパクトなモデルで一段階検出を実現するために,三点表現を導入する。
TP-LSDは三点抽出枝と線分枝の2つの枝を持つ。
論文 参考訳(メタデータ) (2020-09-11T16:08:12Z) - Deep learning for gravitational-wave data analysis: A resampling
white-box approach [62.997667081978825]
我々は、LIGO検出器からの単一干渉計データを用いて、畳み込みニューラルネットワーク(CNN)を用いて、コンパクトなバイナリコレッセンスにおける重力波(GW)信号を検出する。
CNNはノイズを検出するのに非常に正確だが、GW信号のリコールに十分な感度がないため、CNNはGWトリガの生成よりもノイズ低減に適している。
論文 参考訳(メタデータ) (2020-09-09T03:28:57Z) - Holistically-Attracted Wireframe Parsing [123.58263152571952]
本稿では,入力画像中のベクトル化ワイヤフレームを1つのフォワードパスで検出する高速で類似的な解析手法を提案する。
提案手法は, (i) ラインセグメントとジャンクション提案生成, (ii) ラインセグメントとジャンクションマッチング, (iii) ラインセグメントとジャンクション検証の3つのコンポーネントから構成される。
論文 参考訳(メタデータ) (2020-03-03T17:43:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。