論文の概要: Line Segment Detection Using Transformers without Edges
- arxiv url: http://arxiv.org/abs/2101.01909v1
- Date: Wed, 6 Jan 2021 08:00:18 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-11 00:08:15.834113
- Title: Line Segment Detection Using Transformers without Edges
- Title(参考訳): エッジなし変圧器を用いた線分検出
- Authors: Yifan Xu, Weijian Xu, David Cheung and Zhuowen Tu
- Abstract要約: 提案手法はLinE segment TRansformers (LETR) と呼ばれ,本領域の3つの問題に対処する。
Wireframe と YorkUrban のベンチマークで最新の結果を示す。
- 参考スコア(独自算出の注目度): 22.834316796018705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we present a holistically end-to-end algorithm for line
segment detection with transformers that is post-processing and
heuristics-guided intermediate processing (edge/junction/region detection)
free. Our method, named LinE segment TRansformers (LETR), tackles the three
main problems in this domain, namely edge element detection, perceptual
grouping, and holistic inference by three highlights in detection transformers
(DETR) including tokenized queries with integrated encoding and decoding,
self-attention, and joint queries respectively. The transformers learn to
progressively refine line segments through layers of self-attention mechanism
skipping the heuristic design in the previous line segmentation algorithms. We
equip multi-scale encoder/decoder in the transformers to perform fine-grained
line segment detection under a direct end-point distance loss that is
particularly suitable for entities such as line segments that are not
conveniently represented by bounding boxes. In the experiments, we show
state-of-the-art results on Wireframe and YorkUrban benchmarks. LETR points to
a promising direction for joint end-to-end detection of general entities beyond
the standard object bounding box representation.
- Abstract(参考訳): 本稿では,ポストプロセッシングおよびヒューリスティックスガイド付き中間処理(エッジ/接合/領域検出)を含まないトランスフォーマを用いた線分検出法を提案する。
本手法では, エッジ要素検出, 知覚的グルーピング, 総括的推論という3つの問題に対して, エンコードとデコードを統合したトークン化クエリ, セルフアテンション, ジョイントクエリを含む, 検出トランスフォーマ (detr) の3つのハイライトにより対処する。
トランスフォーマは、前列セグメンテーションアルゴリズムのヒューリスティック設計をスキップする自己着脱機構の層を通して、漸進的にラインセグメントを洗練することを学ぶ。
トランスフォーマにマルチスケールエンコーダ/デコーダを装備し、境界ボックスに都合よく表現されない線分などのエンティティに特に適する、直接端点距離損失下で細粒度ラインセグメント検出を行う。
実験では、Wireframe と YorkUrban のベンチマークで最先端の結果を示す。
LETRは、標準オブジェクト境界ボックス表現を超えて汎用エンティティをエンドツーエンドで検出するための有望な方向を指している。
関連論文リスト
- SegVG: Transferring Object Bounding Box to Segmentation for Visual Grounding [56.079013202051094]
ボックスレベルのアノテーションを信号として転送する新しい手法であるSegVGを提案する。
このアプローチでは,ボックスレベルのレグレッションとピクセルレベルのセグメンテーションの両方の信号としてアノテーションを反復的に利用することができる。
論文 参考訳(メタデータ) (2024-07-03T15:30:45Z) - SegT: A Novel Separated Edge-guidance Transformer Network for Polyp
Segmentation [10.144870911523622]
本稿では, 効率的なポリープ分割モデルを構築することを目的とした, エッジ誘導変換器 (SegT) ネットワークを提案する。
既存のCNNベースのアプローチよりも堅牢な表現を学習するトランスフォーマーエンコーダが特に適用された。
SegTの有効性を評価するために、5つの挑戦的な公開データセットを用いて実験を行った。
論文 参考訳(メタデータ) (2023-06-19T08:32:05Z) - Cross-domain Detection Transformer based on Spatial-aware and
Semantic-aware Token Alignment [31.759205815348658]
クロスドメイン検出変換器のための空間認識および意味認識トークンアライメント(SSTA)と呼ばれる新しい手法を提案する。
空間認識型トークンアライメントでは、クロスアテンションマップ(CAM)から情報を抽出して、トークンの分布をオブジェクトクエリへの注目に応じて調整することができる。
意味認識型トークンアライメントでは、カテゴリ情報をクロスアテンションマップに注入し、ドメイン埋め込みを構築し、マルチクラスの識別器の学習をガイドする。
論文 参考訳(メタデータ) (2022-06-01T04:13:22Z) - EDTER: Edge Detection with Transformer [71.83960813880843]
本研究では,新しいトランスを用いたエッジ検出器であるemphEdge Detection TransformER (EDTER)を提案し,透明でクリップなオブジェクト境界と有意義なエッジを抽出する。
EDTERは画像コンテキスト情報と詳細なローカルキューを同時に利用する。
BSDS500、NYUDv2、Multicueの実験は、最先端技術と比較してEDTERの優位性を実証している。
論文 参考訳(メタデータ) (2022-03-16T11:55:55Z) - Temporal Perceiver: A General Architecture for Arbitrary Boundary
Detection [48.33132632418303]
ジェネリック境界検出(GBD)は、動画をセマンティック・コヒーレントと分類なしの単位に分割する一般的な境界を特定することを目的としている。
従来の研究では、単純なCNNからLSTMまでの複雑なディープネットワークの設計で、これらの異なるレベルの汎用境界を別々に扱っていた。
本稿では,Transformer を用いた汎用アーキテクチャである Temporal Perceiver について述べる。
論文 参考訳(メタデータ) (2022-03-01T09:31:30Z) - TraSeTR: Track-to-Segment Transformer with Contrastive Query for
Instance-level Instrument Segmentation in Robotic Surgery [60.439434751619736]
そこで我々は,TraSeTRを提案する。TraSeTR,TraSeTR,Trace-to-Segment Transformerは,手術器具のセグメンテーションを支援する。
TraSeTRは、機器の種類、位置、アイデンティティとインスタンスレベルの予測を共同で理由付けている。
提案手法の有効性を,3つの公開データセットに対して,最先端の計器型セグメンテーション結果を用いて実証した。
論文 参考訳(メタデータ) (2022-02-17T05:52:18Z) - ELSD: Efficient Line Segment Detector and Descriptor [9.64386089593887]
本稿では,ラインセグメントを同時に検出し,画像中のデクリプタを抽出する,ELSD(Efficient Line Segment Detector and Descriptor)を提案する。
ELSDはSLAMや画像マッチングなどの高レベルのタスクに不可欠なライン機能を提供します。
実験では,提案したELSDは,Wireframeデータセットと YorkUrbanデータセット上での最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-29T08:53:03Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Deep Hough Transform for Semantic Line Detection [70.28969017874587]
自然の場面で意味のある線構造、つまり意味的な線を検知する基本的なタスクに焦点をあてる。
従来の手法は線の性質を無視し、準最適性能をもたらす。
行検出のためのワンショットエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-10T13:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。