論文の概要: Line as a Visual Sentence: Context-aware Line Descriptor for Visual
Localization
- arxiv url: http://arxiv.org/abs/2109.04753v1
- Date: Fri, 10 Sep 2021 09:35:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-13 20:35:40.195976
- Title: Line as a Visual Sentence: Context-aware Line Descriptor for Visual
Localization
- Title(参考訳): 視覚的文としての行:視覚的ローカライゼーションのためのコンテキスト対応行記述子
- Authors: Sungho Yoon, Ayoung Kim
- Abstract要約: 可変線を扱うLine-Transformerを導入する。
自然言語処理(NLP)にインスパイアされた私たちは、行セグメントをポイント(単語)を含む文として見る。
また,回線の幾何学的属性を近傍に共有するラインシグネチャネットワークを提案する。
- 参考スコア(独自算出の注目度): 12.142794401321778
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Along with feature points for image matching, line features provide
additional constraints to solve visual geometric problems in robotics and
computer vision (CV). Although recent convolutional neural network (CNN)-based
line descriptors are promising for viewpoint changes or dynamic environments,
we claim that the CNN architecture has innate disadvantages to abstract
variable line length into the fixed-dimensional descriptor. In this paper, we
effectively introduce Line-Transformers dealing with variable lines. Inspired
by natural language processing (NLP) tasks where sentences can be understood
and abstracted well in neural nets, we view a line segment as a sentence that
contains points (words). By attending to well-describable points on aline
dynamically, our descriptor performs excellently on variable line length. We
also propose line signature networks sharing the line's geometric attributes to
neighborhoods. Performing as group descriptors, the networks enhance line
descriptors by understanding lines' relative geometries. Finally, we present
the proposed line descriptor and matching in a Point and Line Localization
(PL-Loc). We show that the visual localization with feature points can be
improved using our line features. We validate the proposed method for
homography estimation and visual localization.
- Abstract(参考訳): 画像マッチングのための特徴点に加えて、ライン機能はロボット工学とコンピュータビジョン(CV)における視覚幾何学的問題を解決するための追加の制約を提供する。
最近の畳み込みニューラルネットワーク(CNN)ベースの線形記述子は、視点変化や動的環境に対して有望であるが、CNNアーキテクチャは、固定次元記述子への抽象的な可変線長に固有の欠点があると主張する。
本稿では,可変線を扱う線形変換器を効果的に導入する。
自然言語処理(NLP)タスクにインスパイアされた文は、ニューラルネットワークでよく理解され、抽象化されるので、行セグメントをポイント(単語)を含む文とみなす。
動的に線上の well-decribable point に順応することで, 可変線長を良好に記述する。
また,回線の幾何学的属性を近傍に共有するラインシグネチャネットワークを提案する。
グループディスクリプタとして実行され、ネットワークはラインの相対的ジオメトリを理解することによってラインディスクリプタを強化する。
最後に、提案した行記述子とマッチングを、PL-Loc(Point and Line Localization)に提示する。
特徴点を用いた視覚的ローカライゼーションは,ライン機能を用いて改善できることを示す。
提案するホモグラフィ推定法と視覚定位法を検証した。
関連論文リスト
- LDL: Line Distance Functions for Panoramic Localization [22.46846444866008]
線分を用いた3次元地図にパノラマをローカライズするアルゴリズム LDL を導入する。
提案手法は,パノラマ画像と3次元地図内のラインの全体分布を効果的に観察する。
論文 参考訳(メタデータ) (2023-08-27T02:57:07Z) - IDLS: Inverse Depth Line based Visual-Inertial SLAM [9.38589798999922]
Inverse Depth Line SLAM (IDLS) を提案する。
IDLSは、複数の知覚的整合性データセットで広く評価されている。
論文 参考訳(メタデータ) (2023-04-23T20:53:05Z) - 3D Line Mapping Revisited [86.13455066577657]
LIMAPは、3Dラインマッピングのためのライブラリで、多視点画像から3Dラインマップを堅牢かつ効率的に作成する。
私たちのコードは、既存のポイントベースのStructure-from-Motionメソッドとシームレスに統合されます。
私たちの堅牢な3Dラインマップは、新たな研究方向も開きます。
論文 参考訳(メタデータ) (2023-03-30T16:14:48Z) - Learning Smooth Neural Functions via Lipschitz Regularization [92.42667575719048]
ニューラルフィールドにおけるスムーズな潜伏空間を促進するために設計された新しい正規化を導入する。
従来のリプシッツ正規化ネットワークと比較して、我々のアルゴリズムは高速で、4行のコードで実装できる。
論文 参考訳(メタデータ) (2022-02-16T21:24:54Z) - Polygonal Point Set Tracking [50.445151155209246]
本稿では,学習に基づく多角形点集合追跡手法を提案する。
私たちのゴールは、ターゲットの輪郭上の対応する点を追跡することです。
本稿では,部分歪みとテキストマッピングに対する本手法の視覚効果について述べる。
論文 参考訳(メタデータ) (2021-05-30T17:12:36Z) - SOLD2: Self-supervised Occlusion-aware Line Description and Detection [95.8719432775724]
単一深層ネットワークにおける回線セグメントの最初の共同検出と記述について紹介します。
我々の手法は注釈付き行ラベルを必要としないため、任意のデータセットに一般化することができる。
複数のマルチビューデータセットにおいて,従来の行検出と記述方法に対するアプローチを評価した。
論文 参考訳(メタデータ) (2021-04-07T19:27:17Z) - Towards Efficient Scene Understanding via Squeeze Reasoning [71.1139549949694]
我々はSqueeze Reasoningと呼ばれる新しいフレームワークを提案する。
空間地図上の情報を伝播するのではなく、まず入力特徴をチャネルワイドなグローバルベクトルに絞ることを学ぶ。
提案手法はエンドツーエンドのトレーニングブロックとしてモジュール化可能であり,既存のネットワークに簡単に接続可能であることを示す。
論文 参考訳(メタデータ) (2020-11-06T12:17:01Z) - LCD -- Line Clustering and Description for Place Recognition [29.053923938306323]
本稿では,RGB-Dカメラとラインクラスタを視覚的および幾何学的特徴として利用し,位置認識のための新しい学習ベースのアプローチを提案する。
本稿では,フレームワイド線クラスタリングのアテンション機構に基づくニューラルネットワークアーキテクチャを提案する。
同様のニューラルネットワークは、128個の浮動小数点数のコンパクトな埋め込みによるこれらのクラスタの記述に使用される。
論文 参考訳(メタデータ) (2020-10-21T09:52:47Z) - Deep Hough Transform for Semantic Line Detection [70.28969017874587]
自然の場面で意味のある線構造、つまり意味的な線を検知する基本的なタスクに焦点をあてる。
従来の手法は線の性質を無視し、準最適性能をもたらす。
行検出のためのワンショットエンドツーエンド学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-03-10T13:08:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。