論文の概要: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency
- arxiv url: http://arxiv.org/abs/2006.00842v1
- Date: Mon, 1 Jun 2020 10:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:14:50.811206
- Title: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency
- Title(参考訳): LFTag: 低空間周波数でスケーラブルなビジュアルフィデューシャルシステム
- Authors: Ben Wang
- Abstract要約: 本稿では、トポロジカル検出と相対位置データエンコーディングに基づく視覚情報システムを提案する。
The proposed fiducial system (LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。
LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍となる。
- 参考スコア(独自算出の注目度): 4.86339076408649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual fiducial systems are a key component of many robotics and AR/VR
applications for 6-DOF monocular relative pose estimation and target
identification. This paper presents LFTag, a visual fiducial system based on
topological detection and relative position data encoding which optimizes data
density within spatial frequency constraints. The marker is constructed to
resolve rotational ambiguity, which combined with the robust geometric and
topological false positive rejection, allows all marker bits to be used for
data.
When compared to existing state-of-the-art square binary markers (AprilTag)
and topological markers (TopoTag) in simulation, the proposed fiducial system
(LFTag) offers significant advances in dictionary size and range. LFTag 3x3
achieves 546 times the dictionary size of AprilTag 25h9 and LFTag 4x4 achieves
126 thousand times the dictionary size of AprilTag 41h12 while simultaneously
achieving longer detection range. LFTag 3x3 also achieves more than twice the
detection range of TopoTag 4x4 at the same dictionary size.
- Abstract(参考訳): 視覚画像システムは多くのロボティクスの重要なコンポーネントであり、6-DOF単眼の相対的なポーズ推定とターゲット同定のためのAR/VRアプリケーションである。
本稿では,空間周波数制約内のデータ密度を最適化するトポロジカル検出と相対位置データ符号化に基づく視覚情報処理システム LFTag を提案する。
このマーカーは、ロバストな幾何学的およびトポロジカルな偽陽性の拒絶と組み合わせて、すべてのマーカービットをデータとして使用できる回転曖昧性を解決するために構築されている。
従来の四角形マーカー( AprilTag)とトポロジカルマーカー( TopoTag)をシミュレーションで比較した場合,提案するフィデューシャルシステム( LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。
LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍、同時に長い検出範囲を達成している。
LFTag 3x3は、同じ辞書サイズでTopoTag 4x4の検出範囲を2倍以上にする。
関連論文リスト
- Online Pseudo-Label Unified Object Detection for Multiple Datasets Training [0.0]
オンライン擬似ラベル統一オブジェクト検出方式を提案する。
本手法では,周期的に更新された教師モデルを用いて,各サブデータセット内の未ラベルオブジェクトの擬似ラベルを生成する。
また,地域提案ネットワーク(PRN)のリコール率を改善するために,カテゴリ別ボックス回帰と擬似ラベルRPNヘッドを提案する。
論文 参考訳(メタデータ) (2024-10-21T01:23:42Z) - OVA-DETR: Open Vocabulary Aerial Object Detection Using Image-Text Alignment and Fusion [16.784704103995672]
航空画像のための高速開語彙検出器OVA-DETRを提案する。
画像テキストアライメントの考え方に基づいて、カテゴリ回帰損失を置き換えるために、領域テキストコントラスト損失を提案する。
Bi-VLFにはデュアルアテンションフュージョンエンコーダとマルチレベルテキスト誘導フュージョンデコーダが含まれる。
論文 参考訳(メタデータ) (2024-08-22T09:33:25Z) - Semi-supervised segmentation of land cover images using nonlinear
canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。
本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。
提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文 参考訳(メタデータ) (2024-01-22T17:56:07Z) - SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation [91.91385816767057]
オープンボキャブラリセマンティックセグメンテーションは、ピクセルをオープンなカテゴリの集合から異なるセマンティックグループに区別する試みである。
オープン語彙セマンティックセグメンテーションのための単純なエンコーダデコーダSEDを提案する。
SED法では、ADE20KではmIoUスコアが31.6%、A6000では画像あたり82ミリ秒(ms$)のカテゴリが150である。
論文 参考訳(メタデータ) (2023-11-27T05:00:38Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - Fiducial Tag Localization on a 3D LiDAR Prior Map [0.6554326244334868]
既存のLiDARフィデューシャルタグローカライズ法は3次元LiDARマップには適用されない。
我々は, 3次元LiDAR事前マップ上で, 画像タグを直接ローカライズする新しい手法を開発した。
我々は,3次元LiDARマップ上のタグのローカライズに適用可能な手法として,定性的かつ定量的な実験を行った。
論文 参考訳(メタデータ) (2022-09-02T14:07:25Z) - DeepTag: A General Framework for Fiducial Marker Design and Detection [1.2180122937388957]
フィデューシャルマーカーの設計と検出のための一般的なディープラーニングベースのフレームワークであるDeepTagを提案する。
DeepTagは、さまざまなマーカーファミリの検出をサポートし、カスタマイズされたローカルパターンで新しいマーカーファミリを設計できるようにする。
実験によると、DeepTagはさまざまなマーカーファミリをうまくサポートしており、検出の堅牢性と精度の両方の観点から既存の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-05-28T10:54:59Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - Supervision by Registration and Triangulation for Landmark Detection [70.13440728689231]
本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
論文 参考訳(メタデータ) (2021-01-25T02:48:21Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。