論文の概要: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency
- arxiv url: http://arxiv.org/abs/2006.00842v1
- Date: Mon, 1 Jun 2020 10:34:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 07:14:50.811206
- Title: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency
- Title(参考訳): LFTag: 低空間周波数でスケーラブルなビジュアルフィデューシャルシステム
- Authors: Ben Wang
- Abstract要約: 本稿では、トポロジカル検出と相対位置データエンコーディングに基づく視覚情報システムを提案する。
The proposed fiducial system (LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。
LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍となる。
- 参考スコア(独自算出の注目度): 4.86339076408649
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual fiducial systems are a key component of many robotics and AR/VR
applications for 6-DOF monocular relative pose estimation and target
identification. This paper presents LFTag, a visual fiducial system based on
topological detection and relative position data encoding which optimizes data
density within spatial frequency constraints. The marker is constructed to
resolve rotational ambiguity, which combined with the robust geometric and
topological false positive rejection, allows all marker bits to be used for
data.
When compared to existing state-of-the-art square binary markers (AprilTag)
and topological markers (TopoTag) in simulation, the proposed fiducial system
(LFTag) offers significant advances in dictionary size and range. LFTag 3x3
achieves 546 times the dictionary size of AprilTag 25h9 and LFTag 4x4 achieves
126 thousand times the dictionary size of AprilTag 41h12 while simultaneously
achieving longer detection range. LFTag 3x3 also achieves more than twice the
detection range of TopoTag 4x4 at the same dictionary size.
- Abstract(参考訳): 視覚画像システムは多くのロボティクスの重要なコンポーネントであり、6-DOF単眼の相対的なポーズ推定とターゲット同定のためのAR/VRアプリケーションである。
本稿では,空間周波数制約内のデータ密度を最適化するトポロジカル検出と相対位置データ符号化に基づく視覚情報処理システム LFTag を提案する。
このマーカーは、ロバストな幾何学的およびトポロジカルな偽陽性の拒絶と組み合わせて、すべてのマーカービットをデータとして使用できる回転曖昧性を解決するために構築されている。
従来の四角形マーカー( AprilTag)とトポロジカルマーカー( TopoTag)をシミュレーションで比較した場合,提案するフィデューシャルシステム( LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。
LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍、同時に長い検出範囲を達成している。
LFTag 3x3は、同じ辞書サイズでTopoTag 4x4の検出範囲を2倍以上にする。
関連論文リスト
- Semi-supervised segmentation of land cover images using nonlinear
canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。
本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。
提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文 参考訳(メタデータ) (2024-01-22T17:56:07Z) - SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation [91.91385816767057]
オープンボキャブラリセマンティックセグメンテーションは、ピクセルをオープンなカテゴリの集合から異なるセマンティックグループに区別する試みである。
オープン語彙セマンティックセグメンテーションのための単純なエンコーダデコーダSEDを提案する。
SED法では、ADE20KではmIoUスコアが31.6%、A6000では画像あたり82ミリ秒(ms$)のカテゴリが150である。
論文 参考訳(メタデータ) (2023-11-27T05:00:38Z) - Triple-View Knowledge Distillation for Semi-Supervised Semantic
Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。
このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文 参考訳(メタデータ) (2023-09-22T01:02:21Z) - V-DETR: DETR with Vertex Relative Position Encoding for 3D Object
Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。
限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。
挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文 参考訳(メタデータ) (2023-08-08T17:14:14Z) - TRACER: Extreme Attention Guided Salient Object Tracing Network [3.2434811678562676]
本稿では,注意誘導型トレーシングモジュールを組み込んで,鮮明なエッジで有意な物体を検出するTRACERを提案する。
13の既存手法との比較により、TRACERは5つのベンチマークデータセットで最先端のパフォーマンスを達成することが明らかになった。
論文 参考訳(メタデータ) (2021-12-14T13:20:07Z) - DeepTag: A General Framework for Fiducial Marker Design and Detection [1.2180122937388957]
フィデューシャルマーカーの設計と検出のための一般的なディープラーニングベースのフレームワークであるDeepTagを提案する。
DeepTagは、さまざまなマーカーファミリの検出をサポートし、カスタマイズされたローカルパターンで新しいマーカーファミリを設計できるようにする。
実験によると、DeepTagはさまざまなマーカーファミリをうまくサポートしており、検出の堅牢性と精度の両方の観点から既存の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-05-28T10:54:59Z) - 3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。
We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文 参考訳(メタデータ) (2021-05-13T17:58:07Z) - Supervision by Registration and Triangulation for Landmark Detection [70.13440728689231]
本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
論文 参考訳(メタデータ) (2021-01-25T02:48:21Z) - Graph Regularized Autoencoder and its Application in Unsupervised
Anomaly Detection [42.86693635734333]
本稿では,最小スパンニングツリー(MST)を用いて局所的な近傍構造を近似し,データ点間の構造保存距離を生成することを提案する。
我々は,20個のベンチマーク異常検出データセットに対して,多種多様な代替手法より優れた新しいグラフ正規化オートエンコーダを開発した。
論文 参考訳(メタデータ) (2020-10-29T21:17:41Z) - Learning Spatio-Appearance Memory Network for High-Performance Visual
Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。
本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-09-21T08:12:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。