Fugu-MT 論文翻訳(概要): LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency

論文の概要: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency

arxiv url: http://arxiv.org/abs/2006.00842v1
Date: Mon, 1 Jun 2020 10:34:34 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-26 07:14:50.811206
Title: LFTag: A Scalable Visual Fiducial System with Low Spatial Frequency
Title（参考訳）: LFTag: 低空間周波数でスケーラブルなビジュアルフィデューシャルシステム
Authors: Ben Wang
Abstract要約: 本稿では、トポロジカル検出と相対位置データエンコーディングに基づく視覚情報システムを提案する。 The proposed fiducial system (LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。 LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍となる。
参考スコア（独自算出の注目度）: 4.86339076408649
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Visual fiducial systems are a key component of many robotics and AR/VR applications for 6-DOF monocular relative pose estimation and target identification. This paper presents LFTag, a visual fiducial system based on topological detection and relative position data encoding which optimizes data density within spatial frequency constraints. The marker is constructed to resolve rotational ambiguity, which combined with the robust geometric and topological false positive rejection, allows all marker bits to be used for data. When compared to existing state-of-the-art square binary markers (AprilTag) and topological markers (TopoTag) in simulation, the proposed fiducial system (LFTag) offers significant advances in dictionary size and range. LFTag 3x3 achieves 546 times the dictionary size of AprilTag 25h9 and LFTag 4x4 achieves 126 thousand times the dictionary size of AprilTag 41h12 while simultaneously achieving longer detection range. LFTag 3x3 also achieves more than twice the detection range of TopoTag 4x4 at the same dictionary size.
Abstract（参考訳）: 視覚画像システムは多くのロボティクスの重要なコンポーネントであり、6-DOF単眼の相対的なポーズ推定とターゲット同定のためのAR/VRアプリケーションである。本稿では,空間周波数制約内のデータ密度を最適化するトポロジカル検出と相対位置データ符号化に基づく視覚情報処理システム LFTag を提案する。このマーカーは、ロバストな幾何学的およびトポロジカルな偽陽性の拒絶と組み合わせて、すべてのマーカービットをデータとして使用できる回転曖昧性を解決するために構築されている。従来の四角形マーカー( AprilTag)とトポロジカルマーカー( TopoTag)をシミュレーションで比較した場合,提案するフィデューシャルシステム( LFTag)は辞書のサイズと範囲に大きな進歩をもたらす。 LFTag 3x3 は AprilTag 25h9 の辞書サイズ 546 倍、LFTag 4x4 は AprilTag 41h12 の辞書サイズ 126 倍、同時に長い検出範囲を達成している。 LFTag 3x3は、同じ辞書サイズでTopoTag 4x4の検出範囲を2倍以上にする。

関連論文リスト

Reasoning with Pixel-level Precision: QVLM Architecture and SQuID Dataset for Quantitative Geospatial Analytics [0.2291770711277359]
現在のビジョンランゲージモデル(VLM)は、そのアーキテクチャが計測と測定に必要なピクセルレベルの情報を破壊するため、定量的空間的推論では失敗する。まず,2000の衛星画像に対する問合せ対のベンチマークであるSQuIDを紹介する。第2に,言語理解を視覚解析から切り離して画素精度を維持するコード生成アーキテクチャQVLMを提案する。
論文参考訳（メタデータ） (2026-01-19T21:14:34Z)
LLM4Tag: Automatic Tagging System for Information Retrieval via Large Language Models [32.00181672539555]
大規模言語モデル(LLM)は、多岐にわたる世界知識、意味理解、推論能力のためにタグ付けシステムに適用されている。パフォーマンスは優れていますが、既存のメソッドには制限があります。グラフベースのタグリコールモジュールは、小規模で関連性の高いタグセットを効果的かつ包括的に構築するように設計されている。長期的および短期的な知識注入を伴う正確なタグを生成するために、知識強化タグ生成モジュールが使用される。タグ信頼度スコアを生成するためにタグ信頼度判定モジュールを導入する。
論文参考訳（メタデータ） (2025-02-19T07:10:23Z)
Online Pseudo-Label Unified Object Detection for Multiple Datasets Training [0.0]
オンライン擬似ラベル統一オブジェクト検出方式を提案する。本手法では,周期的に更新された教師モデルを用いて,各サブデータセット内の未ラベルオブジェクトの擬似ラベルを生成する。また,地域提案ネットワーク(PRN)のリコール率を改善するために,カテゴリ別ボックス回帰と擬似ラベルRPNヘッドを提案する。
論文参考訳（メタデータ） (2024-10-21T01:23:42Z)
OVA-DETR: Open Vocabulary Aerial Object Detection Using Image-Text Alignment and Fusion [16.784704103995672]
航空画像のための高速開語彙検出器OVA-DETRを提案する。画像テキストアライメントの考え方に基づいて、カテゴリ回帰損失を置き換えるために、領域テキストコントラスト損失を提案する。 Bi-VLFにはデュアルアテンションフュージョンエンコーダとマルチレベルテキスト誘導フュージョンデコーダが含まれる。
論文参考訳（メタデータ） (2024-08-22T09:33:25Z)
3D-AVS: LiDAR-based 3D Auto-Vocabulary Segmentation [20.7179907935644]
3D-AVSは3Dポイントクラウドのオートボキャブラリの手法で、ボキャブラリが未知であり、実行時に各入力に対して自動生成される。 3D-AVSはまずイメージまたはポイントクラウドデータからセマンティックエンティティを認識し、次に自動的に生成された語彙ですべてのポイントをセグメンテーションする。本手法は、画像ベースと点ベースの両方の認識を取り入れ、難解な照明条件下で頑健さを向上する。
論文参考訳（メタデータ） (2024-06-13T13:59:47Z)
Semi-supervised segmentation of land cover images using nonlinear canonical correlation analysis with multiple features and t-SNE [1.7000283696243563]
イメージセグメンテーションはクラスタリングタスクであり、各ピクセルにクラスタラベルが割り当てられる。本研究では,少数のピクセルのみをラベル付けすることで,半教師付きセグメンテーション手法を提案する。提案した半教師付きRBF-CCAアルゴリズムは、リモートセンシングされた複数のマルチスペクトル画像に実装されている。
論文参考訳（メタデータ） (2024-01-22T17:56:07Z)
SED: A Simple Encoder-Decoder for Open-Vocabulary Semantic Segmentation [91.91385816767057]
オープンボキャブラリセマンティックセグメンテーションは、ピクセルをオープンなカテゴリの集合から異なるセマンティックグループに区別する試みである。オープン語彙セマンティックセグメンテーションのための単純なエンコーダデコーダSEDを提案する。 SED法では、ADE20KではmIoUスコアが31.6%、A6000では画像あたり82ミリ秒(ms$)のカテゴリが150である。
論文参考訳（メタデータ） (2023-11-27T05:00:38Z)
Triple-View Knowledge Distillation for Semi-Supervised Semantic Segmentation [54.23510028456082]
半教師付きセマンティックセグメンテーションのためのトリプルビュー知識蒸留フレームワークTriKDを提案する。このフレームワークは、トリプルビューエンコーダとデュアル周波数デコーダを含む。
論文参考訳（メタデータ） (2023-09-22T01:02:21Z)
V-DETR: DETR with Vertex Relative Position Encoding for 3D Object Detection [73.37781484123536]
DETRフレームワークを用いた点雲のための高性能な3次元物体検出器を提案する。限界に対処するため,新しい3次元相対位置(3DV-RPE)法を提案する。挑戦的なScanNetV2ベンチマークで例外的な結果を示す。
論文参考訳（メタデータ） (2023-08-08T17:14:14Z)
Fiducial Tag Localization on a 3D LiDAR Prior Map [0.6554326244334868]
既存のLiDARフィデューシャルタグローカライズ法は3次元LiDARマップには適用されない。我々は, 3次元LiDAR事前マップ上で, 画像タグを直接ローカライズする新しい手法を開発した。我々は,3次元LiDARマップ上のタグのローカライズに適用可能な手法として,定性的かつ定量的な実験を行った。
論文参考訳（メタデータ） (2022-09-02T14:07:25Z)
DeepTag: A General Framework for Fiducial Marker Design and Detection [1.2180122937388957]
フィデューシャルマーカーの設計と検出のための一般的なディープラーニングベースのフレームワークであるDeepTagを提案する。 DeepTagは、さまざまなマーカーファミリの検出をサポートし、カスタマイズされたローカルパターンで新しいマーカーファミリを設計できるようにする。実験によると、DeepTagはさまざまなマーカーファミリをうまくサポートしており、検出の堅牢性と精度の両方の観点から既存の手法よりも大幅に優れています。
論文参考訳（メタデータ） (2021-05-28T10:54:59Z)
3D Spatial Recognition without Spatially Labeled 3D [127.6254240158249]
Weakly-supervised framework for Point cloud Recognitionを紹介する。 We show that WyPR can detected and segment objects in point cloud data without access any space labels at training time。
論文参考訳（メタデータ） (2021-05-13T17:58:07Z)
Supervision by Registration and Triangulation for Landmark Detection [70.13440728689231]
本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
論文参考訳（メタデータ） (2021-01-25T02:48:21Z)
Learning Spatio-Appearance Memory Network for High-Performance Visual Tracking [79.80401607146987]
既存のオブジェクトトラッキングは通常、フレーム間の視覚的ターゲットにマッチするバウンディングボックスベースのテンプレートを学習する。本稿では,局所時間メモリネットワークを備え,正確な時空間対応を学習するセグメンテーションに基づくトラッキングアーキテクチャを提案する。
論文参考訳（メタデータ） (2020-09-21T08:12:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。