論文の概要: DeepFormableTag: End-to-end Generation and Recognition of Deformable
Fiducial Markers
- arxiv url: http://arxiv.org/abs/2206.08026v1
- Date: Thu, 16 Jun 2022 09:29:26 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-17 16:31:21.529238
- Title: DeepFormableTag: End-to-end Generation and Recognition of Deformable
Fiducial Markers
- Title(参考訳): DeepFormableTag: 変形可能なフィジュアルマーカーのエンドツーエンド生成と認識
- Authors: Mustafa B. Yaldiz, Andreas Meuleman, Hyeonjoong Jang, Hyunho Ha, Min
H. Kim
- Abstract要約: 既存の検出方法は、マーカーが理想的に平面面に印刷されていると仮定する。
フィデューシャルマーカー生成器は、大規模な情報を符号化する自由形式のカラーパターンのセットを作成する。
微分可能画像シミュレータは、変形マーカーを用いたフォトリアリスティックシーン画像のトレーニングデータセットを作成する。
訓練されたマーカー検出器は興味のある領域を探し、同時に複数のマーカーパターンを認識する。
- 参考スコア(独自算出の注目度): 27.135078472097895
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fiducial markers have been broadly used to identify objects or embed messages
that can be detected by a camera. Primarily, existing detection methods assume
that markers are printed on ideally planar surfaces. Markers often fail to be
recognized due to various imaging artifacts of optical/perspective distortion
and motion blur. To overcome these limitations, we propose a novel deformable
fiducial marker system that consists of three main parts: First, a fiducial
marker generator creates a set of free-form color patterns to encode
significantly large-scale information in unique visual codes. Second, a
differentiable image simulator creates a training dataset of photorealistic
scene images with the deformed markers, being rendered during optimization in a
differentiable manner. The rendered images include realistic shading with
specular reflection, optical distortion, defocus and motion blur, color
alteration, imaging noise, and shape deformation of markers. Lastly, a trained
marker detector seeks the regions of interest and recognizes multiple marker
patterns simultaneously via inverse deformation transformation. The deformable
marker creator and detector networks are jointly optimized via the
differentiable photorealistic renderer in an end-to-end manner, allowing us to
robustly recognize a wide range of deformable markers with high accuracy. Our
deformable marker system is capable of decoding 36-bit messages successfully at
~29 fps with severe shape deformation. Results validate that our system
significantly outperforms the traditional and data-driven marker methods. Our
learning-based marker system opens up new interesting applications of fiducial
markers, including cost-effective motion capture of the human body, active 3D
scanning using our fiducial markers' array as structured light patterns, and
robust augmented reality rendering of virtual objects on dynamic surfaces.
- Abstract(参考訳): fiducial markerは、カメラが検出できるオブジェクトの識別やメッセージの埋め込みに広く使われている。
既存の検出方法は、マーカーが理想的に平面面に印刷されていると仮定する。
マーカーはしばしば、光学的/観察的歪みと動きのぼかしの様々な画像アーティファクトのために認識されない。
まず,図形マーカー生成器が自由形式のカラーパターンのセットを作成し,視覚的コードで大規模情報を符号化する手法を提案する。
第二に、微分可能な画像シミュレータは、デフォルメ付きフォトリアリスティックシーンイメージのトレーニングデータセットを作成し、最適化時に異なる方法でレンダリングする。
レンダリングされた画像には、スペックル反射による現実的なシェーディング、光学歪み、デフォーカスと動きのぼかし、色の変化、画像ノイズ、マーカーの形状変形が含まれる。
最後に、訓練されたマーカー検出器は、関心領域を求め、逆変形変換を介して複数のマーカーパターンを同時に認識する。
変形マーカー作成ネットワークと検出器ネットワークは、両端から端まで微分可能なフォトリアリスティックレンダラーを介して協調的に最適化されており、変形マーカーの広い範囲を高精度に認識することができる。
変形可能なマーカーシステムは、36ビットのメッセージを29fps程度の形状変形で復号することができる。
その結果,本システムは従来のマーカー法やデータ駆動マーカー法よりも優れていた。
学習に基づくマーカーシステムは、人体の費用対効果の高いモーションキャプチャ、我々のfiducial markersの配列を構造化光パターンとして使用したアクティブ3dスキャン、動的表面上の仮想物体の堅牢な拡張現実レンダリングなど、fiducial markersの新たな興味深い応用を開拓します。
関連論文リスト
- New Efficient Visual OILU Markers [0.5120567378386615]
我々は、新しい効率的な視覚マーカーを開発するために基本的なパターンを利用する。
提案したマーカーは、ユニークな識別子の豊富なパネルを生成することができる。
取得および幾何学的歪みに対するマーカーの堅牢性を検証する。
論文 参考訳(メタデータ) (2024-04-12T13:55:05Z) - OsmLocator: locating overlapping scatter marks with a non-training
generative perspective [48.50108853199417]
重複するマークの配置には、テクスチャの欠如、文脈の少ない情報、ハロー形状、小さなサイズなど、多くの困難がある。
ここでは、クラスタリングに基づく再視覚化の最適化問題として、非学習的生成の観点から定式化する。
特に,異なるマーカーと様々な重なり合いの重なり合いを持つ何百もの散乱画像を含む2023というデータセットを構築し,提案手法を既存の手法と比較した。
論文 参考訳(メタデータ) (2023-12-18T12:39:48Z) - Differentiable Registration of Images and LiDAR Point Clouds with
VoxelPoint-to-Pixel Matching [58.10418136917358]
カメラからの2D画像とLiDARからの3Dポイントクラウドの間のクロスモダリティ登録は、コンピュータビジョンとロボットトレーニングにおいて重要な課題である。
ニューラルネットワークで学習した点パターンと画素パターンのマッチングによる2次元3次元対応の推定
我々は、異なる潜在画素空間を介して3次元特徴を表現するために、構造化されたモダリティマッチングソルバを学習する。
論文 参考訳(メタデータ) (2023-12-07T05:46:10Z) - A Locality-based Neural Solver for Optical Motion Capture [37.28597049192196]
ノイズの多いマーカーデータから、マーカーと関節を異なるタイプのノードとして扱う異種グラフニューラルネットワークを提案する。
本手法は,隠蔽マーカー位置誤差の予測精度の観点から,最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2023-09-01T12:40:17Z) - Generalizable Person Re-Identification via Viewpoint Alignment and
Fusion [74.30861504619851]
本研究は,3次元高密度ポーズ推定モデルとテクスチャマッピングモジュールを用いて,歩行者画像を標準視像にマッピングすることを提案する。
テクスチャマッピングモジュールの不完全性のため、標準ビュー画像は、原画像から識別的な詳細手がかりを失う可能性がある。
提案手法は,各種評価設定における既存手法よりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2022-12-05T16:24:09Z) - NeuralMarker: A Framework for Learning General Marker Correspondence [25.822657926255573]
本稿では,映画ポスターなどの一般的なマーカーから,そのようなマーカーを捉えた画像への対応性を推定する問題に取り組む。
本稿では,様々な課題条件下で高密度マーカー対応を推定するニューラルネットワークをトレーニングする新しいフレームワークであるNeuralMarkerを提案する。
我々は、NeuralMarkerが従来の手法を大幅に上回り、拡張現実(AR)やビデオ編集など、新しい興味深いアプリケーションを可能にしていることを示す。
論文 参考訳(メタデータ) (2022-09-19T10:04:38Z) - Image Understands Point Cloud: Weakly Supervised 3D Semantic
Segmentation via Association Learning [59.64695628433855]
ラベルのない画像から補完的な情報を取り入れた3次元セグメンテーションのための新しいクロスモダリティ弱教師付き手法を提案する。
基本的に、ラベルの小さな部分のパワーを最大化するために、アクティブなラベリング戦略を備えたデュアルブランチネットワークを設計する。
提案手法は,1%未満のアクティブなアノテーションで,最先端の完全教師付き競合よりも優れていた。
論文 参考訳(メタデータ) (2022-09-16T07:59:04Z) - DeepTag: A General Framework for Fiducial Marker Design and Detection [1.2180122937388957]
フィデューシャルマーカーの設計と検出のための一般的なディープラーニングベースのフレームワークであるDeepTagを提案する。
DeepTagは、さまざまなマーカーファミリの検出をサポートし、カスタマイズされたローカルパターンで新しいマーカーファミリを設計できるようにする。
実験によると、DeepTagはさまざまなマーカーファミリをうまくサポートしており、検出の堅牢性と精度の両方の観点から既存の手法よりも大幅に優れています。
論文 参考訳(メタデータ) (2021-05-28T10:54:59Z) - MarkerPose: Robust Real-time Planar Target Tracking for Accurate Stereo
Pose Estimation [0.0]
MarkerPoseは3つの円の平面的目標とステレオ視覚システムに基づくリアルタイムポーズ推定システムである。
本手法は,マーカー点検出のための2つの深層ニューラルネットワークからなる。
3Dフリーハンド超音波システムにおけるMarkerPoseの適合性を示す。
論文 参考訳(メタデータ) (2021-05-02T01:09:13Z) - Supervision by Registration and Triangulation for Landmark Detection [70.13440728689231]
本稿では,マルチビュー映像を用いた教師なし手法である登録・三角測量(srt)による監視を行い,ランドマーク検出器の精度と精度を向上させる。
ラベルのないデータを活用することで、検出者は大量のラベルのないデータから自由に学べる。
論文 参考訳(メタデータ) (2021-01-25T02:48:21Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。