論文の概要: DeepArUco++: Improved detection of square fiducial markers in challenging lighting conditions
- arxiv url: http://arxiv.org/abs/2411.05552v1
- Date: Fri, 08 Nov 2024 13:18:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-11 14:54:28.477633
- Title: DeepArUco++: Improved detection of square fiducial markers in challenging lighting conditions
- Title(参考訳): DeepArUco++: 挑戦的な照明条件下での正方形形状マーカーの検出の改善
- Authors: Rafael Berral-Soler, Rafael Muñoz-Salinas, Rafael Medina-Carnicer, Manuel J. Marín-Jiménez,
- Abstract要約: フィデューシャルマーカー(Fiducial marker)は、オブジェクトのポーズ推定と検出に使用されるコンピュータビジョンツールである。
DeepArUco++は、困難な照明条件下でマーカー検出とデコードを実行するフレームワークである。
システム評価に使用する照明条件に挑戦するために,第2のArUcoマーカーのリアルタイムデータセットを提示する。
- 参考スコア(独自算出の注目度): 3.783609886054562
- License:
- Abstract: Fiducial markers are a computer vision tool used for object pose estimation and detection. These markers are highly useful in fields such as industry, medicine and logistics. However, optimal lighting conditions are not always available,and other factors such as blur or sensor noise can affect image quality. Classical computer vision techniques that precisely locate and decode fiducial markers often fail under difficult illumination conditions (e.g. extreme variations of lighting within the same frame). Hence, we propose DeepArUco++, a deep learning-based framework that leverages the robustness of Convolutional Neural Networks to perform marker detection and decoding in challenging lighting conditions. The framework is based on a pipeline using different Neural Network models at each step, namely marker detection, corner refinement and marker decoding. Additionally, we propose a simple method for generating synthetic data for training the different models that compose the proposed pipeline, and we present a second, real-life dataset of ArUco markers in challenging lighting conditions used to evaluate our system. The developed method outperforms other state-of-the-art methods in such tasks and remains competitive even when testing on the datasets used to develop those methods. Code available in GitHub: https://github.com/AVAuco/deeparuco/
- Abstract(参考訳): フィデューシャルマーカー(Fiducial marker)は、オブジェクトのポーズ推定と検出に使用されるコンピュータビジョンツールである。
これらのマーカーは、産業、医療、物流などの分野で非常に有用である。
しかし、最適照明条件は必ずしも利用できないため、ぼやけやセンサノイズなどの他の要因は画質に影響を及ぼす可能性がある。
フィデューシャルマーカーを正確に検出しデコードする古典的なコンピュータビジョン技術は、しばしば難しい照明条件(例えば同じフレーム内での光の極端な変化)の下で失敗する。
そこで我々は,DeepArUco++を提案する。DeepArUco++は,畳み込みニューラルネットワークの堅牢性を利用して,難解な照明条件下でマーカー検出と復号を行う。
このフレームワークは、各ステップで異なるニューラルネットワークモデル、すなわちマーカー検出、コーナーリファインメント、マーカーデコーディングを使用するパイプラインに基づいている。
さらに,提案するパイプラインを構成する異なるモデルを学習するための合成データを生成するための簡易な手法を提案し,本システムの評価に使用する照明条件に挑戦するArUcoマーカーの2番目の実生データセットを提案する。
開発した手法は,これらのタスクにおける他の最先端手法よりも優れており,これらの手法の開発に使用したデータセット上でテストしても競争力は保たれている。
GitHubで利用可能なコード:https://github.com/AVAuco/deeparuco/
関連論文リスト
- Underwater Object Detection in the Era of Artificial Intelligence: Current, Challenge, and Future [119.88454942558485]
水中物体検出(UOD)は、水中の画像やビデオ中の物体を識別し、ローカライズすることを目的としている。
近年、人工知能(AI)に基づく手法、特に深層学習法は、UODにおいて有望な性能を示している。
論文 参考訳(メタデータ) (2024-10-08T00:25:33Z) - Dusk Till Dawn: Self-supervised Nighttime Stereo Depth Estimation using Visual Foundation Models [16.792458193160407]
自己教師付き深さ推定アルゴリズムはフレームウォーピング関係に大きく依存する。
夜間に焦点をあてた自己教師型ステレオ深度推定を行うアルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-05-18T03:07:23Z) - Low-light Pedestrian Detection in Visible and Infrared Image Feeds: Issues and Challenges [2.6565101124248502]
本研究は, 低照度歩行者検出手法の最近の展開を概観する。
地域ベースから非地域ベース、グラフベースの学習方法論まで、様々なアルゴリズムを体系的に分類し分析する。
高度な歩行者検出アルゴリズムの研究と開発に使用できる重要なベンチマークデータセットを概説する。
論文 参考訳(メタデータ) (2023-11-14T21:39:15Z) - A Discrepancy Aware Framework for Robust Anomaly Detection [51.710249807397695]
本稿では,DAF(Disdisrepancy Aware Framework)を提案する。
本手法は,デコーダの欠陥同定に外見に依存しないキューを利用して,その合成外観への依存を緩和する。
単純な合成戦略の下では,既存の手法を大きなマージンで上回り,また,最先端のローカライゼーション性能も達成している。
論文 参考訳(メタデータ) (2023-10-11T15:21:40Z) - Stereo Visual Odometry with Deep Learning-Based Point and Line Feature
Matching using an Attention Graph Neural Network [4.900326352413157]
点と線の特徴に基づくステレオビジュアルオドメトリー(StereoVO)技術を提案する。
提案手法は,最先端のラインマッチングアルゴリズムよりも多くのライン特徴マッチングを実現する。
論文 参考訳(メタデータ) (2023-08-02T13:09:12Z) - Learning to Simulate Realistic LiDARs [66.7519667383175]
リアルLiDARセンサのデータ駆動シミュレーションのためのパイプラインを提案する。
本モデルでは, 透明表面上の落下点などの現実的な効果を符号化できることが示される。
我々は2つの異なるLiDARセンサのモデルを学習し、それに従ってシミュレーションされたLiDARデータを改善する。
論文 参考訳(メタデータ) (2022-09-22T13:12:54Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Meta-UDA: Unsupervised Domain Adaptive Thermal Object Detection using
Meta-Learning [64.92447072894055]
赤外線(IR)カメラは、照明条件や照明条件が悪ければ頑丈である。
既存のUDA手法を改善するためのアルゴリズムメタ学習フレームワークを提案する。
KAISTおよびDSIACデータセットのための最先端熱検出器を作成した。
論文 参考訳(メタデータ) (2021-10-07T02:28:18Z) - E2ETag: An End-to-End Trainable Method for Generating and Detecting
Fiducial Markers [0.8602553195689513]
E2ETagは、フィデューシャルマーカーと補足検出器を設計するためのエンドツーエンドのトレーニング可能な方法である。
完全な畳み込み検出器ネットワークを使用して、現実世界の挑戦的な環境で検出および分類できるマーカーを生成することを学ぶ。
その結果、E2ETagは理想的な条件下で既存の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-05-29T03:13:14Z) - Deep Soft Procrustes for Markerless Volumetric Sensor Alignment [81.13055566952221]
本研究では、より堅牢なマルチセンサ空間アライメントを実現するために、マーカーレスデータ駆動対応推定を改善する。
我々は、幾何学的制約を終末的に典型的なセグメンテーションベースモデルに組み込み、対象のポーズ推定タスクと中間密な分類タスクをブリッジする。
実験により,マーカーベースの手法で同様の結果が得られ,マーカーレス手法よりも優れ,またキャリブレーション構造のポーズ変動にも頑健であることがわかった。
論文 参考訳(メタデータ) (2020-03-23T10:51:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。