論文の概要: Read Pointer Meters in complex environments based on a Human-like
Alignment and Recognition Algorithm
- arxiv url: http://arxiv.org/abs/2302.14323v2
- Date: Sun, 30 Jul 2023 15:36:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-01 23:37:52.642951
- Title: Read Pointer Meters in complex environments based on a Human-like
Alignment and Recognition Algorithm
- Title(参考訳): 人間ライクアライメントと認識アルゴリズムに基づく複雑な環境における読み出しポインターメーター
- Authors: Yan Shu, Shaohui Liu, Honglei Xu, Feng Jiang
- Abstract要約: これらの問題を克服するための人間ライクなアライメントと認識アルゴリズムを提案する。
STM(Spatial Transformed Module)は,画像のフロントビューを自己自律的に取得するために提案される。
VAM(Value Acquisition Module)は、エンドツーエンドのトレーニングフレームワークによって正確なメーター値を推測するために提案される。
- 参考スコア(独自算出の注目度): 16.823681016882315
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, developing an automatic reading system for analog measuring
instruments has gained increased attention, as it enables the collection of
numerous state of equipment. Nonetheless, two major obstacles still obstruct
its deployment to real-world applications. The first issue is that they rarely
take the entire pipeline's speed into account. The second is that they are
incapable of dealing with some low-quality images (i.e., meter breakage, blur,
and uneven scale). In this paper, we propose a human-like alignment and
recognition algorithm to overcome these problems. More specifically, a Spatial
Transformed Module(STM) is proposed to obtain the front view of images in a
self-autonomous way based on an improved Spatial Transformer Networks(STN).
Meanwhile, a Value Acquisition Module(VAM) is proposed to infer accurate meter
values by an end-to-end trained framework. In contrast to previous research,
our model aligns and recognizes meters totally implemented by learnable
processing, which mimics human's behaviours and thus achieves higher
performances. Extensive results verify the good robustness of the proposed
model in terms of the accuracy and efficiency.
- Abstract(参考訳): 近年,多数の機器の収集が可能なアナログ計測機器の自動読解システムの開発が注目されている。
それでも、現実世界のアプリケーションへのデプロイを妨げる2つの大きな障害がある。
最初の問題は、パイプライン全体の速度を考慮することはめったにないことです。
2つ目は、低画質の画像(メーターの破損、ぼかし、不均一なスケールなど)を扱うことができないことだ。
本稿では,これらの問題を克服するための人間型アライメントと認識アルゴリズムを提案する。
より具体的には、改良された空間トランスフォーマーネットワーク(stn)に基づいて自己自律的に画像のフロントビューを得るための空間変換モジュール(stm)を提案する。
一方、エンドツーエンドのトレーニングフレームワークによって正確なメーター値を推測するために、バリュー獲得モジュール(VAM)が提案されている。
従来の研究とは対照的に,本モデルでは,人間の動作を模倣した学習可能な処理によって完全に実装されたメーターを協調認識し,より高い性能を実現する。
実験結果から,提案モデルの有効性を精度と効率の観点から検証した。
関連論文リスト
- Automation of Quantum Dot Measurement Analysis via Explainable Machine Learning [0.0]
本研究では,合成三角形の数学的モデリングによる画像ベクトル化手法を提案する。
本手法は,精度を犠牲にすることなく,モデル予測の優れた説明性を提供することを示す。
この研究は、量子ドット計測の分析に説明可能な機械学習技術を適用する可能性と利点を実証する。
論文 参考訳(メタデータ) (2024-02-21T11:00:23Z) - Match and Locate: low-frequency monocular odometry based on deep feature
matching [0.65268245109828]
本稿では,1台のカメラしか必要としないロボットオドメトリーの新たなアプローチを提案する。
アプローチは、深い特徴マッチングモデルを用いて、ビデオストリームの連続フレーム間の画像特徴のマッチングに基づいている。
本研究では,AISG-SLAビジュアルローカライゼーションチャレンジにおける手法の性能評価を行い,計算効率が高く,実装が容易であるにもかかわらず,競合する結果が得られた。
論文 参考訳(メタデータ) (2023-11-16T17:32:58Z) - Cal-DETR: Calibrated Detection Transformer [67.75361289429013]
本稿では,Deformable-DETR,UP-DETR,DINOのキャリブレーション検出トランス(Cal-DETR)のメカニズムを提案する。
我々は、不確実性を利用してクラスロジットを変調する不確実性誘導ロジット変調機構を開発する。
その結果、Cal-DETRは、ドメイン内およびドメイン外の両方を校正する競合する列車時間法に対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-11-06T22:13:10Z) - Exploring Resolution and Degradation Clues as Self-supervised Signal for
Low Quality Object Detection [77.3530907443279]
劣化した低解像度画像中の物体を検出するための,新しい自己教師型フレームワークを提案する。
本手法は, 既存手法と比較して, 異変劣化状況に直面する場合に比べ, 優れた性能を示した。
論文 参考訳(メタデータ) (2022-08-05T09:36:13Z) - DeepRM: Deep Recurrent Matching for 6D Pose Refinement [77.34726150561087]
DeepRMは、6Dポーズ改善のための新しいリカレントネットワークアーキテクチャである。
アーキテクチャにはLSTMユニットが組み込まれ、各改善ステップを通じて情報を伝達する。
DeepRMは、2つの広く受け入れられている課題データセットで最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-05-28T16:18:08Z) - ProFormer: Learning Data-efficient Representations of Body Movement with
Prototype-based Feature Augmentation and Visual Transformers [31.908276711898548]
身体からのデータ効率の高い認識法は、画像のような配列として構造化された骨格配列をますます活用している。
我々は、このパラダイムをトランスフォーマーネットワークの観点から見て、初めて、骨格運動のデータ効率の高いエンコーダとして視覚トランスフォーマーを探索する。
私たちのパイプラインでは、画像のような表現としてキャストされたボディポーズシーケンスをパッチ埋め込みに変換し、深いメトリック学習に最適化されたビジュアルトランスフォーマーバックボーンに渡します。
論文 参考訳(メタデータ) (2022-02-23T11:11:54Z) - Trust Your IMU: Consequences of Ignoring the IMU Drift [2.253916533377465]
本研究では,未知の焦点長と半径歪みプロファイルを持つ相対ポーズ問題を共同で解くための最初の解法を開発した。
部分校正されたセットアップでは,精度が小さく,あるいは無視できるような,最先端のアルゴリズムに比べて大幅なスピードアップを示す。
市販の異なる低コストのUAV上で提案されたソルバーを評価し、IMUドリフトに関する新しい仮定が実用アプリケーションで実現可能であることを実証する。
論文 参考訳(メタデータ) (2021-03-15T11:24:54Z) - Automatic Extrinsic Calibration Method for LiDAR and Camera Sensor
Setups [68.8204255655161]
本論文では,LiDAR,単眼,ステレオカメラを含む任意のセンサのパラメータを校正する手法を提案する。
提案手法は、通常、車両のセットアップで見られるように、非常に異なる解像度とポーズのデバイスを扱うことができる。
論文 参考訳(メタデータ) (2021-01-12T12:02:26Z) - Towards Image-based Automatic Meter Reading in Unconstrained Scenarios:
A Robust and Efficient Approach [60.63996472100845]
本稿では,制約のないシナリオに着目したAMR(Automatic Meter Reading)のエンドツーエンドアプローチを提案する。
我々の主な貢献は、コーナー検出とカウンタ分類と呼ばれる新しいステージをAMRパイプラインに挿入することである。
信頼度が低い読みを拒絶した場合,AMRシステムは印象的な認識率(すなわち99%)を達成することを示す。
論文 参考訳(メタデータ) (2020-09-21T21:21:23Z) - SADet: Learning An Efficient and Accurate Pedestrian Detector [68.66857832440897]
本稿では,一段検出器の検出パイプラインに対する一連の最適化手法を提案する。
効率的な歩行者検出のための単発アンカーベース検出器(SADet)を形成する。
構造的には単純だが、VGA解像度の画像に対して最先端の結果と20ドルFPSのリアルタイム速度を示す。
論文 参考訳(メタデータ) (2020-07-26T12:32:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。