論文の概要: Learning to Read Analog Gauges from Synthetic Data
- arxiv url: http://arxiv.org/abs/2308.14583v1
- Date: Mon, 28 Aug 2023 13:49:08 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-29 13:44:57.819752
- Title: Learning to Read Analog Gauges from Synthetic Data
- Title(参考訳): 合成データからアナログゲージを読むための学習
- Authors: Juan Leon-Alcazar, Yazeed Alnumay, Cheng Zheng, Hassane Trigui,
Sahejad Patel and Bernard Ghanem
- Abstract要約: アナログゲージの読み出しを自動化するコンピュータビジョンパイプラインを提案する。
これにより、現実的なアナログゲージの集合を得る合成データセットを生成する。
提案手法では, 平均誤差が4.55で, 相対改善率が52%であった。
- 参考スコア(独自算出の注目度): 44.839713720188385
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Manually reading and logging gauge data is time inefficient, and the effort
increases according to the number of gauges available. We present a computer
vision pipeline that automates the reading of analog gauges. We propose a
two-stage CNN pipeline that identifies the key structural components of an
analog gauge and outputs an angular reading. To facilitate the training of our
approach, a synthetic dataset is generated thus obtaining a set of realistic
analog gauges with their corresponding annotation. To validate our proposal, an
additional real-world dataset was collected with 4.813 manually curated images.
When compared against state-of-the-art methodologies, our method shows a
significant improvement of 4.55 in the average error, which is a 52% relative
improvement. The resources for this project will be made available at:
https://github.com/fuankarion/automatic-gauge-reading.
- Abstract(参考訳): 手動でゲージデータの読み取りとロギングは時間的非効率であり、利用可能なゲージの数に応じて労力が増加する。
アナログゲージの読みを自動化したコンピュータビジョンパイプラインを提案する。
本研究では,アナログゲージの重要な構造成分を識別し,角読みを行う2段階cnnパイプラインを提案する。
提案手法の訓練を容易にするため, 合成データセットを生成し, 対応するアノテーションを用いて, リアルなアナログゲージの集合を得る。
提案を検証するために,手作業による4.813画像の収集を行った。
最新の手法と比較すると,平均誤差の4.55パーセントが有意に向上し,相対的に52%改善した。
このプロジェクトのリソースは、https://github.com/fuankarion/automatic-gauge-readingで入手できる。
関連論文リスト
- Under pressure: learning-based analog gauge reading in the wild [22.612483878888884]
本稿では,実世界のロボットシステムに展開可能なアナログゲージを読むための解釈可能なフレームワークを提案する。
私たちのフレームワークは、読み取りタスクを各ステップで潜在的な障害を検出するなど、別々のステップに分割します。
我々のシステムは、ゲージの種類やスケールの範囲について事前の知識を必要とせず、使用する単位を抽出することができる。
論文 参考訳(メタデータ) (2024-04-12T19:13:42Z) - Parametric Augmentation for Time Series Contrastive Learning [33.47157775532995]
我々は、堅牢で差別的な表現を学習する上でモデルを支援するポジティブな例を作成します。
通常、プリセットされた人間の直観は、関連するデータ拡張の選択を指示する。
本稿では、時系列表現学習を支援するために適応的に使用できるパラメトリック拡張型学習フレームワークAutoTCLを提案する。
論文 参考訳(メタデータ) (2024-02-16T03:51:14Z) - Readout Guidance: Learning Control from Diffusion Features [96.22155562120231]
本稿では,学習信号を用いたテキスト・画像拡散モデル制御手法であるReadout Guidanceを提案する。
Readout Guidanceはリードアウトヘッドを使用し、トレーニング済みの凍結拡散モデルの特徴から信号を取り出すために訓練された軽量ネットワークである。
これらの読み出しは、ポーズ、深さ、エッジなどのシングルイメージ特性や、対応性や外観類似性といった複数の画像に関連する高次特性を符号化することができる。
論文 参考訳(メタデータ) (2023-12-04T18:59:32Z) - Read Pointer Meters in complex environments based on a Human-like
Alignment and Recognition Algorithm [16.823681016882315]
これらの問題を克服するための人間ライクなアライメントと認識アルゴリズムを提案する。
STM(Spatial Transformed Module)は,画像のフロントビューを自己自律的に取得するために提案される。
VAM(Value Acquisition Module)は、エンドツーエンドのトレーニングフレームワークによって正確なメーター値を推測するために提案される。
論文 参考訳(メタデータ) (2023-02-28T05:37:04Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - It's About Time: Analog Clock Reading in the Wild [93.84801062680786]
自然画像やビデオでアナログクロックを読むためのフレームワークを提案する。
我々は、合成クロックを生成するためのスケーラブルなパイプラインを作成し、労働集約アノテーションの要求を大幅に削減する。
提案した合成データセットに基づいてトレーニングしたモデルは、精度良く実時計に向けて一般化されていることを示す。
論文 参考訳(メタデータ) (2021-11-17T14:52:02Z) - Correlation-wise Smoothing: Lightweight Knowledge Extraction for HPC
Monitoring Data [1.802439717192088]
本稿では,時系列モニタリングデータから記述的シグネチャを抽出する手法として相関ワイド・スムーシング(CS)を提案する。
提案手法は,データ次元間の相関を利用してグループを形成し,容易に操作し,視覚化し,比較できる画像様のシグネチャを生成する。
我々は,本研究でリリースしたデータセットの集合であるHPC-ODA上でのCS法の評価を行い,ほとんどの最先端手法と同等の性能を示す。
論文 参考訳(メタデータ) (2020-10-13T05:22:47Z) - Simple and Effective VAE Training with Calibrated Decoders [123.08908889310258]
変分オートエンコーダ(VAE)は、複雑な分布をモデル化するための効果的で簡単な方法である。
復号分布の不確かさを学習する校正復号器の影響について検討する。
本稿では,一般的なガウス復号器の簡易かつ斬新な修正を提案し,その予測分散を解析的に計算する。
論文 参考訳(メタデータ) (2020-06-23T17:57:47Z) - How Useful is Self-Supervised Pretraining for Visual Tasks? [133.1984299177874]
我々は、総合的な合成データセットと下流タスクにまたがる様々な自己教師付きアルゴリズムを評価する。
我々の実験は、利用可能なラベルの数が増えるにつれて、セルフスーパービジョンの有用性がどう変化するかについての洞察を提供する。
論文 参考訳(メタデータ) (2020-03-31T16:03:22Z) - A Comparative Study on Machine Learning Algorithms for the Control of a
Wall Following Robot [4.115297590661754]
本稿では,ロボットに追従する壁の向きを予測するための各種機械学習モデルの性能の比較を行った。
モデルは、24個の超音波センサーとサンプルの対応する方向を含むオープンソースのデータセットを使用して訓練された。
論文 参考訳(メタデータ) (2019-12-26T13:05:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。