論文の概要: Removing the need for ground truth UWB data collection: self-supervised ranging error correction using deep reinforcement learning
- arxiv url: http://arxiv.org/abs/2403.19262v2
- Date: Tue, 01 Oct 2024 08:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-02 16:31:38.881894
- Title: Removing the need for ground truth UWB data collection: self-supervised ranging error correction using deep reinforcement learning
- Title(参考訳): 地中真理UWBデータ収集の必要性の除去:深部強化学習を用いた自己教師付きレンジ誤差補正
- Authors: Dieter Coppens, Ben Van Herbruggen, Adnan Shahid, Eli De Poorter,
- Abstract要約: マルチパス効果と非視界条件は、アンカーとタグの間の範囲エラーを引き起こす。
これらの範囲の誤差を緩和するための既存のアプローチは、大きなラベル付きデータセットの収集に依存している。
本稿では,ラベル付き真実データを必要としない自己教師付き深層強化学習手法を提案する。
- 参考スコア(独自算出の注目度): 1.4061979259370274
- License:
- Abstract: Indoor positioning using UWB technology has gained interest due to its centimeter-level accuracy potential. However, multipath effects and non-line-of-sight conditions cause ranging errors between anchors and tags. Existing approaches for mitigating these ranging errors rely on collecting large labeled datasets, making them impractical for real-world deployments. This paper proposes a novel self-supervised deep reinforcement learning approach that does not require labeled ground truth data. A reinforcement learning agent uses the channel impulse response as a state and predicts corrections to minimize the error between corrected and estimated ranges. The agent learns, self-supervised, by iteratively improving corrections that are generated by combining the predictability of trajectories with filtering and smoothening. Experiments on real-world UWB measurements demonstrate comparable performance to state-of-the-art supervised methods, overcoming data dependency and lack of generalizability limitations. This makes self-supervised deep reinforcement learning a promising solution for practical and scalable UWB-ranging error correction.
- Abstract(参考訳): UWB技術を用いた屋内位置決めは, 精度が1cm程度であることから注目されている。
しかし、マルチパス効果と非視界条件は、アンカーとタグの間の範囲エラーを引き起こす。
これらの範囲のエラーを軽減するための既存のアプローチは、大規模なラベル付きデータセットの収集に依存しており、現実のデプロイメントでは実用的ではない。
本稿では,ラベル付き真実データを必要としない自己教師付き深層強化学習手法を提案する。
強化学習エージェントは、チャネルインパルス応答を状態として、補正を予測し、補正された範囲と推定された範囲の誤差を最小化する。
本発明のエージェントは、軌跡の予測可能性とフィルタリングと平滑化とを組み合わせて発生する補正を反復的に改善することにより、自制的に学習する。
実世界のUWB測定実験は、最先端の教師付き手法と同等の性能を示し、データの依存性を克服し、一般化可能性の制限を欠いている。
これにより、自己教師付き深層強化学習は、実用的でスケーラブルなUWB配列誤り訂正のための有望なソリューションとなる。
関連論文リスト
- Training Language Models to Self-Correct via Reinforcement Learning [98.35197671595343]
自己補正は、現代の大規模言語モデル(LLM)では、ほとんど効果がないことが判明した。
完全自己生成データを用いたLLMの自己補正能力を大幅に向上させるマルチターンオンライン強化学習手法であるSCoReを開発した。
SCoReは最先端の自己補正性能を実現し,MATHとHumanEvalでそれぞれ15.6%,9.1%向上した。
論文 参考訳(メタデータ) (2024-09-19T17:16:21Z) - Towards Robust and Interpretable EMG-based Hand Gesture Recognition using Deep Metric Meta Learning [37.21211404608413]
本稿では,意味的かつ解釈可能な表現の作成を監督するために,EMG PRにおける深層メートル法メタラーニングへのシフトを提案する。
我々は、不正確な決定をよりよく拒否する頑健なクラス近接性に基づく信頼度推定器を導出する。
論文 参考訳(メタデータ) (2024-04-17T23:37:50Z) - Deep GEM-Based Network for Weakly Supervised UWB Ranging Error
Mitigation [29.827191184889898]
本稿では,UWB範囲の誤差軽減のための弱監督に基づく学習フレームワークを提案する。
具体的には, 予測最大化(GEM)アルゴリズムを応用して, 精度の高いUWBレンジの誤差軽減を実現する深層学習手法を提案する。
論文 参考訳(メタデータ) (2023-05-23T10:26:50Z) - A Semi-Supervised Learning Approach for Ranging Error Mitigation Based
on UWB Waveform [29.827191184889898]
UWBレンジ誤差軽減のための変分ベイズに基づく半教師付き学習手法を提案する。
本手法はラベル付きデータとラベルなしデータの両方からの知識を効率的に蓄積することができる。
論文 参考訳(メタデータ) (2023-05-23T10:08:42Z) - Efficient Deep Reinforcement Learning Requires Regulating Overfitting [91.88004732618381]
本稿では,高時間差(TD)誤差が深部RLアルゴリズムの性能に悪影響を及ぼす主要な原因であることを示す。
検証TDエラーをターゲットとした簡単なオンラインモデル選択法は,状態ベースDMCおよびGymタスク間で有効であることを示す。
論文 参考訳(メタデータ) (2023-04-20T17:11:05Z) - OPAL: Occlusion Pattern Aware Loss for Unsupervised Light Field
Disparity Estimation [22.389903710616508]
教師なしの手法は精度は同等だが、教師付き手法よりもはるかに高い一般化能力と効率が得られる。
本稿では、損失計算のために光場固有の一般的な閉塞パターンを抽出し、符号化するOPALを提案する。
論文 参考訳(メタデータ) (2022-03-04T10:32:18Z) - Automating Control of Overestimation Bias for Continuous Reinforcement
Learning [65.63607016094305]
バイアス補正を導くためのデータ駆動型手法を提案する。
我々は、最先端の連続制御アルゴリズムであるTrncated Quantile Criticsにおいて、その効果を実証する。
論文 参考訳(メタデータ) (2021-10-26T09:27:12Z) - Robust Ultra-wideband Range Error Mitigation with Deep Learning at the
Edge [0.0]
室内無線環境のマルチパス効果、反射、屈折、複雑さは、測定範囲に正のバイアスをもたらす可能性がある。
本稿では,ディープラーニングとグラフ最適化技術の最新技術を活用した効率的な表現学習手法を提案する。
チャネルインパルス応答(CIR)信号を直接利用して高い意味的特徴を抽出し、NLoS条件またはLoS条件の補正を推定する。
論文 参考訳(メタデータ) (2020-11-30T10:52:21Z) - Unsupervised Domain Adaptation for Speech Recognition via Uncertainty
Driven Self-Training [55.824641135682725]
WSJ をソースドメインとし,TED-Lium 3 とSWITCHBOARD を併用したドメイン適応実験を行った。
論文 参考訳(メタデータ) (2020-11-26T18:51:26Z) - Provably Efficient Causal Reinforcement Learning with Confounded
Observational Data [135.64775986546505]
オフラインで収集されたデータセット(観測データ)を組み込んで、オンライン環境でのサンプル効率を改善する方法について検討する。
提案手法は,観測データを効率よく組み込んだ,分解された楽観的値反復 (DOVI) アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-22T14:49:33Z) - DisCor: Corrective Feedback in Reinforcement Learning via Distribution
Correction [96.90215318875859]
ブートストラップに基づくQ-ラーニングアルゴリズムは必ずしも修正フィードバックの恩恵を受けないことを示す。
本稿では,この最適分布に対する近似を計算し,トレーニングに使用する遷移の重み付けに使用する新しいアルゴリズムであるDisCorを提案する。
論文 参考訳(メタデータ) (2020-03-16T16:18:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。