論文の概要: Deep Reinforcement Learning (DRL): Another Perspective for Unsupervised
Wireless Localization
- arxiv url: http://arxiv.org/abs/2004.04618v1
- Date: Thu, 9 Apr 2020 16:03:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-15 02:28:11.216449
- Title: Deep Reinforcement Learning (DRL): Another Perspective for Unsupervised
Wireless Localization
- Title(参考訳): deep reinforcement learning (drl: unsupervised wireless localizationのもう1つの展望
- Authors: You Li, Xin Hu, Yuan Zhuang, Zhouzheng Gao, Peng Zhang, Naser
El-Sheimy
- Abstract要約: 本稿では,DRLに基づく非教師付き無線ローカライゼーション手法を提案する。
提案手法は,複数のBluetooth 5スマートイヤータグのフィールドテストデータを用いて,牧草地での試験を行った。
- 参考スコア(独自算出の注目度): 11.478650845641617
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Location is key to spatialize internet-of-things (IoT) data. However, it is
challenging to use low-cost IoT devices for robust unsupervised localization
(i.e., localization without training data that have known location labels).
Thus, this paper proposes a deep reinforcement learning (DRL) based
unsupervised wireless-localization method. The main contributions are as
follows. (1) This paper proposes an approach to model a continuous
wireless-localization process as a Markov decision process (MDP) and process it
within a DRL framework. (2) To alleviate the challenge of obtaining rewards
when using unlabeled data (e.g., daily-life crowdsourced data), this paper
presents a reward-setting mechanism, which extracts robust landmark data from
unlabeled wireless received signal strengths (RSS). (3) To ease requirements
for model re-training when using DRL for localization, this paper uses RSS
measurements together with agent location to construct DRL inputs. The proposed
method was tested by using field testing data from multiple Bluetooth 5 smart
ear tags in a pasture. Meanwhile, the experimental verification process
reflected the advantages and challenges for using DRL in wireless localization.
- Abstract(参考訳): ロケーションはIoT(Internet-of-things)データを空間化するための鍵である。
しかしながら、ロバストな教師なしローカライゼーション(つまり、既知のロケーションラベルを持つトレーニングデータなしでローカライゼーション)のために、低コストのIoTデバイスを使用することは困難である。
そこで本研究では,DRLに基づく非教師付き無線位置決め方式を提案する。
主な貢献は以下の通りである。
本研究では,連続的な無線局所化プロセスをマルコフ決定プロセス(MDP)としてモデル化し,DRLフレームワーク内で処理する方法を提案する。
2)未ラベルデータ(例えば,日々のクラウドソースデータ)を使用する場合の報酬獲得の課題を軽減するため,未ラベルの無線受信信号強度(RSS)からロバストなランドマークデータを抽出する報奨設定機構を提案する。
ローカライゼーションに DRL を使用する場合のモデル再訓練の要件を緩和するため,本論文では RSS 測定とエージェント位置を併用して DRL 入力を構築する。
提案手法は,複数のBluetooth 5スマートイヤータグのフィールドテストデータを用いて,牧草地での試験を行った。
一方、実験的な検証プロセスは、DRLを無線ローカライゼーションに使用する際の利点と課題を反映している。
関連論文リスト
- D5RL: Diverse Datasets for Data-Driven Deep Reinforcement Learning [99.33607114541861]
ロボット操作と移動環境の現実的なシミュレーションに焦点を当てたオフラインRLのための新しいベンチマークを提案する。
提案するベンチマークでは、状態ベースドメインと画像ベースドメインを対象とし、オフラインRLとオンライン微調整評価の両方をサポートしている。
論文 参考訳(メタデータ) (2024-08-15T22:27:00Z) - Reasoning with Latent Diffusion in Offline Reinforcement Learning [11.349356866928547]
オフラインの強化学習は、静的データセットからハイリワードポリシーを学ぶ手段として、約束を守る。
オフラインRLの主な課題は、静的データセットから最適な軌道の部分を効果的に縫合することにある。
本稿では,潜在拡散の表現性を利用して,非支持軌道列を圧縮された潜在スキルとしてモデル化する手法を提案する。
論文 参考訳(メタデータ) (2023-09-12T20:58:21Z) - Semi-Supervised Offline Reinforcement Learning with Action-Free
Trajectories [37.14064734165109]
自然エージェントは、サイズ、品質、種類の異なる複数のデータソースから学習することができる。
オフライン強化学習(RL)の文脈でこれを研究し、実際に動機付けされた半教師付き環境を導入する。
論文 参考訳(メタデータ) (2022-10-12T18:22:23Z) - Disentangled Representation Learning for RF Fingerprint Extraction under
Unknown Channel Statistics [77.13542705329328]
本稿では,まず,不整合表現学習(DRL)の枠組みを提案し,入力信号を逆学習によりデバイス関連成分とデバイス関連成分に分解する。
提案フレームワークにおける暗黙的なデータ拡張は、デバイス非関連チャネル統計の過度な適合を避けるために、RFF抽出器に正規化を課す。
実験により、DR-RFFと呼ばれる提案手法は、未知の複雑な伝播環境に対する一般化可能性の観点から従来の手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2022-08-04T15:46:48Z) - ColO-RAN: Developing Machine Learning-based xApps for Open RAN
Closed-loop Control on Programmable Experimental Platforms [22.260874168813647]
ColO-RANは、ソフトウェア定義のRadios-in-the-loopを備えた、初めて一般公開された大規模O-RANテストフレームワークである。
ColO-RANは、O-RANコンポーネント、プログラム可能なベースステーション、および"無線データファクトリ"を使用した大規模ML研究を可能にする
DRLをベースとした適応制御の利点と課題を明らかにする。
論文 参考訳(メタデータ) (2021-12-17T15:14:22Z) - Federated Deep Reinforcement Learning for the Distributed Control of
NextG Wireless Networks [16.12495409295754]
次世代(NextG)ネットワークは、拡張現実(AR)やコネクテッド・自律走行車といった、インターネットの触覚を必要とするアプリケーションをサポートすることが期待されている。
データ駆動アプローチは、現在の運用条件に適応するネットワークの能力を改善することができる。
深部RL(DRL)は複雑な環境においても良好な性能を発揮することが示されている。
論文 参考訳(メタデータ) (2021-12-07T03:13:20Z) - Attentive Prototypes for Source-free Unsupervised Domain Adaptive 3D
Object Detection [85.11649974840758]
3Dオブジェクト検出ネットワークは、トレーニングされたデータに対してバイアスを受ける傾向がある。
そこで本研究では,ライダーを用いた3次元物体検出器のソースレス・教師なし領域適応のための単一フレーム手法を提案する。
論文 参考訳(メタデータ) (2021-11-30T18:42:42Z) - Wireless for Machine Learning [91.13476340719087]
我々は、分散データセット上で機械学習サービスをサポートするように設計された最先端のワイヤレス手法について、徹底的にレビューする。
文献にはアナログ・オーバー・ザ・エア計算とMLに最適化されたデジタル無線リソース管理という2つの明確なテーマがある。
このサーベイは、これらのメソッドを包括的に紹介し、最も重要な研究をレビューし、オープンな問題を強調し、アプリケーションのシナリオについて議論する。
論文 参考訳(メタデータ) (2020-08-31T11:09:49Z) - A Compressive Sensing Approach for Federated Learning over Massive MIMO
Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。
本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T05:56:27Z) - Solving Missing-Annotation Object Detection with Background
Recalibration Loss [49.42997894751021]
本稿では,新しい,かつ困難な検出シナリオに焦点を当てる。 真のオブジェクト/インスタンスの大部分は,データセットにラベル付けされていない。
従来, ソフトサンプリングを用いて, 正の例と重なり合うRoIsの勾配を再重み付けする手法が提案されてきた。
本稿では、予め定義されたIoU閾値と入力画像に基づいて損失信号を自動的に校正できる、バックグラウンド校正損失(BRL)と呼ばれる優れた解を提案する。
論文 参考訳(メタデータ) (2020-02-12T23:11:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。